Σκανάρισμα βιβλίου και τελικό μέγεθος σε pdf

NKontis

Παλαιό Μέλος
Μου εκανε εντυπωση πως δυομιση χιλιαδες σελιδες καλυπτουν μολις 30mb χωρου. Οποιος εκανε τη σαρωση η γενικοτερα ξερει ολα τα σχετικα γυρω απο ψηφιοποιηση αρχειων και τον τροπο που σαρωνουμε και μετατρεπουμε σε pdf ας γραψει καπου τον τροπο.

Επείδή το ζήτησες, αγαπητέ συντοπίτη, και επειδή κατά καιρούς το έχουν ζητήσει και άλλοι αυτό που ρωτάς, μπορώ να γράψω μερικά πράγματα που αφορούν το τελικό μέγεθος του σκαναρισμένου βιβλίου.

1. Επειδή τα περισσότερα βιβλία της μουσικής μας (το 99%) είναι μαυρόασπρα (εκτός ίσως του εξωφύλλου μερικές φορές) δεν χρειάζεται να τα σκανάρουμε ως έγχρωμα. Ούτε καν ως αποχρώσεις του γκρι. Συνεπώς επιλέγουμε ως πηγή «Κείμενο» (Text) όχι φωτογραφία ή οτιδήποτε άλλο έχει ως επιλογή. Μετά επιλέγουμε να γίνει το σκανάρισμα σε Μαύρο-Άσπρο (B/W) και σε βάθος 1bit (=1 bit per pixel). Δεν χρειάζεται τίποτα περισσότερο. Ανάλυση σκαναρίσματος μπορούμε να βάλουμε καλή ώστε να μεγαλώνει το αρχείο (εννοώ μεγέθυνση όχι μέγεθος) χωρίς προβλήματα, π.χ. τα 300 dpi είναι υπεραρκετά.
Αν υπάρχει φωτογραφία (π.χ. του συνθέτη στη δεύτερη σελίδα) τότε μόνο αυτή σκανάρουμε σε απόχρωση του γκρι με το μικρότερο βάθος που μας δίνει το πρόγραμμα σκαναρίσματος (π.χ. 8 bit Gray) για να μην μας βγει μαύρη με το B/W.
Με αυτές τις ρυθμίσεις, κάθε μαυρόασπρη σελίδα Β5 έχει μέγεθος περίπου 20-30 ΚΒ (ίσως και μικρότερο).

2. Μερικά προγράμματα σάρωσης παράγουν διαφορετικές σε μέγεθος σελίδες ακόμα και όταν αλλάζουμε την μορφή της εικόνας. Έτσι παρατηρούμε πως οι εικόνες gif έχουν μικρότερο μέγεθος από τις tiff ή τις jpeg. Όμως μερικές φορές οι gif δεν έχουν καλή ανάλυση. Εξαρτάται από το πρόγραμμα σάρωσης. Εγώ σκανάρω σε tiff γιατί το πρόγραμμα που χρησιμοποιώ (VueScan) τίς βγάζει μικρότερες από τις jpeg με τις ίδιες ρυθμίσεις.

3. Προτιμάμε ένα καλύτερο πρόγραμμα από τα απλά που δίνονται στα Windows ή στον Mac. Τα εξειδικευμένα προγράμματα εκτός από τις περισσότερες επιλογές που μας προσφέρουν, βγάζουν και καλύτερο αποτέλεσμα, δηλ. καλύτερες και μικρότερες εικόνες.

4. Όταν τις εικόνες τις καθαρίσουμε στο Photoshop μετά το σκανάρισμα (αυτό κάνω εγώ, υπάρχουν αυτοματοποιημένοι τρόποι για μην χάνουμε πολύ χρόνο) και τις κάνουμε pdf με το AdobeAcrobat Pro επιλέγουμε την μεσαία ποιότητα αρχείου (έχει τρία εικονίδια σελίδων σε διαφορετικό μέγεθος). Το μέγεθος του αρχείου είναι ήδη αρκετά μικρό εάν έχουν τηρηθεί τα παραπάνω. Εάν όμως θέλουμε να το μειώσουμε και άλλο, τότε μπορεί το Acrobat να κάνει μείωση στην ανάλυση των εικόνων, αλλά δεν το συνιστώ γιατί η ποιότητα μειώνεται αισθητά. Καλό θα είναι σε τέτοια περίπτωση να έχουμε εμείς σκανάρει σε χαμηλότερη ποιότητα τις εικόνες (π.χ. στα 150 dpi, όχι μικρότερη) από την αρχή και να μην αφήσουμε το Acrobat να το κάνει.

5. Εννοείται πως δεν βάζουμε κάνενα είδος φίλτρου (εάν το πρόγραμμα έχει τέτοιες επιλογές) και η περιοχή σκαναρίσματος είναι ίσα-ίσα στα περιθώρια τις σελίδας. Όσο μεγαλύτερη είναι η περιοχή σκαναρίσματος, τόσο μεγαλύτερο σε μέγεθος θα μας βγει η εικόνα που σκανάρουμε. Γι αυτό είναι καλύτερο -πέρα από την οπτική πλευρά και την χρηστικότητα- να σκανάρουμε μονές τις σελίδες και όχι διπλές. Οι διπλές καταλαμβάνουν μεγαλύτερο μέγεθος!

6. Μπορούμε να αφήσουμε στο αυτόματο την συμπίεση της εικόνας (TIFF/JPEG Compression). Eάν δεν έχει αυτόματο, τότε επιλέγουμε να κάνει συμπίεση από αυτές που μας προσφέρει ως επιλογές.

Γενικώς ένα βιβλίο με 300 περίπου σελίδες Β5 με αυτές τις ρυθμίσεις έχει μέγεθος περί τα 10-20 ΜΒ. Τα πάντα είναι μία προσπάθεια ισορροπίας μεταξύ μεγέθους και ποιότητας των σκαναρισμένων σελίδων. Θυσιάζουμε όση ποιότητα μπορούμε ώστε να είναι αξιοπρεπές το κείμενο για να κερδίσουμε σε μέγεθος.

Παραθέτω δύο εικόνες με τις ρυθμίσεις που χρησιμοποιώ εγώ όταν σκανάρω βιβλία. Η πρώτη είναι ο τρόπος εισαγωγής της εικόνας και ο δεύτερος οι ρυθμίσεις εξαγωγής της σκαναρισμένης εικόνας.

Αυτά σχετικά με το μέγεθος των σκαναρισμένων βιβλίων. Υπάρχουν άλλα πολλά πράγματα που αφορούν πλέον την ταχύτητα σκαναρίσματος (με συνηθισμένα μηχανήματα, όχι επαγγελματικά scanner) και επεξεργασία των εικόνων με αυτοματοποιημένους τρόπους ώστε να μην παίρνει πολύ χρόνο.
Ενδεικτικά πάλι να αναφέρω πως ένα βιβλίο 300 σελίδων, θέλει περίπου 2-3 ώρες για να σκαναριστεί, να επεξεργασθεί και να γίνει pdf σε ποιότητα ίσως και καλύτερη του πρωτοτύπου (συμβαίνει και αυτό μερικές φορές, ειδικά στα παλαιά βιβλία).

Ελπίζω οι οδηγίες να είναι κατανοητές. Από όλα αυτά που είπα το βασικό είναι το νούμερο 1. Σκανάρουμε ΥΠΟΧΡΕΩΤΙΚΑ σε 1bit B/W.
Νεκτάριος Κόντης

Υ.Γ. Ίσως το θέμα να πρέπει να μεταφερθεί αλλού και όχι εδώ, γιατί είναι κάπως τεχνικό. Οι διαχειριστές γνωρίζουν.
 

Attachments

  • 01.jpg
    01.jpg
    89.1 KB · Views: 59
  • 02.jpg
    02.jpg
    99.8 KB · Views: 46

NKontis

Παλαιό Μέλος
Διευκρίνηση:

Για να μην δημιουργηθούν λάθος εντυπώσεις θα πρέπει να διευκρινήσω πως τα συγκεκριμένα βιβλία (από τα οποία ξεκίνησε το θέμα, δηλ. τα της ΖΩΗΣ) δεν τα έχω σκανάρει εγώ. Άλλος έχει κάνει τον κόπο (και δεν γνωρίζω ποιός). Οπότε τα Thanks πρέπει να πάνε γι᾽ αυτόν που έχει σκανάρει τα βιβλία.
 
Top