OCR
δια ΠΟΛΥΤΟΝΙΚΗΝ Ελληνικην γλωσσαν
ως και δια ΨΑΛΤΙΚΗΝ, παλαιας τε και νεας γραφης
++++++++++++++++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++
1) ΑΜΕΣΟΣ (δυναμικη) Αναγνωρησις Ελληνικου πολυτονικου χειρογραφου κειμενου
( "on-line character recognition", "dynamic character recognition", "real-time character recognition", "intelligent character recognition")
++++++++++++++++++++++++++++++++++++++
Εις τον εξής Σύνδεσμον,
1a)
http://shapecatcher.com/
υπάρχει ένα πολύ ενδιαφέρον λογισμικον το οποίο έχει την ικανότητα να αναγνωρίζει χαρακτήρες εγγραφής οι οποίοι εισάγονται διά μέσου ηλεκτρονικού σtυλου.
Το λογισμικό αυτό έχει την ικανότητα να αναγνωρίζει επαρκώς, ΤΟΣΟ τα πολυτονικα ελληνικά, ΟΣΟ και σημαδοφωνα της ΨΑΛΤΙΚΗΣ (!!), και να ευρισκει τον αντίστοιχον χαρακτήραν εις κωδικαν Unicode.
Η επι πλεον δυνατοτης δεσμευσεως της αναζητησεως μόνον εις το Ελληνικόν πολυτονικό μέρος κάποιος γραμματοσειράς, η αυτην της λεγομενης Βυζαντινης μουσικης, δύναται οπως συμβάλη εις μιαν πιστοτεραν αναγνώρισην του κειμενου.
Εδοκίμασα ορισμένους πολυτονικούς ΚΑΙ ψαλτικους χαρακτήρας κι είχε αρκετά καλή επιτυχία η αναγνώρισής των.
Επικοινωνησα με τον προγραμματιστην
τον συγγραφεαν του shapecatcher
Benjamin Milde
bmilde@gmail.com
αιτουμενος οπως δημιουργησει λογισμικον το οποιο να παρεχει την δυνατοτηταν ΣΥΝΕΧΟΥΣ κυλουντων μονογραμου κυτταρων (grids) επι μιας και μονον γραμμης, δια την κατα σειραν εισαγωγην, αναγνωρησιν. κωδικοποιησιν και εξαγωγην του καθεκαστου πολυτονικου Unicode χαρακτηρος.
PROJECT PROPOSITION N°1
Segmentation, for whole word, phrase, paragraph => dynamic recogniton of POLYTONIC GREEK.
I tried some such combinations of basic greek leters and diacritics, and found that thisprogram did an excellent job.
By limiting the search to only one part of the unicode repertoire (ie polytonic Greek), one can obtain a FREE polytonic Greek writer.
Should mutiple lines or automatic segmation be a lengthy programming procees, then we can all settle for a PRE ESTABLISHED one line "multi"grid, that can somehow "flow" from right to left, in which we can add handwritten characters ONE by ONE in each grid... as it disappears to the left, it can be PROCESSED, and provide an output in some text file. Corrections and repeats could be made by moving the cursor BACK to previously entered letter glyphs.
Ειδε κατωθι, το θεμα
3) ΑΜΕΣΟΣ Αναγνωρησις Ελληνικου πολυτονικου, μονοτονικου η και ατονου χειρογραφου κειμενου ως και ΨΑΛΤΟ ΣΗΜΑΔΟΦΩΝΙΚΟΥ συμπλεγατος
++++++++++++++++++++++++
Εις τον ως κατωθιΣύνδεσμον,
1b)
Linux CellWriter
http://risujin.org/cellwriter/
υπάρχει ένα πολύ ενδιαφέρον λογισμικον δια Linux, το οποίο έχει την ικανότητα να αναγνωρίζει χαρακτήρες γραφής οι οποίοι εισάγονται διά μέσου ηλεκτρονικων στυλου και ταβλας.
Linux CellWriter δια την ψαλτικην γραφην => ειδε κατωθι ιδεας περι πολυκυτταρικην αναγνωρησιν (simultaneous multi-grid recognition)
1c)
Θὰ ἦτο πάρα πολύ ενδιαφέρον εαν ερευνουσαν περι αυτου οι ειδικοί, ωστε να έλθουν εις επαφήν με τον προγραμματιστην
δια μιαν μελλουσαν εφαρμογην τυπου penreader αλλα δια ΠΟΛΥΤΟΝΙΚΟΝ συστημα =σιγουρα το υπαρχον θα ειναι μονοτονικον
http://www.penreader.com/mswindows-
++++++++++++++++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++
2) ΕΜΕΣΟΣ "στατικη" ("offline", "static"process) Αναγνωρησις ηδη απεικονισθεντος Ελληνικου τυπογραφημένου η και χειρογραφου κειμενου.
http://wiki.digitalclassicist.org/OCR_for_ancient_Greek
Περιεχει συνδεσεις προς διαφορα λογισμικα, οπως το ηδη ανακοινωθεν gImageReader released 2014 (ειδε προηγουμενον μηνυμα)
http://sourceforge.net/projects/gimagereader/
η και το GAMERA (υπενθυμιζοντας οτε το εν λογω δωρεαν λογισμικον βασιζομενον επι του PYTHON περιεχει και δωρεαν toolkit λογισμικον δια αναγνωρισην και κωδικοποιησιν χαρακτηρων ψαλτικου κειμενου εν τη νεα ως και εν τη παλαια γραφη)
++++++++++++++++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++
3) ΑΜΕΣΟΣ Αναγνωρησις Ελληνικου πολυτονικου, μονοτονικου η και ατονου χειρογραφου κειμενου ως και ΨΑΛΤΟ ΣΗΜΑΔΟΦΩΝΙΚΟΥ συμπλεγατος
=======================
Θα επρεπε να συζητηθει καποια εφαρμογη ΣΥΝΔΕΣΕΩΣ των κατα συλλαβην ανασυγκροτημενων/ομαδοποιημενων ψαλτικων σημαδοφωνων (μαλλον υστερον αιτησεως προς τον δημιουργον του [
http://shapecatcher.com/]), δια μεσου ΠΟΛΛΑΠΛΟΥ grid (multi grid) αντι του υπαρχοντος μοναδικου (instead of the actual unique grid) ==
===ωστε μεν να επεξεργαζετε και να αναγνωριζει ταυτοχρονως ΠΟΛΛΑΠΛΟΥΣ χαρακτηρας UNICODE αντι μονον ενος,
=== και ωστε δε, υστερον επικυρωσεως καθε ομαδος, να εισαγεται εις το λογισμικον γραφης της ψαλτικης (Μελωδος, ΜΚ, Πανδουρις, ΕΖ, ΒΖ κτλ). Εαν η αμεσος ενταξης θεωρηθη δυσκολος, τοτε ενας ενδιαμεσος κωδικος οπως αυτος τον οποιον εξαγη το Gamera psaltiki toolkit θα ητο επισης χρησιμος.
Μηνυμα προς τον συγγραφεαν του shapecatcher
Benjamin Milde
bmilde@gmail.com
PROJECT PROPOSITION Ν°2 Dynamic Handwritten Psaltiki (Byzantince music) recognition
This may be realized usin ONE mutligrid (approximately 12 lines and 7 columns) in which various grids (not all each time) will by filled with a particular glyph.
This GROUP of glyphs should provide an OUTPUT for EACH grid USED (blancs are useless). The output whould include information about the grid's POSITION.
Output Code: ειδε USERMANUAL.html εντος του εξης αρχειου
(
http://gamera.informatik.hsnr.de/addons/psaltiki/psaltikidoc-1.1.2.tar.gz)
Παραδειγμα Output Code
(οπου x=0 και y=0 αντιστοιχει εις το ΔΕΞΙΟΝ ακρον των επι της βασικης γραμμης χαρακτηρων οπως το ισον, ολιγον κτλ )
Oligon+kentimata anothi+gorgon anothi kendimaton:
(primary.oligon[0,0];kendimata[-3,2];gorgon.mono-gorgon[-5,3])
Oligon + heteron syndeontas PROEGOUMENIN syllabin + antothi toy oligou (apostrophos + kentimata + gorgon anothi kentimaton):
(primary.oligon[0,0];linking.heteron[-5,-3];apostrophos[-6,2]; kendimata[-2,2];gorgon.mono-gorgon[-4,4])
Διατονικη μαρτυρια Πα επι ημιφιου
(martyria.diatonic-hemi-phi[0,-6];letter.small.pa[0,0])
O εξαγωμενος κωδικος θα εντασεται εντος των υπ;ρχοντων λογισμικων.
Free Polytonic Greek OCR gImageReader released 2014
Κατεβασατε τα δυο εξης αρχεια, συνολον σχεδον 100 Mb, ωστε να μην ταλαπωρειται κανει με διαφορους αποσυμπιεσεις
(
http://www.mediafire.com/download/z1z6tt5o0p8pmdb/WINDOWS__et_Mac_gImageReader_part_01.zip)
(
http://www.mediafire.com/download/a...essdata-open_and_copy_paste_into_tessdata.zip)
Free Polytonic Greek OCR gImageReader released 2014
Δια Windows
1-Ανοιξον WINDOWS gImageReader
2 ενεργοποιησον λογισμικον gImageReader_2.93_i686.exe
Υστερον, εis Win7, και ως administrator,
3 ανοιξον τον κατεβασθεν φακελλον
"tessdata-open and copy paste into tessdata"
4 copy paste τα απαντα του ως ανωθι φακελλου εντος του φακελλου
C:\Program Files (x86)\gImageReader\share\tessdata
===============
5 Ειδε video εν τη Ελληνιστι περι εφαρμογης
==============
πηγαι
http://wiki.digitalclassicist.org/OCR_for_ancient_Greek
http://code.google.com/p/tesseract-ocr
https://code.google.com/p/tesseract-ocr/downloads/list
http://ancientgreekocr.org/windows.html
Chaireto
GKM