[Ερώτηση] OCR πρόγραμμα για βυζαντινή μουσική

neoklis

Νεοκλής Λευκόπουλος, Γενικός Συντονιστής
Υπάρχει πρόγραμμά που να αναγνωρίζει και το ποιοητικο κείμενο αλλά και μουσικό κείμενο

Ευχαριστώ πολύ

Ο "Χρυσός Μελωδός", αν δεν κάνω λάθος.
 

ΒΑΙΟΣ ΝΤΕΛΗΣ

Παλαιό Μέλος
Υπάρχει κάποιος συνάδελφος να το κάνει για μένα και τι κόστος πάντοτε

Αν υπάρχει κάποιος ας στειλή μυνημα

Ευχαριστω

(από Γεώργιο Κ. Μιχαλάκη)
(για επικοινωνία ψευδώνυμο στο ψαλτολόγιον: mimi
skype: gkmichalakis
email: g_michalakis@yahoo.fr)

Ερωτησις
Υπάρχει πρόγραμμά που να αναγνωρίζει και το ποιοητικο κείμενο αλλά και μουσικό κείμενο;


Απαντησις = NAI

(1) Χρυσος Μελωδος, ενσωματωμενον« OCR μουσικού και Ελληνικoύ πολυτονικού κείμενου »

(http://www.melodos.com/)


(2) Δωρεὰν ἠλεκτρονικὴ ἀναγνώρησις τυπογραφημένης ΨΑΛΤΙΚΗΣ γραφῆς


Psaltic neume notation recognition
The Psaltiki Toolkit
(http://gamera.informatik.hsnr.de/addons/psaltiki/index.html)
is a complete application for the recognition of the post 1800 neume based chant notation of the eastern church. It offers the following functionality:
page layout analysis and baseline detection
neume recognition and neume layout analysis
generation of a machine readable output code
(http://gamera.informatik.hsnr.de/addons/psaltiki/index.html)

kai EPISTIMONIKI ANAKOINOSIS (paper)
[C. Dalitz, G.K. Michalakis, C. Pranzas: Optical Recognition of Psaltic Byzantine Chant Notation. International Journal of Document Analysis and Recognition, vol. 11, no. 3, pp. 143-158, (2008; )
(http://lionel.kr.hs-niederrhein.de/~dalitz/data/publications/ijdar-psaltiki.pdf);

(3) Δωρεὰν ἠλεκτρονικὴ ἀναγνώρησις τυπογραφημένης Ἑλληνικῆς ΠΟΛΥΤΟΝΙΚΗΣ γραφῆς
(http://gamera.informatik.hsnr.de/addons/index.html)
(The GreekOCR Toolkit is an addon for the OCR Toolkit for polytonal (classical) Greek.)

(To add on einai DOREAN kai chreiazetai to GAMERA OCR to opoion einai EPISIS DOREAN = FREEWARE.. Echrimatodotithike apo tin psaltikin omadan STOUDION (hyparcho os IDRYTIKON melos: We are grateful to Georgios K. Michalakis for initiating this project and to the Association Stoudion for financial support of parts of the development."
8888888888888888888888888888888888888888888888888888888888888888
8888888888888888888888888888888888888888888888888888888888888888

Τι καμνει και τι ΔΕΝ καμνει το Psaltiki OCR Gamera :

To Gamera OCR ειναι ενα ΕΛΕΥΘΕΡΟ προγραμμα αναγνωρισεως ΧΑΡΑΚΤΗΡΩΝ

Διαφερει απο αλλα προγραμματα με το οτι δυναται να το ΔΙΔΑΞΕΙ ο χρηστης ΧΑΡΑΚΤΗΡΕΣ

Το προγραμμα αυτο ΔΕΝ ειναι πρε προγραμματισμενων δια να γνωριζει γλωσσας = πχ Αγγλικα, Γαλλικα, κτλ

Δι αυτο και χρειαζεται επι πλεον προγραμματισμος, το λεγομενον «toolkit », οπως εγινε δηλαδη δια την ψαλτικην



Οσον αφορα την ψαλτικην. προς το παρον, ΔΥΝΑΤΑΙ να καμνει τα ΕΞΗΣ, με καποιες ΔΕΣΜΕΥΣΕΙΣ


α == ΦΑΣΗΣ ΣΚΑΝΑΡΙΣΜΑΤΟΣ και ΑΠΟΘΗΚΕΥΣΕΩΣ εικονων
== σκαναρει τις ΕΚΤΥΠΩΜΕΝΟΝ βιβλιον, το οποιον να περιεχει σημαδοφωνα ΟΜΟΙΟΥ μεγεθους. Το σκαν πρεπει να γινει εις 300 dpi
== μεταβαλει αυτο εις ΞΕΧΩΡΙΣΤΕΣ σελιδες png μαυρο-ασπρες

Το προγραμμα καμνει deskew =#ξεστραβωνει# == την καθε σελιδαν
Υστερον, το προγραμμα ΑΦΑΙΡΕΙ ΜΟΝΟΝ ΤΟΥ το ΚΕΙΜΕΝΟΝ = lyrics, ωστε να παραμενει ΜΟΝΟΝ το μουσικον κειμενον


β == ΦΑΣΗΣ ΔΙΔΑΧΗΣ/ΚΑΤΑΝΟΜΗΣ ΥΠΑΡΧΟΝΤΩΝ η και ΝΕΩΝ ΣΗΜΑΔΟΦΩΝΩΝ

Ο χρηστης ΔΗΜΙΟΥΡΓΕΙ με copy paste πεντε σελιδες οι οποιες να περιεχουν ΟΛΑ τα συμβολα της ψαλτικης, και τα οποια να προερχονται απο το εκτυπωμενο βιβλιο


Αλλοιος, δυναται οπως διαλεξει περιπου 5 σελιδας αι οποιαι να περιεχουν το κατα δυναμιν περισσοτερα σημαδοφωνα

Το προγραμμα ΑΦΑΙΡΕΙ ΜΟΝΟΝ ΤΟΥ το ΚΕΙΜΕΝΟΝ = lyrics

Ο ΧΡΗΣΤΗΣ ΔΙΔΑΣΚΕΙ το προγραμμα = δηλαδη == το προγραμμα διαλεγει απομονομενους χαρακτηρες, και ο χρηστης το βοηθαει να της ΚΑΤΑΝΟΜΗΣΕΙ ΟΡΘΩΣ == πχ =ταδε χαρακτηρας ειναι ΙΣΟΝ, ο αλλος εαναι ΟΛΙΓΟΝ,κοκ

Εαν ΔΕΝ υπαρχει η ΟΝΟΜΑΣΙΑ, ο ΧΡΗΣΤΗΣ ΔΥΝΑΤΑΙ να την ΔΗΜΙΟΥΡΓΗΣΕΙ == πχ == δια τα καραϊκο ορνισκαλισματα =τρομικον κτλ



γ == ΦΑΣΗΣ ΑΝΑΓΝΩΡΙΣΕΩΣ σελιδων

Υστερον, ο χρηστης εισαγει ΟΛΑΣ τας σελιδας, και το προγραμμα τας αναγνωριζει ΜΙΑ ΜΙΑ

το προγραμμα εξαγει εναν ΚΩΔΙΚΟΝ ο οποιος εχει ΚΑΤΑΧΩΡΙΣΕΙ

== την καθε σελιδαν εις ΓΡΑΜΜΑΣ

== και την καθε γραμμην εις ΟΜΑΔΑΣ χαρακτηρων

Η καθε ομαδα ειναι διαφοροποιειτα
===η εις ΣΥΝΟΛΟΝ χαρακτηρων ανωθεν καποιας συλλαβης κειμενου,
===η συνολον Μαρτυριας,
===η συνολον χρονικης αγωγης

Προς το παρον, το προγραμμα ΔΕΝ αναγωριζει Μαρτυριας ηχων
====

δ=ΦΑΣΗΣ ΕΞΑΓΩΓΗΣ ΚΩΔΙΚΟΥ
ιδου παραδειγμα εξαγωγης ενος Συνολου

Ενα ολιγον χωριζεται εις 13 τεμαχια

(primary.oligon[0,0];kendimata[-3,2];gorgon.mono-gorgon[-5,3])

Το ως ανωθεν εννοει οτι υπαρχει ΟΛΙΓΟΝ επι της βασεως (primary.oligon)
=το δεξι του ακρο του ολιγου αυτου αντιστοιχει με.
(x = 0 ; y = 0)

Ανωθεν αυτου υπαρχουν κεντηματα,
==με το κατωθι ΔΕΞΙΟΝ ακρον αυτων εις το σημειον 3 #τεμαχια =μοναδες# αριστερα του δεξιου ακρου του ολιγου,=
== και 2 #τεμαχια# ανωθεν του ολιγου

Ανωθεν των κεντηματων υπαρχει ΓΟΡΓΟΝ
==με το κατωθι ΑΡΙΣΤΕΡΟΝ ακρον αυτου εις το σημειον 5 #τεμαχιων# αριστερα του δεξιου ακρου του ολιγου,=
== και 3 #τεμαχια# ανωθεν του ολιγου
===================

Τετοιον κωδικα εξαγει το Gamera


ε = ΧΡΗΣΙΣ του ΔΙΕΞΑΓΩΜΕΝΟΥ κωδικου μετα προγραμματων ψαλτικης γραφης
Υστερον, χρειαζεται προγραμματιστης ο οποιος θα πρεπει να δημιουργησει ΠΙΝΑΚΑΝ, και MACRO, ωστε να μετατρεπεται αυτος ο ΚΩΔΙΚΑΣ εις την γραμματοσειραν του προγραμματος οπου χρησιμοποιει δια να γραφη της ψαλτικης


στ == Προσδοκιες μελλοντος πχ Αναγνωρισης Παλαιογραφιας
Συν τω χρονω, ΑΚΟΜΗ και η χειρογραφος ΠΑΛΑΙΟΓΡΑΦΙΑ, ΨΑΛΤΙΚΗ ΤΕ αλλα και ΓΡΗΓΟΡΙΑΝΗ, θα ΨΗΦΟΠΟΙΗΘΗ χαριν εις το Gamera OCR

===========================================
===========================================

Οποιος ενδιαφερεται να καμνει ΣΟΒΑΡΗΝ διδακτορικην διατριβην επι του θεματος, ας ελθει εις επικοινωνιαν μαζι μου.

Διαβασατε ΕΔΩ δια λεπτομερειες

http://lionel.kr.hs-niederrhein.de/~dalitz/data/publications/ijdar-psaltiki.pdf


http://lionel.kr.hs-niederrhein.de/~dalitz/data/projekte/psaltiki/


http://lionel.kr.hs-niederrhein.de/~dalitz/data/projekte/psaltiki/doc/


http://lionel.kr.hs-niederrhein.de/~dalitz/data/projekte/psaltiki/doc/usermanual.html


============

Ποιοι αλλοι #παλευουν# με OCR ψαλτικης ;

http://www.scribeserver.com/NEUMES/

http://www.scribeserver.com/doneda/doneda_db_index.htm

http://cgi.di.uoa.gr/~gbelis/
 
Last edited:

ΒΑΙΟΣ ΝΤΕΛΗΣ

Παλαιό Μέλος
OCR
δια ΠΟΛΥΤΟΝΙΚΗΝ Ελληνικην γλωσσαν
ως και δια ΨΑΛΤΙΚΗΝ, παλαιας τε και νεας γραφης

++++++++++++++++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++

1) ΑΜΕΣΟΣ (δυναμικη) Αναγνωρησις Ελληνικου πολυτονικου χειρογραφου κειμενου
( "on-line character recognition", "dynamic character recognition", "real-time character recognition", "intelligent character recognition")

++++++++++++++++++++++++++++++++++++++
Εις τον εξής Σύνδεσμον,
1a)
http://shapecatcher.com/

υπάρχει ένα πολύ ενδιαφέρον λογισμικον το οποίο έχει την ικανότητα να αναγνωρίζει χαρακτήρες εγγραφής οι οποίοι εισάγονται διά μέσου ηλεκτρονικού σtυλου.
Το λογισμικό αυτό έχει την ικανότητα να αναγνωρίζει επαρκώς, ΤΟΣΟ τα πολυτονικα ελληνικά, ΟΣΟ και σημαδοφωνα της ΨΑΛΤΙΚΗΣ (!!), και να ευρισκει τον αντίστοιχον χαρακτήραν εις κωδικαν Unicode.


Η επι πλεον δυνατοτης δεσμευσεως της αναζητησεως μόνον εις το Ελληνικόν πολυτονικό μέρος κάποιος γραμματοσειράς, η αυτην της λεγομενης Βυζαντινης μουσικης, δύναται οπως συμβάλη εις μιαν πιστοτεραν αναγνώρισην του κειμενου.



Εδοκίμασα ορισμένους πολυτονικούς ΚΑΙ ψαλτικους χαρακτήρας κι είχε αρκετά καλή επιτυχία η αναγνώρισής των.

Επικοινωνησα με τον προγραμματιστην
τον συγγραφεαν του shapecatcher
Benjamin Milde
bmilde@gmail.com

αιτουμενος οπως δημιουργησει λογισμικον το οποιο να παρεχει την δυνατοτηταν ΣΥΝΕΧΟΥΣ κυλουντων μονογραμου κυτταρων (grids) επι μιας και μονον γραμμης, δια την κατα σειραν εισαγωγην, αναγνωρησιν. κωδικοποιησιν και εξαγωγην του καθεκαστου πολυτονικου Unicode χαρακτηρος.

PROJECT PROPOSITION N°1
Segmentation, for whole word, phrase, paragraph => dynamic recogniton of POLYTONIC GREEK.
I tried some such combinations of basic greek leters and diacritics, and found that thisprogram did an excellent job.
By limiting the search to only one part of the unicode repertoire (ie polytonic Greek), one can obtain a FREE polytonic Greek writer.

Should mutiple lines or automatic segmation be a lengthy programming procees, then we can all settle for a PRE ESTABLISHED one line "multi"grid, that can somehow "flow" from right to left, in which we can add handwritten characters ONE by ONE in each grid... as it disappears to the left, it can be PROCESSED, and provide an output in some text file. Corrections and repeats could be made by moving the cursor BACK to previously entered letter glyphs.
Ειδε κατωθι, το θεμα
3) ΑΜΕΣΟΣ Αναγνωρησις Ελληνικου πολυτονικου, μονοτονικου η και ατονου χειρογραφου κειμενου ως και ΨΑΛΤΟ ΣΗΜΑΔΟΦΩΝΙΚΟΥ συμπλεγατος

++++++++++++++++++++++++

Εις τον ως κατωθιΣύνδεσμον,
1b)
Linux CellWriter
http://risujin.org/cellwriter/
υπάρχει ένα πολύ ενδιαφέρον λογισμικον δια Linux, το οποίο έχει την ικανότητα να αναγνωρίζει χαρακτήρες γραφής οι οποίοι εισάγονται διά μέσου ηλεκτρονικων στυλου και ταβλας.

Linux CellWriter δια την ψαλτικην γραφην => ειδε κατωθι ιδεας περι πολυκυτταρικην αναγνωρησιν (simultaneous multi-grid recognition)





1c)

Θὰ ἦτο πάρα πολύ ενδιαφέρον εαν ερευνουσαν περι αυτου οι ειδικοί, ωστε να έλθουν εις επαφήν με τον προγραμματιστην
δια μιαν μελλουσαν εφαρμογην τυπου penreader αλλα δια ΠΟΛΥΤΟΝΙΚΟΝ συστημα =σιγουρα το υπαρχον θα ειναι μονοτονικον
http://www.penreader.com/mswindows-





++++++++++++++++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++

2) ΕΜΕΣΟΣ "στατικη" ("offline", "static"process) Αναγνωρησις ηδη απεικονισθεντος Ελληνικου τυπογραφημένου η και χειρογραφου κειμενου.

http://wiki.digitalclassicist.org/OCR_for_ancient_Greek


Περιεχει συνδεσεις προς διαφορα λογισμικα, οπως το ηδη ανακοινωθεν gImageReader released 2014 (ειδε προηγουμενον μηνυμα)
http://sourceforge.net/projects/gimagereader/

η και το GAMERA (υπενθυμιζοντας οτε το εν λογω δωρεαν λογισμικον βασιζομενον επι του PYTHON περιεχει και δωρεαν toolkit λογισμικον δια αναγνωρισην και κωδικοποιησιν χαρακτηρων ψαλτικου κειμενου εν τη νεα ως και εν τη παλαια γραφη)


++++++++++++++++++++++++++++++++++++++






++++++++++++++++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++

3) ΑΜΕΣΟΣ Αναγνωρησις Ελληνικου πολυτονικου, μονοτονικου η και ατονου χειρογραφου κειμενου ως και ΨΑΛΤΟ ΣΗΜΑΔΟΦΩΝΙΚΟΥ συμπλεγατος
=======================

Θα επρεπε να συζητηθει καποια εφαρμογη ΣΥΝΔΕΣΕΩΣ των κατα συλλαβην ανασυγκροτημενων/ομαδοποιημενων ψαλτικων σημαδοφωνων (μαλλον υστερον αιτησεως προς τον δημιουργον του [http://shapecatcher.com/]), δια μεσου ΠΟΛΛΑΠΛΟΥ grid (multi grid) αντι του υπαρχοντος μοναδικου (instead of the actual unique grid) ==
===ωστε μεν να επεξεργαζετε και να αναγνωριζει ταυτοχρονως ΠΟΛΛΑΠΛΟΥΣ χαρακτηρας UNICODE αντι μονον ενος,
=== και ωστε δε, υστερον επικυρωσεως καθε ομαδος, να εισαγεται εις το λογισμικον γραφης της ψαλτικης (Μελωδος, ΜΚ, Πανδουρις, ΕΖ, ΒΖ κτλ). Εαν η αμεσος ενταξης θεωρηθη δυσκολος, τοτε ενας ενδιαμεσος κωδικος οπως αυτος τον οποιον εξαγη το Gamera psaltiki toolkit θα ητο επισης χρησιμος.


Μηνυμα προς τον συγγραφεαν του shapecatcher
Benjamin Milde
bmilde@gmail.com


PROJECT PROPOSITION Ν°2 Dynamic Handwritten Psaltiki (Byzantince music) recognition
This may be realized usin ONE mutligrid (approximately 12 lines and 7 columns) in which various grids (not all each time) will by filled with a particular glyph.
This GROUP of glyphs should provide an OUTPUT for EACH grid USED (blancs are useless). The output whould include information about the grid's POSITION.

Output Code: ειδε USERMANUAL.html εντος του εξης αρχειου
(http://gamera.informatik.hsnr.de/addons/psaltiki/psaltikidoc-1.1.2.tar.gz)

Παραδειγμα Output Code
(οπου x=0 και y=0 αντιστοιχει εις το ΔΕΞΙΟΝ ακρον των επι της βασικης γραμμης χαρακτηρων οπως το ισον, ολιγον κτλ )

Oligon+kentimata anothi+gorgon anothi kendimaton:
(primary.oligon[0,0];kendimata[-3,2];gorgon.mono-gorgon[-5,3])

Oligon + heteron syndeontas PROEGOUMENIN syllabin + antothi toy oligou (apostrophos + kentimata + gorgon anothi kentimaton):
(primary.oligon[0,0];linking.heteron[-5,-3];apostrophos[-6,2]; kendimata[-2,2];gorgon.mono-gorgon[-4,4])


Διατονικη μαρτυρια Πα επι ημιφιου
(martyria.diatonic-hemi-phi[0,-6];letter.small.pa[0,0])



O εξαγωμενος κωδικος θα εντασεται εντος των υπ;ρχοντων λογισμικων.










Free Polytonic Greek OCR gImageReader released 2014


Κατεβασατε τα δυο εξης αρχεια, συνολον σχεδον 100 Mb, ωστε να μην ταλαπωρειται κανει με διαφορους αποσυμπιεσεις
(http://www.mediafire.com/download/z1z6tt5o0p8pmdb/WINDOWS__et_Mac_gImageReader_part_01.zip)


(http://www.mediafire.com/download/a...essdata-open_and_copy_paste_into_tessdata.zip)

Free Polytonic Greek OCR gImageReader released 2014

Δια Windows

1-Ανοιξον WINDOWS gImageReader
2 ενεργοποιησον λογισμικον gImageReader_2.93_i686.exe


Υστερον, εis Win7, και ως administrator,


3 ανοιξον τον κατεβασθεν φακελλον
"tessdata-open and copy paste into tessdata"

4 copy paste τα απαντα του ως ανωθι φακελλου εντος του φακελλου

C:\Program Files (x86)\gImageReader\share\tessdata


===============
5 Ειδε video εν τη Ελληνιστι περι εφαρμογης
==============

πηγαι

http://wiki.digitalclassicist.org/OCR_for_ancient_Greek

http://code.google.com/p/tesseract-ocr

https://code.google.com/p/tesseract-ocr/downloads/list

http://ancientgreekocr.org/windows.html


Chaireto

GKM
 

PavlosKouris

Pavlos Papadopaidi
Μπορεί κάποιος για τους μη γνώστες να κάνει
"μετάφραση" ή αλλιώς να μας εξηγήσει με πιο απλά
λόγια;:eek:
 

ΒΑΙΟΣ ΝΤΕΛΗΣ

Παλαιό Μέλος
Μπορεί κάποιος για τους μη γνώστες να κάνει
"μετάφραση" ή αλλιώς να μας εξηγήσει με πιο απλά
λόγια;:eek:

Με απλά λόγια:

Αν θέλεις ένα πρόγραμμα να διαβάσει και να γράψει ύστερα με πολυτονικούς χαρακτήρες αυτά που "διάβασε'' από κάποιο πολυτονικό ελληνικό κείμενο, πας εδώ

http://www.mediafire.com/download/z1z6tt5o0p8pmdb/WINDOWS__et_Mac_gImageReader_part_01.zip


http://www.mediafire.com/download/a...essdata-open_and_copy_paste_into_tessdata.zip

Κατεβάζεις, κοιτάζεις και το βίντεο και ό,τι καταλάβεις.

Τώρα, αν θέλεις με το ποντίκι σου να ζωγραφίσεις ένα σημαδόφωνο, ακόμη και ένα απ'αυτά που θεωρούσε απαραίτητα ο Καράς και να το δεις καθαρογραμμένο, πας εδώ

http://shapecatcher.com/

και ζωγραφίζεις.

Τέλος, αν θες περισσότερες πληροφορίες, γράψε προσωπικό μήνυμα σε έναν απ'τους πολλούς PhD πληροφοριακούς του φόρουμ, κάθε σχολής.
Απ'την πλευρά μας, πληροφορηθήκαμε πως έχουν μέλλον όλα αυτά. Απ'την πλευρά σας, περιμένουμε κάποιο σημείο ζωής, ύστερα από τόσα χρόνια παραχωρήσεως δωρεάν λογισμικών αναγνώρισης ψαλτικών χαρακτήρων (εντάξει, πολλοί μπορεί να μην ήξεραν ή να ήξεραν και να μην ενδιαφέρθηκαν. Δεν πειράζει να γίνει μια προσπάθεια ακόμα.)

Ευχαριστώ! :)
 

prenumele

Παλαιό Μέλος
Gamera OCR (Psaltiki Toolkit [GOPT] and Polytonic Greek possibilities)
Λογισμικὸν ὀτπικῆς άναγνωρήσεως
== Πολυτινικῶν Ἑλληνικῶν χαρακτήρων
== Σημαδοφώνων ψαλτικῆς

From GKM


Πρόκειται περὶ ΔΩΡΕΑΝ λογισμικοῦ.
Λειτουργεῖ ἐντὸς
= Windows [XP => 8.1; 32 καὶ 64 bit]
= Linux
Χρειάζεται Python καὶ WXPython
Requires Python and WXPython


Περὶ Windows [XP => 8.1; 32 καὶ 64 bit]
Έὰν καὶ ὑπάρχουν ΣΥΓΧΡΟΝΟΤΕΡΑΙ ἐκδόσεις, ΔΕΝ συνδιάζονται ἀναμεταξύ των.

Ὁ καλύτερος συνδιασμός, λειτουργῶν, ὡς προανεφέρθει,
διατήθεται συμπιεσμένος ἐδῶ:
Windows version download

(http://www.mediafire.com/download/5c72cf6ahuc4jlu/GameraOCR_3dot3py2dot3.zip)

Επιστημονικη ανακοινωσις article
(C. Dalitz, G.K. Michalakis, C. Pranzas: Optical Recognition of Psaltic Byzantine Chant Notation. International Journal of Document Analysis and Recognition, vol. 11, no. 3, pp. 143-158 (2008) )
(pdf)
Περιεχει πινακαν μετ ακριβων ονομασιων των σημαδοφωνων


Videoπαρουσιασις 001: Σύντομος περιπλόησις τοῦ λογισμικοῦ

(http://www.mediafire.com/watch/94q0bbmv1ny2292/GKM_Gamera_OCR_Psaltiki_Intro_001.mp4)



Videoπαρουσιασις 002: Περὶ ἐγκαταστάσεως ἐντὸς Windows 8.1 64 bit
(http://www.mediafire.com/watch/65c513oz61rqbqs/GKM_Gamera_OCR_Psaltiki_Intro_002.mp4)

Προσοχὴ:
== τὸ 03 .msi
πρέπει νὰ ἐγκατασταθῇ
πρὸ
== τοῦ 04 .exe




Videoπαρουσιασεις 003-014: Περι μετατροπης εικονικων αρχειων εις 300 dpi με IRFANviewer,
και περι ΕΚΠΑΙΔΕΥΣΕΩΣ αλλα και αναγνωρησεως/κωδικοποιησεως
με το GAMERA OCR Psaltiki Toolkit [GOPT]/B]

http://www.mediafire.com/watch/655o7sm1ui446zm/GKM_Gamera_OCR_Psaltiki_Intro_003.mp4


http://www.mediafire.com/watch/fr4rkxtbhett2br/GKM_Gamera_OCR_Psaltiki_Intro_004.mp4

http://www.mediafire.com/watch/vo1i9sxf983ubcq/GKM_Gamera_OCR_Psaltiki_Intro_005.mp4

http://www.mediafire.com/watch/l92hstrhu8ktu6a/GKM_Gamera_OCR_Psaltiki_Intro_006.mp4


http://www.mediafire.com/watch/g3h5umdccz78ndu/GKM_Gamera_OCR_Psaltiki_Intro_007a.mp4

http://www.mediafire.com/watch/93654n92koibvpb/GKM_Gamera_OCR_Psaltiki_Intro_008a.mp4

http://www.mediafire.com/watch/vwj43n6rbxx4a71/GKM_Gamera_OCR_Psaltiki_Intro_009a.mp4



http://www.mediafire.com/watch/6bmagp02r5wdtze/GKM_Gamera_OCR_Psaltiki_Intro_010a.mp4

http://www.mediafire.com/watch/ovnroottdmyr3gn/GKM_Gamera_OCR_Psaltiki_Intro_011a.mp4


http://www.mediafire.com/watch/9x4runzc5lul5bt/GKM_Gamera_OCR_Psaltiki_Intro_012a.mp4


http://www.mediafire.com/watch/3qec35xlpe31d25/GKM_Gamera_OCR_Psaltiki_Intro_013a.mp4



http://www.mediafire.com/watch/fdcl8bsl4c3zbda/GKM_Gamera_OCR_Psaltiki_Intro_014.mp4



+++++++++

Αμεσος σκοπος = Μελωδος
Προς ευκολοτεραν εισαγωγην μουσικων γραμμων εντος του Μελωδου, ο εκκαθαρισμος των εικονων εκ πασης φυσεως κειμενου και θορυβου, γινεται αυτοματως θπο το Gamera OCR.
Η εισαγωγη τοιουτου τυπεου εικονος, οπως δειχνη η videoπαρουσιασης, θα διευκολυνει την αποτεραν αναγνωρησιν εντος του Μελωδου.

Αμεσος σκοπος = ΜΚ και Μελωδος και BZQ και Πανδουρις κτλ
Εδω, θα επρεπε οι πεπειραμενοι χρηστες να προχωρησουν εις αναγνωρησιν και εξαγωγην κωδικου, τον οποιον να χρησημοποιουν τα υπολοιπα λογισμηκα ωστε να ενταξουν το μουσιον κειμενον.

Αμεσος σκοπος = καθαρη εικονα ΕΚΤΟΣ λογισμικου
Επισης, εαν ενταχθουν και οι χαρακτηραι κειμενου, με απλον προγραματισμον και χρησην καποιας βασικης γραμματοσειρας, γινεται να εμφανιζεται εκ νεου το κειμενον, ΚΑΘΑΡΟΓΡΑΜΜΕΝΟΝ μετα της νεας γραμματοσειρας.
Η τροποποιησις του, ομως, θα παραμενει δυσκολος.


++++++++++++++++++


Τι καμνει και τι ΔΕΝ καμνει το Psaltiki OCR Gamera :

To Gamera OCR ειναι ενα ΕΛΕΥΘΕΡΟ, ΑΝΟΙΚΤΟ προγραμμα αναγνωρισεως ΧΑΡΑΚΤΗΡΩΝ

Διδαχη εντυπων και χειρογραφων χαρακτηρων
To Gamera OCR διαφερει απο αλλα προγραμματα με το οτι δυναται να το ΔΙΔΑΞΕΙ ο χρηστης ΧΑΡΑΚΤΗΡΑΣ ΝΕΟΥΣ

Απαντες οι χαρακτηραι της νεας Μεθοδου εισιν ηδη εντεταγμεναι.

Ο πεπειραμενος χρηστης δυναται οπως δημιουργησει νεας ονομασιας σημαδοφωνων, εκ των οποιων και τα της παλαιογραφιας.


Περι αναγνωρησεως κειμενου κατωθι των μουσικων χαρακτηρων
Το προγραμμα, εν τη παρουση μορφη του, ΔΕΝ ειναι πρε προγραμματισμενων δια να αγνωριζει κειμενον = πχ Αγγλικα, Γαλλικα, κτλ

Οποιος το θελησει, θα επρεπε να επιφερει επι πλεον προγραμματισμον, εντος του λεγομενου «toolkit ».



Οσον αφορα την ψαλτικην
προς το παρον, ΔΥΝΑΤΑΙ να καμνει τα ΕΞΗΣ, με καποιες ΔΕΣΜΕΥΣΕΙΣ


α == ΦΑΣΗΣ ΣΚΑΝΑΡΙΣΜΑΤΟΣ και ΑΠΟΘΗΚΕΥΣΕΩΣ εικονων
== ο χρηστης σκαναρει τις ΕΚΤΥΠΩΜΕΝΟΝ βιβλιον, με οιανδηποτες λογισμικον, το οποιον να περιεχει σημαδοφωνα ΟΜΟΙΟΥ μεγεθους. Το σκαν πρεπει να γινει εις 300 dpi
== μεταβαλει αυτο εις ΞΕΧΩΡΙΣΤΕΣ σελιδες png μαυρο-ασπρες
== εαν ΔΕΝ εχομεν εικονας εις 300 dpi, θα επρεπε να γινει batch conversion εις 300 dpi, πχ με το δωρεαν λογισμικον irfanview (http://www.irfanview.com/)
(το κατεβαζει τις κι εδω
[http://www.mediafire.com/download/5420gm7o7v2zmm4/irfan_viewer_iview438_setup.exe])

Το προγραμμα Gamera OCR Psaltiki Toolkit καμνει deskew =#ξεστραβωνει# == την καθε σελιδαν (και ΟΥΧΙ καθ'εκαστην γραμμην)
Υστερον, το προγραμμα ΑΦΑΙΡΕΙ ΜΟΝΟΝ ΤΟΥ το ΚΕΙΜΕΝΟΝ = lyrics, ωστε να παραμενει ΜΟΝΟΝ το μουσικον κειμενον


β == ΦΑΣΗΣ ΔΙΔΑΧΗΣ/ΚΑΤΑΝΟΜΗΣ ΥΠΑΡΧΟΝΤΩΝ η και ΝΕΩΝ ΣΗΜΑΔΟΦΩΝΩΝ

Ο χρηστης ΔΗΜΙΟΥΡΓΕΙ με copy paste πεντε σελιδες οι οποιες να περιεχουν ΟΛΑ τα συμβολα της ψαλτικης, και τα οποια να προερχονται απο το εκτυπωμενο βιβλιο
ΠΡΟΣΟΧΗ: Εαν υπαρχουν διαφοραι εις τας γραμμας (πχ μια να στραβωνει προς τα ανωθι, η δε αλλη προς τα κατωθι), η μεθοδος αυτη θα αποτυχη.
Θα επρεπε ο χρηστης να τροποποιηση επαρκως, δια μεσου rotation, καθ'εκαστον γραμμην.
Εαν δυσκολευεται, τοτε θα επρεπ να αποφυγει την μεθοδον δημιουργειας τοιουτου ειδους σελιδος, και να περιορρισθει εις περισσοτερας υπαρχουσας, αυτουσιως εκτυπωμενας σελιδας.


Δυναται, δηλαδη, οπως επιλεξει περιπου 5 σελιδας αι οποιαι να περιεχουσιν το κατα δυναμιν περισσοτερα σημαδοφωνα.

Το προγραμμα ΑΦΑΙΡΕΙ ΜΟΝΟΝ ΤΟΥ το ΚΕΙΜΕΝΟΝ = lyrics

Ο ΧΡΗΣΤΗΣ ΔΙΔΑΣΚΕΙ το προγραμμα = δηλαδη == το προγραμμα διαλεγει απομονομενους χαρακτηρας, και ο χρηστης το βοηθαει να της ΚΑΤΑΝΟΜΗΣΕΙ ΟΡΘΩΣ == πχ =ταδε χαρακτηρας ειναι ΙΣΟΝ, ο αλλος εναι ΟΛΙΓΟΝ,κοκ

Εαν ΔΕΝ υπαρχει η ΟΝΟΜΑΣΙΑ, ο ΧΡΗΣΤΗΣ ΔΥΝΑΤΑΙ να την ΔΗΜΙΟΥΡΓΗΣΕΙ == πχ == τρομικον κτλ



γ == ΦΑΣΗΣ ΑΝΑΓΝΩΡΙΣΕΩΣ σελιδω
ν

Υστερον, ο χρηστης εισαγει ΟΛΑΣ τας σελιδας, και το προγραμμα τας αναγνωριζει ΜΙΑ ΜΙΑ

το προγραμμα εξαγει εναν ΚΩΔΙΚΟΝ ο οποιος εχει ΚΑΤΑΧΩΡΙΣΕΙ

== την καθε σελιδαν εις ΓΡΑΜΜΑΣ

== και την καθε γραμμην εις ΟΜΑΔΑΣ χαρακτηρων

Η καθε ομαδα ειναι διαφοροποιειτα
=== η εις ΣΥΝΟΛΟΝ χαρακτηρων ανωθεν καποιας συλλαβης κειμενου,
=== η συνολον Μαρτυριας,
=== η συνολον χρονικης αγωγης

Προς το παρον, το προγραμμα ΔΕΝ αναγωριζει Μαρτυριας ηχων
====

δ=ΦΑΣΗΣ ΕΞΑΓΩΓΗΣ ΚΩΔΙΚΟΥ

ιδου παραδειγμα εξαγωγης ενος Συνολου

Ενα ολιγον χωριζεται οριζοντιως εις 13 τεμαχια

(primary.oligon[0,0];kendimata[-3,2];gorgon.mono-gorgon[-5,3])

Το ως ανωθεν εννοει οτι υπαρχει ΟΛΙΓΟΝ επι της βασεως (primary.oligon)
=το δεξι του ακρο του ολιγου αυτου αντιστοιχει με.
(x = 0 ; y = 0)

Ανωθεν αυτου υπαρχουν κεντηματα,
== εχοντα σχεσιν, με το κατωθι ΔΕΞΙΟΝ ακρον αυτων, εις το σημειον 3 #τεμαχια =μοναδες# αριστερα (x = -3) του δεξιου ακρου του ολιγου (x = 0 ); ,
== και 2 #τεμαχια# ανωθεν (y = 2) της βασεως του ολιγου (y = 0)

Ανωθεν των κεντηματων υπαρχει ΓΟΡΓΟΝ
==με το κατωθι ΑΡΙΣΤΕΡΟΝ ακρον αυτου εις το σημειον 5 #τεμαχιων# αριστερα (x = -5) του δεξιου ακρου του ολιγου (x = 0 );
== και 3 #τεμαχια# ανωθεν (y = 2) της βασεως του ολιγου (y = 0)
===================

Τοιουτου ειδους κωδικα εξαγει το Gamera


Ανααθετησις ονομασιων διαφορων σημαδοφωνων
Επειχειρισθη η ΣΥΝΤΟΜΟΣ ονμασια διαφορων κατηγοριων.
Αι κατηγοριαι εισιν ΤΡΕΙΣ
= σημαδοφωνο ΣΥΝΔΙΑΣΜΟΥ (linking neumes)
= σημαδοφωνα ΜΑΡΤΥΡΙΩΝ και ΧΡΟΝΙΚΗΣ ΑΓΩΓΗΣ
= σημαδοφωνα
==== ΠΡΩΤΕΡΕΥΟΝΤΑ ως στηριγματα ἢ επι βασικης γραμμης
==== ΔΕΥΤΕΡΕΥΟΝΤΑ, ως φθοραι, επιγραμματα μαρτυριων, ρυθμικων ποδων, υφεσο-διεσεις, πειγραμματα φθορων, κτλ


Εγινε καποιο λαθος εις την παρουσιασιν περι ονομασιας φθορων.
Δυνατι ο χρηστης να χρησιμοποιησει τον πινακα ο οποιος επισηναπτεται.

Προσοχη == οσαν σημαδοφωνα ΔΥΝΑΝΤΑΙ να εχουν ΔΙΠΛΗΝ χρησιν, μαρτυριας τε και φθορας, ονομαζονται "Martyria-fthora"== το λογισμικον διαφορποιει την λειτρουγριαν αυτων βασει των θεσεων.

Οτι οὐ φερει τιτλον
primary, linking , chronos, martyria-fthora
θεωρειται αὐτομάτως ὡς secondary.

Eπισης, αι αποκλειστικως φθοραι, ου φερουσιν ονομα παρεταιρω.

Αι αποκλειστικως μαρτυρια, φερουσιν συμβολον ΜΙΚΡΟΝ Μ (m) εν τω πινακι, και ονομαζονται "Martyria-"

px
bou diatonic = φθορα bou diatonikou
letter Capital Zo = γραμμα "Z" κεφαλαιον

Να χρησιμοποιηται ο πιναξ διεξοδικως, ινα μη γινονται λαθοι επι τη ονομασια των σημαδοφωνων.



ε = ΧΡΗΣΙΣ του ΔΙΕΞΑΓΩΜΕΝΟΥ κωδικου μετα προγραμματων ψαλτικης γραφης
Υστερον, χρειαζεται προγραμματιστης ο οποιος θα πρεπει να δημιουργησει ΠΙΝΑΚΑΝ, και MACRO, ωστε να μετατρεπεται αυτος ο ΚΩΔΙΚΑΣ εις την γραμματοσειραν του προγραμματος οπου χρησιμοποιει δια να γραφη την ψαλτικην


στ == Προσδοκιες μελλοντος πχ Αναγνωρισης Παλαιογραφιας
Συν τω χρονω, ΑΚΟΜΗ και η χειρογραφος ΠΑΛΑΙΟΓΡΑΦΙΑ, ΨΑΛΤΙΚΗ ΤΕ αλλα και ΓΡΗΓΟΡΙΑΝΗ, θα ΨΗΦΟΠΟΙΗΤΑΙ χαριν εις το Gamera OCR.

Initiators: Association STOUDION, France
(http://stoudion-chant-byzantin.blogspot.fr/)

+++++++++++++
+++++++++++++
ΑΙΤΗΣΙΣ ΟΜΑΔΙΚΟΥ ΣΥΝΤΟΝΙΣΜΟΥ οπτικης αναγνωρησεως κλασσικων εργων

From GKM
Δια να μην ταλαιπωρουνται οι πολλαπλοι εργατες δακτυλογραφησεως
αλλα και δια να μην υποχρωνουμεθα οπως λαμβανωμεν την καθε αυθαιρετον τροποποιησιν κλασικων μαθηματων (πχ, λογου #εμφανων ρυθμικων παροραματων#)

καλο θα ητο οι προγραμματιστες (Μελωδος, ΜΚ, ΒΚ, BZPsaltica, ΒZQ, κλ)

να συντονισουν τας προσπαθειας των
οπως ενταχθη ο ΚΩΔΙΚΟΣ GAMERA OCR
εις τα διαφορα λογισμικα.

Επαλεψα μιαν εβδομαδαν να επαναφερω το λογισμικον εις λειτουργειαν εντος Windows 8.1. Βεβαια, λειτουργει και εντος Linux, και εν μορφη συγχρονοτερα.


Ειχα κι εγω ξεχασει την λετουργιαν του, αλλα, οποιος μελετησει τας διαφορους videoπαρουσιασεις θα καταλαβει σιγα σιγα εως ποιου σημειου θα ητο ικανος να χρησιμοποιησει το λογισμικον.

Αι βιντεοπαρουσιασεις υπαρχνουν ΑΝΩΘΙ


Αρχεια προς ΕΝΑΡΞΙΝ ομαδικης χρησεως του GAMERA

http://www.mediafire.com/download/c...1834_Constantinople_for_GAMERA_OCR_part01.zip

http://www.mediafire.com/download/h...1834_Constantinople_for_GAMERA_OCR_part02.zip



Βαθμος Α == GameroΙσοκρατης :
Χρησιμοποιει το λογισμικον δια απλην ΑΝΑΓΝΩΡΗΣΙΝ.

Εγκαταστει το λογισμικον.
Αποσυμπιεζη τον φακελλον περιεχοντα εικονας εις 300 dpi εκ της Ανθολογιας Γρηγοριου, 1834

Εντοπιζει το αρχειον "classifier_AG_1834_015.xml"

Εκκινει, κατ ΑΚΡΙΒΗΝ σειραν
το λογισμικον Python 2.3
το λογισμικον GAMERA OCR
το λογισμικον psaltiki_gui.pyw

Το δε τελευταιον, "psaltiki_gui.pyw", ειναι το λογισμικον ΑΝΑΓΝΩΡΗΣΕΩΣ

Αι videoπαρουσιασεις 7 και 8 δειχνουν λεπτομερειας χρησεως του
"psaltiki_gui.pyw"
εις το οποιον ΕΙΣΑΓΩΝΤΑΙ
"classifier_AG_1834_015.xml"
και μια σελιδα εκ του βιβλιου (η αναγωσις γινεται ανα ΜΙΑ σελιδα καθε φορα)

Οταν τελειωσει, ο χρηστης εισαγη την ΕΠΩΜΕΝΗΝ σελιδαν.


Εις το τελος, υπαγει εις τον φακελλον και επιλεγει
ΟΛΑ τα ΑΡΧΕΙΑ επιφεροντα την καταληξην
".CODE"

Ετελειωσε την εργασιαν του



Βαθμος Β == GameroΚανοναρχος :
Χρησιμοποιει το λογισμικον δια ομαδοποιησιν του κωδικου
Παραγει εικονας 300dpi ανευ τιτλων και ενδιαμεσου κειμενου


Ομαδοποιησις του κωδικου
Ανοιγει το καθε αρχειον ".CODE" και δημιουργει ενα ενιαιον αρχειον ".txt"

Ευρησκει τροπον να ΔΙΑΦΟΡΟΠΟΙΕΙ καθεκαστον υμνον, εισαγωντας διακριτικον καταληξεως/αρχη επωμενου υμνου

Παραγει εικονας 300dpi ανευ αρχιγραμματων, ανευ τιτλων, ανευ αλλου τινος κειμενου ΕΚΤΟΣ, και εδω υπαρχη εξαιρεσις, του κειμενου ΑΚΡΙΒΩΣ κατωθι καθεκαστου σημαδοφωνου, το οποιον θα ΑΦΑΙΡΕΣΗ το ιδιον το λογισμικον


Δια μεσου του Gamera OCR, παραγει εικονας ΟΛΟΤΕΛΩΣ ανευ κειμενου, προς ευκολοτεραν χρησιν των υπολοιπων.



Βαθμος Γ == GameroΔομεστιχος
Χρησιμοποιει το λογισμικον δια να ΠΑΡΑΓΕΙ, ΥΣΤΕΡΟΝ επιμονου παιδαγωγησεως (training), αρχεια τυπου "classifier.xml"

Ελεγχει τους εξαχθεντας κωδικους δια χονδρα λαθη
Οργανωνει τη εργασιαν κατα βιβλιον
Ανακονωνει σημαδοφωνα τα οποια θα ητο χρησιμα δια αλλας εκδοσεις
Τα σημαντικοτερα στοιχεια κατα την φασην της εκμανθησεως/εκπαιδευσεως

Εις την αρχην καθ εκαστου νεου βιβλιου, ΔΕΝ υπαρχει αρχειον τυπου classifier___.xml
το οποιο περιεχει τας πληροφοριας δια πασαν νεαν αναγνωρησιν.

Τουτον δε το classifier___.xml δημιουργει και αναπτυσει ο χρηστης.

Εις την αρχην, επιλεγει GAMERA OCR => toolkit =>psaltiki
Υστερον, με δεξιο click, επιλεγει "train neumes image" (παντοτε να ΕΝΕΡΓΟΠΟΕΙΤΑΙ η επιλογη REMOVE LYRICS = αφαιρεσις ποιτικου κειμενου)

Ανωθι παρουσιαζεται το παραθυρον PAGE GLYPHS
Κατωθι παρουσιαζεται το παραθυρον μετα της σκαναρισμενης εικονως των 300dpi

Αμεσως, επιλεγει ο χρηστης ενα ΟΛΙΓΟΝ, παντοντες ταυτοχρονως το CONTROL, ωστε να δυνατι οπως επιλεξει και αλλα δυο η τρια ΟΜΟΙΑ σημαδοφωνα

Πρεπει ΠΑΝΤΟΤΕ να επιλεγει τις ΟΛΟΚΛΗΡΟΝ σημαδοφωνον, διοτι, εαν του λειπει εστω και ΜΙΚΡΟΝ τι μερος, η επακολουθουσα ΑΝΑΓΝΩΡΗΣΙΣ θα αποτυχει.

Επικυρωνεται η επιλογην επι τη φαση του ΟΝΟΜΑΖΕΙΝ δε αυτα, και εμφανιζονται αμεσως υστερον μετα ΠΡΑΣΙΝΟΥ χρωματος.
Εαν γινει λαθος εν τη ονομασια, η διορθωνεται αμεσως, η ΑΦΑΙΡΟΥΝΤΑΙ (εικονιδιον μετα ερυθρου Χ) τα σημαδοφωνα, διοτι, ουτως η αλλαως, προκειται να θα ευρεθουν και παλιν αργοτερα


Υστερον, ο χρηστης επιλεγει Classifier ==> Guess ALL
Εμφανιζονται απαντα τα σημαδοφωνα, ητε ΑΡΤΙΩΣ ητε μεταμελισμενα
Ο χρηστης επιλεγει μονον ΟΛΟΚΛΗΡΑ, ΑΚΕΡΑΙΑ σημαδοφωνα.
Επιλεγει ΤΑΥΤΟΧΡΟΝΟΣ ομοια, ΑΚΕΡΑΙΑ σημαδοφωνα, χρησιμοποιωντας το πληκτρον CONTROL

Επι τη ονομαστικη επικυρωση αυτων, τα επιλελεγμενα σημαδοφωνα μετατρεπονται εξ ΕΡΥΘΡΟΥ προς ΠΡΑΣΙΝΟΝ ΧΡΩΜΑ

Ο χρηστης επιταγχυνει τας επιλογας δια την επαναληπτικην χρησιν του GUESS ALL


Ο χρηστης τηρει υπ οψην οτι ο κυριος σκοπος ειναι η συμπληρωσις του αρχειου classifier με περιπου 20 εως 30 περιπτωσεις του καθε σημαδοφωνου.

Το classifier αυπαυξανεται διαδοχικως, απο την εκπαιδευσιν καθε διαφορετικης σελιδος


Κατα συνεπειαν, ΔΕΝ ειναι απαραιτητον να ΕΠΙΚΥΡΟΝΟΝΤΑΙ ΑΠΑΝΤΑ τα ακεραια σημαδωφωνα καθ εσκατου σελιδος, αλλα ΜΟΝΟΝ αυτα τα οποια χρειαζονται ωστε να συμπληρωθη επαρκως το αρχειον classifier.

Εις τουτο συμβαλει η προσεγμενη επιλογη σελιδων, αι οποιαι να περιεχουν τα ποθουμενα σημαδοφωνα.

Επι τη ληξη καθε σελιδος, αποθηκευονται τα επικυρωμενα, ΠΡΑΣΙΝΑ σημαδοφωνα, δια του

File => Classifier glyphs => Save glyphs in classifier

εντος αρχειου μετα αυξηνομενου αριθμου
πχ
Classifier_Anthol_Greg_1834_001

δια την πρωτην σελιδαν,

Classifier_Anthol_Greg_1834_002
δια την δευτεραν, κοκ

Το δε τελευταιον classifier συμπεριλαμβανει oλα τα επικυρωμενα σημαδοφωνα τα οποια ευρισκονται εντος των προηγουμενον.

Τουτον δε το ΤΕΛΕΥΤΑΙΟΝ classifier εστιν αυτο το οποιον θα χρησιμοποιηθη δια την επακολουθουσαν ΑΝΑΓΝΩΡΙΣΗΝ ολοκληρου του βιβλιου, μια σελιδα μετα την αλλη.

Επι τη διαδικασια της ΑΝΑΓΝΩΡΙΣΕΩΣ, επαναλαμβανεται οτι θα γινει χρησις του ΤΕΛΕΥΤΑΙΩΣ αποθηκευμενου Classifier




Βαθμος Δ == GameroΛαμπαδαριος
Προγραμματιστης,
== εντσωματωνει νεα σημαδοφωνα εντος του Gamera
== παραγει ΣΥΝΔΙΑΣΜΟΝ αναμεταξυ του κωδικου Gamera και καποιου υπαρχοντος λογισμικου, του οποιου, κατα πασαν πιθανοτηταν, ισως ειναι και ο δημιουργος.



Βαθμος Δ == GameroMaster

Διδει συνεχειαν με τας ερευνιτικας ομαδας Γερμανιας, ΗΠΑ και Καναδα.....
 

Attachments

  • Copy of OCR_Psaltiki_p_03.png
    Copy of OCR_Psaltiki_p_03.png
    60.5 KB · Views: 62
  • Copy of OCR_Psaltiki_p_04.png
    Copy of OCR_Psaltiki_p_04.png
    62.7 KB · Views: 42
Last edited:

prenumele

Παλαιό Μέλος
Νέα ἔκδοσις OCR Ἑλληνικοῦ Πολυτονικοῦ κειμένου gimagereader 3.0.1
WINDOWS

(netcologne.dl.sourceforge.net/project/gimagereader/3.0.1/gImageReader_3.0.1_qt5_i686.exe)


Copy
(grc.traineddata)
Paste in
(C:\Program Files (x86)\gImageReader\share\tessdata)

Πληροφορίες OCR Πολυτονικὰ Ελληνικὰ καὶ Ψαλτικὴ
(http://analogion.com/forum/showpost.php?p=196021&postcount=2)
(http://analogion.com/forum/showpost.php?p=194757&postcount=5)
(http://analogion.com/forum/showpost.php?p=194816&postcount=7)
 
Last edited:

prenumele

Παλαιό Μέλος
Απο ΓΚΜ
Αι συγχρονοτεραι εκδοσεις
Latest editions of
Gamera OCR
και
Psaltiki Toolkit

Gamera OCR 3.4
for Python 2.7
and wxPython 3.0
32 and 64 bit installers


Gamera_OCR_3dot4py2dot7.zip - 70 MB
(http://www.mediafire.com/download/9a9hvb2l963p2y2/Gamera_OCR_3dot4py2dot7.zip)

32-bit installers - install the following in ORDER:
Δια συστηματα 32bit, εγκαταστησον, κατα σειραν, τα εξης:
01_32_python-2.7.9.msi
02_32_wxPython3.0-win32-3.0.2.0-py27
03 gamera-3.4.2.win-amd64-py2.7
04 psaltiki-1.1.2.win-amd64-py2.7


64-bit installers - install the following in ORDER:
Δια συστηματα 64bit, εγκαταστησον, κατα σειραν, τα εξης:
01_64_python-2.7.9.amd64

02_64_wxPython3.0-win64-3.0.2.0-py27

03 gamera-3.4.2.win-amd64-py2.7
04 psaltiki-1.1.2.win-amd64-py2.7

Πληροφοριαι και videoπαρουσιασεις χρησεως
χρηζοντας παλαιοτερων εκδοσεων
Gamera, Python, wxPython και Psaltiki Toolkit:

Video presentations using older versions of
Gamera, Python, wxPython και Psaltiki Toolkit:
(http://analogion.com/forum/showpost.php?p=201897&postcount=10)
 
Last edited:

Π.Κατσουλιέρης

Παλαιό Μέλος
Από ΓΚΜ:
Αγαπητοι φιλοι

Περι Gamera

Οπως και θα ενθυμεισθαι,

το Gamera ειναι δωρεαν λογισμικον OCR

Το επρογρμματισαμεν εις το παρελθον δια ψαλτικην αλλα ΑΝΕΥ του κειμενου

Αυτο χρειαζεται παραιτερω προγραμματισμον

και με ξεπερνα

Εκαμνα ομως μιαν προσπαθειαν, και απο το τιποτες, καλυτερον αυτο....
Εκαταφερα να εισαγεται και το κειμενον, αλλα θελει προγραμματισμο δια το segmentation του κειμενου
Εχω ετοιμασει αρχειον BASIC

δια 400 dpi και γραφην DIDOT βασει της γραμματοσειρας Elie Dahoun
Το ωραιον ειναι οτι το Gamera επιτρεπει την ευκολον και συντομον ομαδοποιησιν διακεκομμενων χαρακτηρων

Gamera 3.0 documentation
(http://gamera.sourceforge.net/doc/html/)

broken character training
(http://gamera.sourceforge.net/doc/html/training_tutorial.html#training-broken-characters)
Ιδου τα πρωτα αποτελεσματα ΧΩΡΙΣ να εχω καμνει ΕΚΠΑΙΔΕΥΣΙΝ δια το συγκεκριμμενον βιβλιον

Δεν μας ενδιαφερωσιν τα λαθοι εις αυτην την φασιν, αλλα την ΔΥΝΑΤΟΤΗΤΑΝ αυτης της τεχνικης

Ανευ lyrics δουλευει μια χαρα
Καλο θα ητο νε εχωμεν και ενα TRANSFER CODE δια τον Μελωδον

Εις επωμενον μηνυμα, θα σταλουν links δια παρουσιασιν εντος του Μελωδου
Ἀρχὴ OCR τῆς τοῦ Χουρμουζίου Ἀνθολογίας

Initiation to Psaltiki OCR
using an old book:
Anthologia by Chourmouzios

Melodos and Gamera
====


Ἐντὸς τῶν ἀρχείων
Included

=======
Melodos OCR English presentation (4 parts)


(http://www.mediafire.com/download/a..._2013_OCR_Training_Reading_Scales_002.zip.001)

(http://www.mediafire.com/download/t..._2013_OCR_Training_Reading_Scales_002.zip.002)

(http://www.mediafire.com/download/2..._2013_OCR_Training_Reading_Scales_002.zip.003)


(http://www.mediafire.com/download/7..._2013_OCR_Training_Reading_Scales_002.zip.004)

==============
 
Last edited:

Π.Κατσουλιέρης

Παλαιό Μέλος
Χουρμουζίου Ἀνθολογία
ἀρχὴ OCR
Mελῳδὸς
καὶ
Gamera=

ἀρχεία:

ChourmouziosAnthologiaOCR.zip
(178.58MB)
(https://www.sendspace.com/file/4wayvf)

(περιέχει καὶ παρουσίασιν
OCR Melodos
ἑλληνιστί)

=============
Σκοπὸς
ἴνα ἐνταχθῶσιν τὰ μουσικὰ κείμενα ἐντὸς Μελῳδοῦ καὶ BZQ/Pandouris (δύσκολον πρὸς τὸ παρὸν διὰ τὸ MK), ἀσχέτως ὡς πρὸς τὰ λάθη, τὰ ὁποία θὰ ἐπιδιορθοθῦν ἀργότερα, ἀπὸ περισσοτέρους συνεργάτας.

Objective:
To integrate as many OCRed doucuments as possible into melodos and BZQ/Pandouris (MK a bit difficult for the time being), in spite of numerous mistakes, which will be corrected ulteriourly by many more volunteers....
================

Περὶ Gamera OCR Psaltiki Toolkit
(http://analogion.com/forum/showthread.php?p=194757#post194757)

(http://analogion.com/forum/showpost.php?p=201897&postcount=10)
(http://analogion.com/forum/showpost.php?p=179099&postcount=4)

Ἐδημιουργήθη νεώτερον, ἐμπλουτισμένον classifier
(new classifier with more neumes and combined/broken-character neume groups)


Gamera 3.0 documentation
(http://gamera.sourceforge.net/doc/html/)

broken character training
(http://gamera.sourceforge.net/doc/html/training_tutorial.html#training-broken-characters)

=======
 

Π.Κατσουλιέρης

Παλαιό Μέλος
Από ΓΚΜ:
Αγαπητοί φίλοι, με αφορμή το εξής θέμα

(http://analogion.com/forum/showpost.php?p=201897&postcount=10)

Πληροφορούμεθα ἐκ τοῦ ὑπευθύνου

Christoph DALITZ

GAMERA OCR Ψαλτικὴ

ΝΕΟΣ ΣΥΝΔΙΑΣΜΟΣ ΛΟΓΙΣΜΙΚΩΝGAMERA OCR

Psaltiki and Polytonic Greek Toolkits

The following combination works on Windows 7 (64bit):

1) Python 2.7 64 bit for Windows:
(https://www.python.org/ftp/python/2.7.11/python-2.7.11.amd64.msi)

2) wxPython for Python 2.7:
(http://downloads.sourceforge.net/wxpython/wxPython3.0-win64-3.0.2.0-py27.exe)

3) Gamera:
(https://sourceforge.net/projects/ga...4.2/gamera-3.4.2.win-amd64-py2.7.exe/download)


4) OCR toolkit:
(http://gamera.informatik.hsnr.de/addons/ocr4gamera/ocr-1.2.2.win-amd64-py2.7.exe)

5) GreekOCR toolkit:
(http://gamera.informatik.hsnr.de/addons/greekocr4gamera/greekocr-1.0.1.win-amd64.exe)

Concerning the kNN classifier,
wha is the use of
> _group
> _group_part
> _split
>

_group is for training groups of fragmented character parts as explained in the Gamera
training tutorial. _group.part is only used by the classifier internally. DO NOT USE IT.

_split is for character combinations that always look the same, but should be splitted
(not for randomly touching characters). In OCR this is useless, I think, because fixed
character combinations can be trained as such (e.g. as ligatures). It was originally
meant for dealing with note groups representing chords in optical music recognition.

To recognize randomly touching charcters, you can use distance rejection as described
in the paper below*) and then try to split the rejected characters. There is currently however
not yet an automated process integrated into Gamera for this. With some Python programming
experience, it is however not hard to implement.

(http://lionel.kr.hs-niederrhein.de/~dalitz/data/publications/sr09-knn-rejection.pdf)
 

Pappous43

Παλαιό Μέλος

Ἔλαβα τό κάτωθι Π.Μ. καί, ἐπειδή εἶναι γενικοῦ ἐνδιαφέροντος, σᾶς κοινοποιῶ τήν ἀπἀντησίν μου.

Καλημέρα σας και καλή Μεγάλη Τεσσαρακοστή.θα ήθελα να σας ρωτήσω,εάν αυτή την στιγμή δίδεται ή δυνατότητα από το πρόγραμμα να μπορεί να μετατρέπει από αρχείο εικόνας και να αναγωρίζει με ocr(όπως προβλήθηκε στο συγκεκριμένο παράδειγμα) ή εάν είναι σε δοκιμαστική έκδοση.
Σας ευχαριστώ εκ των προτέρων.

Εὐχαριστῶ, Καλή Τεσσαρακοστή ἐπίσης.

Τό πρόγραμμα, σήμερα, εἶναι ὅπως φαίνεται στό παράδειγμα, δηλαδή:
1)Ὁ χρήστης ἔχει σκανάρει κάποια σελίδα.
2)Μέ τό πρόγραμμα Gamera OCR Psaltiki Toolkit δημιουργεῖται κώδιξ, δηλ. ἀρχεῖον κειμένου.
3)Μέ τό BZQ (θά ἀνέβη ἡ νέα ἔκδοσις συντόμως), δημιουργεῖται ἀρχεῖον .pan (Pandouris).
4) μέ τό Πανδουρίς τυπώνομε τήν παρτιτούρα
καί μέ τό BZQ ἀκοῦμε τήν παραλλαγήν.

ΣΗΜΕΡΑ, γίνεται περίπου 99% μετατροπή τῶν ΣΥΝΗΘΕΣΤΕΡΩΝ συμβόλων κτλ.
Θά ἠθελα σίγουρα νά περιμένω μερικάς ἡμέρας ἀκόμη διά νά τό διανείμω διά δοκιμάς καί σχόλια.
Ἐν τῷ μεταξύ, διά νά ἐξοικονομηθῇ χρόνος,
θά πρότεινα είς ὅσους ἐνδιαφέρονται, νά προετοιμάσουν τό βῆμα 2) ἀνωτέρω.
Τό παρόν θέμα ἔχει ἀρκετά στοιχεῖα διά τό Gamera OCR Psaltiki Toolkit
 
Last edited:

Π.Κατσουλιέρης

Παλαιό Μέλος
Από ΓΚΜ:
Aἴτησις ὁμαδικῆς συνεργασίας εἰκονικῆς ἐπεξεργασίας κλασσικῶν βιβλίων, ἀρχόμενοι διὰ τοῦ Α' τόμου τῆς Ἀνθολογίας τοῦ Χουρμουζίου
Προσοχή τὰ ἀρχεῖα sendspace ἔχωσιν ἡμερομηνίαν λήξεως σύντομον (7
ἡμερῶν) καταβάσατε ΑΜΕΣΩΣ τὰ ἀρχεῖα αὐτὰ
πχVideoπαρουσιάσεις(https://www.sendspace.com/file/dhs5u3) (215 Mb)
Εἰκόναι Ἀνθολογίας πρὸς
ἐπεξεργασίαν(https://www.sendspace.com/file/fy921w) (52.38MB)
=====
====
Ἀγαπητὲ συνάδελφε
Σκοπὸς τῆς παρούσης ἐργασίας ἐστί ἡ καθαρὴ καταγραφὴ ὑπὸ
ἠλεκρονικῆς μορφῆς τῶν αὐτουσίων κλασσικῶν ἐκδόσεων ἄνευ ἀλλοιώσεως τινὸς τοῦ περιεχομένου.Διὰ νὰ ἀποφύγωμεν τὴν κουραστικὴν πληκτρολόγησιν,
ὄσον ἀφορᾶ τὰς ἐκτυπωμένας τουλάχιστον ἐκδόσεις,θὰ γίνει χρῆσις τῆς OCR
== optical character recognition==ὀπτικῆς ἀναγνωρήσεως τῶν χαρακτήρων
====
Διὰ ὄσους δὲν ἔχουν τὸ λογισμικὸν Μελωδός, τὸ ὁποίον διαθέτη τοιαύτην ἰκανότηταν δύνανται ὄπως συμβαλοῦσιν εἰς ἀνάλογον καταγραφὴν ἐντὸς ἄλλων λογισμικῶν
Ἡ διαδοχικὴ σειρὰ ἐπεξεργασίας εἶναι ἡ ἐξῆς(http://analogion.com/forum/showpost.php?p=212568&postcount=18)
Τό πρόγραμμα, σήμερα, εἶναι ὅπως φαίνεται στό παράδειγμα, δηλαδή:
1)Ὁ χρήστης ἔχει σκανάρει κάποια σελίδα.
2)Μέ τό πρόγραμμα Gamera OCR Psaltiki Toolkit δημιουργεῖται κώδιξ,
δηλ. ἀρχεῖον κειμένου (.txt).
3)Μέ τό BZQ (θά ἀνέβη ἡ νέα ἔκδοσις συντόμως), δημιουργεῖται
ἀρχεῖον .pan (Pandouris).
4) μέ τό Πανδουρίς τυπώνομε τήν παρτιτούρα καί μέ τό BZQ ἀκοῦμε τήν
παραλλαγήν.
Διὰ ἀρίστην ἀπόδοσιν τοῦ Gamera OCR, χρειάζεται ὁμοιογενὴς ἐπεξεργασία τῶν εἰκόνων Εἰς αὐτὸ δύνανται ὄπως συμβάλλουσιν ἄπαντες, ἀναλαμβάνοντας καθ'ἔκαστος τὴν ἐπεξεργασίαν 100 εἰκόνων.Αἱ εἰκόναι τοῦ Α τόμου τῆς
ἀνθολογίας τοῦ Χουρμουζίου ἔχωσιν ἤδη ἐπεξαργασθεῖ ἐν μέρῃ ἀποβλέπωντας αὐτὸν τὸν σκοπόν. Χρήζουσιν ὄμως ὅλαι περαιτέρω ἐπεξεργασίας.
==============
Ἰδοὺ ἡ διεύθυνσις τοῦ ἀρχείου τῶν εἰκόνων καὶ ἀντίστοιχον ἀρχεῖον τοῦ Gamera
(https://www.sendspace.com/file/dhs5u3) 215 Mb

Ἰδοὺ ἡ διεύθυνσις τοῦ ἀρχείου videoπαρουσιάσεως τῆς ἀναμενούσης ἐπεξεργασίας εἰκόνων ====
Ἐπίλεξον τὰς 100 εἰκόνας τὰς ὁποίας θὰ ἀναλάβεις καὶ ἀντέγραψον αὐτὰς ἐντὸς νέου φακέλλου
====
A Γενικότητες
A1

ΘΕΩΡΩΜΕΝ ΑΧΡΗΣΤΑ
== τὸ ποιητικόν κείμενον
== τὰς ἀρκτικὰς μαρτυρίας
== τίτλους κτλ

ΟΥΤΩΣ
δημιουργῶμεν ἀρχεῖα μετὰ
ΣΒΗΣΜΕΝΩΝ
== τῶν ἀρκτικῶν μαρτυριῶν
== τῶν τίτλων κτλ
== τοῦ γραφικοῦ θορύβου
ὄπου καὶ νὰ ὑπάρχουν
=====
B
Δημιουργεία εἰκόνων ἄνευ ποιητικοῦ κειμένου
ἤτη ἀφαίρεσις ποιητικοῦ κειμένου διὰ τοῦ Gamera OCR
Χρησιμοποιῶμεν κατάλογον ὀνομασίας εἰκόνων πρὸς εὐκολοτέραν εὔρεσιν καὶ
μετονομασίαν μετατροπισθέντων εἰκόνων=====ἄνοιξον τὰ τοῦ Gamera OCR μετὰ τῆς ἀκριβοῦς χρονικῆς διαδοχῆς (Python ὡς administrator) ἄνοιξον εἰκόνα ἀπομνημόνευσον τὸν τίτλον ὀνομασίας τῆς εἰκόνως διὰ μελλοντικὴν χρῆσινἐπίλεξον τὰς παραμέτρους ὄπως καὶ εἰς τὴν videoπαρουσίασην
ἀποθήκευσον μετατρέποντας τὸν προμνημονευθεῖσαν τίτλον ὀνομασίας τῆς εἰκόνως διὰ τῆς προσθήκης μιᾶς ἀρχικῆς παύλας
===
Γ ἐπεξεργασία εἰκόνως ἐντὸς PAINT
ΣΒΗΝΩΜΕN
== τὰς ἀρκτικὰς μαρτυρίας
== τοὺς τίτλους κτλ
== τὸν γραφικὸν θόρυβον ὄπου καὶ νὰ ὑπάρχουν αὐτὰἀλλὰ καὶ τὸ ἐναπωμήναντι, ἢτη, ποιητικόν κείμενον
ΟΥΤΩΣ,
== διαχωρίζωμεν κεκολλημένα σημαδόφωνα καὶ μαρτυρίας== συνάπτωμεν διακεκομμένα σημαδώφωνα καὶ μαρτυρίας Τέλος κάμνωμεν ἐξαγωγὴν τοῦ ἀρχείου μετὰ ἰδίου ὀνόματος, ἀντικαταστῶντας οὔτως τὸ πρότυπον
Tὰ ἀρχεία ἔχωσιν μεγάλον μέγεθος, πέριξ τοῦ 1MB καθ' ἔκαστον
Ἡ σμίκρυνσις θὰ ἐπρέπε νὰ διεξαχθῇ κατὰ τὸν ἐξῆς συγγεκριμμένον τρόπον
=
Ἐὰν τυχὸν προκείψη δυσκολία, συσσώρευσον τὰς εἰκόναςἐντὸς ἀρχείου zip
MIKROTEPON τῶν 300Mbκαὶ φόρτωσον ἐπὶ τοῦ (https://www.sendspace.com/)
ΔΕΝ χρειάζεται νὰ ἀνοίξεις λογαριασμόν
Τὸ ἀρχείον ὄμως ἐξουδετερώνεται ἐντὸς ὀλίγων ἡμέρῶν Κατὰ συνέπειαν, πρέπει νὰ δημοσιεύσης τὸν σύνδεσμον ἀμέσως διὰ νὰ κατεβάσωμεν τὸ ἀρχείον
ἐγκαίρως=====
Διὰ ὄσους δὲν δυσκολεύωνται, ἡ σμίκρυνσις, ἐπαναλαμβάνεται, θὰ
ἐπρέπε νὰ διεξαχθῇ κατὰ τὸν ἐξῆς συγγεκριμμένον τρόπον
=====
Δ
Μετατροπὴ εἰς
3438 χ 4506 pixels, 300 dpi, .png διὰ τοῦ λογισμικοῦ
irfanview (http://www.irfanview.com/) (εἶδε videoπαρουσίασην)
32bit
(http://download.cnet.com/IrfanView/?part=dl-&subj=dl&tag=button)

32bit
(http://download.cnet.com/IrfanView-64-bit/3000-2192_4-76444710.html?part=dl-&subj=dl&tag=button)
=====
Συσσώρευσον τὰ ἀρχεῖα ἐντὸς zip καὶ ἀπέστειλον αὐτὰ
========
Ε
OCR ἐντὸς Gamera καὶ ἐξαγωγὴ κωδηκοῦ
======
ΣΤ
ἔνταξις κωδηκοῦ Gamera ἐντὸς Πανδουρίδος καὶ BZQ
====
Ζ
Διὰ ἄλλα βιβλία χρῆσις τοῦ
Scantailor καὶ ἐπαναφωρὰ τῶν εἰκόνων εἰς 300 dpi:ἀξιοσημείωτον χρειάζονται μόνον 5 γραμμαὶ ἐκτυμπωμένου ψαλτικοῦ κειμένου ἀντὶ τῶν συνήθει
6 γραμμῶν ἐκτυπωμένου κειμένου γραμμάτων διὰ τὴν ὀρθὴν ἀρχικὴν
προσδιόρισην τῶν dpi
 

Pappous43

Παλαιό Μέλος
Ἔχω μίαν μικράν ἐπιφύλαξιν ἐάν πράγματι πρέπει νά ἀφαιρέσωμεν καί τήν Ἀρκτικήν Μαρτυρίαν.Νομίζω ὅτι τό πρόγραμμα Gamera OCR Psaltiki Toolkit ἀναγνωρίζει ταύτην.
Βεβαίως ὁ ΓΚΜ λογικῶς ἐννοεῖ ὅτι θά γίνη κατόπιν συμπλήρωσις τῆς παρτιτούρας είς τόν Μελωδόν ἤ είς τό δωρεάν Πανδουρίς ὅπου ἐκεῖ θά γραφῇ ἡ Ἀρκτική Μαρτυρία καί τό ποιητικόν κείμενον.

Γράφω τήν παροῦσαν προειδοποίησιν διά τήν περίπτωσιν ὅπου θέλει κάποιος ἁπλῶς νά σκανάρῃ κάτι καί νά άκούση τήν παραλλαγήν (BZQ) μόνον.

Τέλος, δύναται ὁ χρήστης νά πληκτρολογήσῃ τόν ἀντίστοιχον κωδικόν τῆς Ἀρκτικῆς Μαρτυρίας :
- ἤ ἐντός τοῦ ἀρχείου τοῦ κώδικος OCR (.OCR ἤ .code ἤ .txt).
- ἤ ἐντός τοῦ ἀρχείου .bzq
 
Top