[Ανακοίνωση] Ο Σημασιολογικός Ιστός ως Μέρος της Λύσης του Προβλήματος

ATHANASSIOS

Αθανάσιος Χατζής
#1
Αγαπητοί αδελφοί-συνάδελφοι
όπως έλεγε κάποτε και ο Sir Tim Berners Lee, εφευρέτης του διαδικτύου, θα απογειωθούμε στα 50000μ για να κάνουμε κάποιες επισημάνσεις. Δέστε τις ζώνες σας, φύγαμε.....

ΔΙΑΚΡΙΣΗ
Πριν προχωρήσω στην ανάλυση θα ήθελα να ξεκαθαρίσω ότι υπάρχουν δύο βασικά θέματα στην οργάνωση του ψηφιακού υλικού

  • Περιγραφή του περιεχομένου (content) - αναφέρθηκαν εκτενώς πολλά μέλη
  • Γνωστική αναπαράσταση και εξαγωγή των δεδομένων (Knowledge Representation and Inference)

Εδώ θα ασχοληθούμε κυρίως με το δεύτερο και θα το περιγράψουμε ως μοντέλο οργάνωσης και διαχείρισης των δεδομένων. Νομίζω ότι οι επισημάνσεις που έγιναν έως τώρα δεν είχαν πλαίσιο αναφοράς και σύνδεσης με τον τομέα της πληροφορικής.

ΕΙΣΑΓΩΓΗ

Ορισμένοι θα γνωρίζουν την προσπάθεια να δώσω μια πιο επιστημονική μορφή ανοίγοντας τον Ιούνιο το θέμα ("Μητρώο Δεδομένων Εκκλησιαστικής Βυζαντινής Μουσικής"). Εκεί θα βρείτε ορισμένους από τους συνδέσμους που επισκέφτηκα για το ποια θεωρώ ότι είναι η κατάσταση σήμερα στην αρχειοθέτηση ψηφιακών δεδομένων στις ηλεκτρονικές πια βιβλιοθήκες (βάσεις δεδομένων). Αυτά δεν είναι θεωρία είναι το πως λειτουργούν σήμερα σύγχρονες ψηφιακές βιβλιοθήκες συμπεριλαμβανομένων και των πολυμέσων βασισμένες σε πρότυπα διαλειτουργικότητας.

ΠΕΡΙΓΡΑΦΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ

Αλλά αυτά για τις βιβλιοθήκες το δικό μας πρόβλημα είναι πιο σύνθετο, ας δώσω ορισμένες βασικές παραμέτρους για να γίνω κατανοητός και ας ξεκινήσω από τις ψηφιακές βιβλιοθήκες που αναφέρθηκα παραπάνω:


  • Συζητάμε για την οργάνωση υλικού στο Αναλόγιο ή γενικότερα σε μια κεντρική βάση-βιβλιοθήκη Βυζαντινής Μουσικής (ψηφιακών δεδομένων)
Εδώ μπαίνουν πολλά θέματα, ποιος την ελέγχει, πως ενημερώνεται, πως συντονίζεται η καταχώρηση, με τι πρότυπα κλπ..... Δεν θα επεκταθώ άλλο, όλοι μας ονειρευόμαστε κάτι τέτοιο για πολλούς και διαφορετικούς λόγους και όλοι όσοι συμμετέχουν ενεργά στην ενότητα αυτή (Οργάνωση υλικού) έχουν καταθέσει τους προβληματισμούς και τις δυσκολίες του εγχειρήματος. Ας κοιτάξει κανείς τι προσπάθεια και πόσα έχουν ξοδευτεί για να υπάρχουν μεγάλες ψηφιακές βιβλιοθήκες.


  • Η δεύτερη βασική παράμετρος είναι ότι υπάρχουν ήδη ψηφιακές βάσεις δεδομένων και μάλιστα πολυμέσων
    • Υπάρχουν στο Internet ψηφιακές βιβλιοθήκες-βάσεις δεδομένων με θέμα την Βυζαντινή Μουσική (αρχεία ήχου, video, βιβλία, δημοσιεύσεις, εικόνες,κλπ)
    • Είναι σίγουρο ότι πολλοί χρήστες στο αναλόγιο διαθέτουν από Gigabytes μέχρι Terabytes ψηφιακού υλικού πάνω στη Βυζαντινή Μουσική στους σκληρούς δίσκους στο σπίτι τους. Κάθε ένας από εμάς έχει οργανώσει το ψηφιακό του αρχείο με κάποιο τρόπο. Ο πλέον απλός και γρήγορος είναι η ιεραρχική δόμηση σε φακέλους, υποφακέλους και ονόματα αρχείων.

Είναι προφανές ότι καθένας θα ενδιαφέρεται να κρατήσει την συλλογή του, αλλά παράλληλα να έχει την δυνατότητα να την εμπλουτίσει με καινούργιο υλικό, να έχει την δυνατότητα να ανταλλάξει και να μοιραστεί δεδομένα με τους άλλους και κυρίως να την εκσυγχρονίσει στον τρόπο αναζήτησης, καταχώρησης, και διαχείρισης. Πως θα γίνει αυτό ;

Είναι ευνόητο για όσους καταλαβαίνουν ότι το (1) έρχεται σε σύγκρουση με το (2) γιατί το (1) βασίζεται σε μοντέλο κεντρικής διαχείρισης και το (2) σε μοντέλο peer-to-peer .

Η ΠΑΡΟΥΣΑ ΚΑΤΑΣΤΑΣΗ

Φυσικά θα ήταν αδιανόητο να πιστέψει κανείς ότι δεν έχουν ασχοληθεί με τέτοια θέματα εταιρείες κολοσσοί και κάθε είδους ερευνητές. Το θέμα απασχολεί κυρίως τις μεγάλες εταιρείες που θέλουν να διαχειριστούν έξυπνα και αποτελεσματικά τα resources τους. Όμως έχουν εμφανιστεί και λύσεις λογισμικού που καλύπτουν και τις προσωπικές ανάγκες του καθένα στη διαχείριση ψηφιακών δεδομένων. Αυτές όλες οι λύσεις πέφτουν σε ένα ή περισσότερους τομείς της πληροφορικής (information science - informatics) και μπορούν να θεωρηθούν παρακλάδια του τομέα Information Management:

Content Management System
Data Management
Document Management System
Domain Knowledge
Enterprise Content Management
Knowledge Management
Personal Information Management

Και τώρα ας πάμε στο πως διασυνδέονται το (1) με το (2). Ας ξεκινήσω με το (2)

2α) Directory Structure
Ουσιαστικά αυτό που κάνει κάποιος όταν ταξινομεί με βάση αυτό το σύστημα αρχειοθέτησης είναι να δίνει έμμεσα knowledge tags (ας πούμε ότι κολλάει ετικέτες) βάση των οποίων κάνει πιο εύκολη την αναζήτηση (λέξεις κλειδιά) και εύρεση των αρχείων. Τις άλλες πληροφορίες για την περιγραφή του αρχείου τις βάζει είτε στο όνομα, είτε εντός του αρχείου.

2β) Document Management System (DMS)
Εδώ συνήθως πρόκειται για βάση δεδομένων, συνήθως σχεσιακή (RDBMS), η οποία διαχειρίζεται τις πληροφορίες σχετικά με το κάθε αρχείο, καθώς και μπορεί και να συνδέει τα αρχεία είτε με συνδέσμους στη θέση την οποία βρίσκονται, είτε και με μορφή blobs - data streams (όλα τα αρχεία γίνονται copy μέσα στη βάση). H σχεσιακή βάση του Νίκου του Δεσπότη και άλλων που έχουν βάλει στο internet κάνει αυτό που σας περιέγραψα. Όπως έχετε καταλάβει στην περίπτωση (2α) και (2β) το πρόβλημα είναι τι μοντέλο χρησιμοποιεί κανείς για τις σχεσιακές βάσεις για να περιγράψει τα δεδομένα καθώς και τι ονομασίες δίνει στα knowledge tags και στα αρχεία.

Για να συμφωνήσουν λοιπόν όλοι στις ονομασίες και στα μοντέλα χρησιμοποίησαν τα λεγόμενα ανοιχτά πρότυπα, τέτοια υπάρχουν πολλά και είναι του τύπου που σας περιέγραψα σε άλλο μήνυμα. Αυτά μπορούν να οδηγήσουν σε κεντρικά συστήματα αρχειοθέτησης, όμως το πρόβλημα παραμένει μιας και ο καθένας θα πρέπει να κάθεται να μετατρέψει όλα του τα δεδομένα σε αυτή τη μορφή για να μπορέσει να τα συσχετίσει με την κεντρική βάση και να ανταλλάξει δεδομένα. Φυσικά δεν λύνει επίσης το πρόβλημα της κεντρικής διαχείρισης. Σε αυτήν την κατεύθυνση κινούνται οι βάσεις δεδομένων που διαχειρίζονται τα δεδομένα σε XML μορφή.

Η ΛΥΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΘΕΩΡΗΤΙΚΑ

Σε μεγάλο μέρος έχει δοθεί από τον δημιουργό του WWW, Tim Berners Lee, και από άλλους ερευνητές του W3C του συντονιστικού οργάνου που οργανώνει την έρευνα και την διαχείριση του παγκόσμιου ιστού και ακούει στο όνομα semantic web. Πως βρίσκει αυτό λοιπόν εφαρμογή στα δικά μας; Πριν ξεκινήσω την σύντομη περιγραφή, να πω ότι η προσπάθεια των «Διαλόγων της Συμβολής» με τις υπερσυνδέσεις (Hyperlinks) στο μήνυμα του Νεοκλή είναι σε αυτή την κατεύθυνση.

Το κλειδί στην λύση είναι να μπορεί κάποιος να συσχετίσει δομημένα δεδομένα με συγκεκριμένο τρόπο από διαφορετικές πηγές (κατανεμημένα) και να βασίζεται σε ανοιχτό πρότυπο. Αν όλοι εκθέτουν, μοιράζουν και συνδέουν τα δεδομένα τους με τον ίδιο τρόπο τότε θα υπάρχουν διασυνδέσεις για να μπορεί να ψάξει και να βρει κάποιος την πληροφορία σε οποιοδήποτε μέρος υπάρχει αυτή διαθέσιμη στο διαδίκτυο. Αυτό υλοποιεί το W3C και ονομάζεται linked data. Για να δημοσιεύσει και να συνδέσει κάποιος δεδομένα με αυτόν τον τρόπο θα πρέπει να ακολουθήσει συγκεκριμένα πρότυπα του W3C. Φυσικά όπως υπάρχει η SQL γλώσσα στις σχεσιακές βάσεις δεδομένων για αναζήτηση, έτσι και σε αυτές τις κατανεμημένες βάσεις δεδομένων υπάρχει η (SPARQL).

Το δεύτερο βασικό στοιχείο του semantic web είναι το ontology. Αυτό είναι πρακτικά ένα γράφημα με κόμβους και τις διασυνδέσεις θα μπορούσε να είναι απλά και ένα δέντρο ιεραρχικά ταξινομημένο αυτό όμως δίνει περισσότερες δυνατότητες και ευελιξία. Όπως μπορείτε να φανταστείτε σε κάθε τομέα και για κάθε περίπτωση κάποιος φτιάχνει ένα τέτοιο ontology. Για εμάς μιλάμε πιο γενικά για Music ontology και ειδικότερα για Byzantine Music Ontology. Αυτό αγαπητοί συνάδελφοι είναι από τα πρώτα που πρέπει να φτιαχτεί και ευχαρίστως να βοηθήσω δεν νομίζω ότι έχει κάνει κανείς τέτοιο εγχείρημα.

Στο "Byzantine Music Ontology" λοιπόν, το Google βγάζει ότι δεν βρέθηκαν αποτελέσματα, χρειάζεται να συνδεθούν τα ψηφιακά δεδομένα με τον τρόπο του "linked data".

ΕΠΙΛΟΓΟΣ

Γνωρίζω ότι σας είχα προτείνει να ξεκινήσουμε με μια σχεσιακή βάση δεδομένων, και αυτό καλό είναι για ξεκίνημα, αλλά μελετώντας περισσότερο το semantic web συνειδητοποιώ ότι σίγουρα ο δρόμος για την οργάνωση των δεδομένων θα περάσει από εκεί. Σήμερα είμαστε ακόμα κολλημένοι σε αρχεία και φακέλους και μηχανές αναζήτησης βασισμένες σε σχεσιακές βάσεις δεδομένων. Το semantic web έχει 10 χρόνια που εκκολάπτει αυτά που σας περιέγραψα και νομίζω ότι όλο και περισσότεροι κατανοούν ότι αυτό είναι το μέλλον του internet. Παλιά μιλούσαμε για ανοιχτό λογισμικό, σήμερα μιλάμε και για ανοιχτά δεδομένα και είναι η προτροπή του Tim Berners Lee και πολλών άλλων για να διακινούνται ελεύθερα τα δεδομένα στο διαδίκτυο. Ίσως έτσι έχουμε περισσότερες πιθανότητες για να γίνουμε μια καλύτερη, ευνομούμενη κοινωνία. Θα συνεχίσω τις ανακοινώσεις σε αυτό το θέμα όταν έχω περισσότερα να σας περιγράψω σχετικά με την υλοποίηση.

Σας ευχαριστώ για την προσοχή και το ενδιαφέρον σας

Αθανάσιος Ι. Χατζής, PhD
BSc Computer Science,
MSc Artificial Intelligence,
PhD Speech Technology (Neural Networks & Pattern Recognition)
http://healis.eu
http://athanassios.gr
 

Dimitri

Δημήτρης Κουμπαρούλης, Administrator
Staff member
#2
Πάρα πολύ ενδιαφέρον αγαπητέ Αθανάσιε, ευχαριστούμε πολύ. Θέλει αρκετό διάβασμα αλλά από μια πρώτη ματιά υπόσχεται πολλά. Έχεις ήδη υλοποιήσει κάτι σχετικό; Υπάρχει η τεχνολογική υποδομή για κάτι τέτοιο είναι σε πειραματικό/ερευνητικό επίπεδο ακόμα; Η ευελιξία του μοντέλου σε σχέση με τις σχεσιακές βάσεις είναι πολύ ελκυστική. Δεν φαίνεται να αποκλείει μάλιστα τη χρήση σχεσιακού τρόπου αλληλεπίδρασης (SQL interface) ή άλλων τρόπων π.χ. να μπορείς να κάνεις κατάλογο XML, text κτλ. αν καταλαβαίνω καλά, επάνω στα αλληλένδετα δεδομένα (linked data). Αυτό που θα μου άρεσε και ίσως και σε άλλους είναι να έχω και ένα σύστημα που θα αλληλεπιδρά με τον διαδικτυακό κατάλογο και θα δημιουργεί ένα ιεραρχικό δέντρο (με κάποια στάνταρντ ή έστω μία από ένα σετ στάνταρντ ταξινομήσεις) όπου θα μπορώ να αποθηκεύω τα δεδομένα μου. Όταν κάτι καινούργιο προστίθεται στη βάση δεδομένων στο διαδίκτυο, θα μπορώ να κάνω απλά ανανέωση των αρχείων μου πατώντας ένα κουμπί και αυτομάτως να προστίθενται στο δίσκο μου [1] με σωστά ονόματα και στο σωστό μέρος και μάλιστα (το κυριότερο) με τον ίδιο τρόπο που τα έχουν και όλοι οι άλλοι που χρησιμοποιούν το ίδιο σύστημα. Βεβαίως τίθενται πρακτικά ζητήματα που δυσκολεύουν την απόλυτη ομοιομορφία της υλοποίησης (διαφορετικά συστήματα, τύποι αρχείων, ποιότητες ηχογράφησης, πηγές, επεξεργασίες κτλ) αλλά έχει ενδιαφέρον νομίζω. Δεν λύνω τη ζώνη μου ακόμα...

[1] Ο δίσκος πάει και αυτός να εγκαταλειφθεί σιγά σιγά, σε λίγο όλα θα αποθηκεύονται στο δίκτυο (cloud) και δεν θα χρειάζεται να κατεβάζουμε τίποτα. Θα είναι όλα εκεί ήδη, διαθέσιμα.
 
Last edited:

despotis.n

Δεσπότης Νικόλαος
#3
Ένα άρθρο από την Καθημερινή για να καταλάβουμε και οι μη ειδήμονες για το Semantic Web :http://portal.kathimerini.gr/4dcgi/_w_articles_kathciv_1_08/09/2010_354285.
Πολύ συνοπτικά...copy/paste από άρθρο.
Τι είναι το Semantic Web;

Το Semantic Web, ή Σημασιολογικός Ιστός αναφέρεται σε ένα σύνολο τεχνολογιών και μεθόδων μέσω των οποίων οι υπολογιστές είναι σε θέση να αντιλαμβάνονται τη σημασία της πληροφορίας που διαχειρίζονται. Σύμφωνα με το όραμα των εμπνευστών του Σημασιολογικού Ιστού, η προσθήκη σημασίας στην πληροφορία του Διαδικτύου θα απελευθερώσει πλήθος δυνατοτήτων για την πιο ευφυή εκμετάλλευση της πληροφορίας αυτής. Ένας χρήστης του Διαδικτύου θα μπορεί, για παράδειγμα, μεταξύ άλλων δυνατοτήτων, να πραγματοποιεί ευφυείς αναζητήσεις, να λαμβάνει δηλαδή από μια μηχανή αναζήτησης αποτελέσματα τα οποία να είναι πιο σχετικά με αυτό που πραγματικά αναζητά.

Με τις υπάρχουσες τεχνολογίες, η αναζήτηση «is Jennifer Lopez single?» θα επιστρέψει μια λίστα με τα singles της καλλιτέχνιδας ενώ αυτό που ζητάει ο χρήστης είναι μια απάντηση ναι/όχι (το παράδειγμα ανήκει στο http://www.trueknowledge.com/). Αυτό γίνεται γιατί οι μηχανές αναζήτησης αντιμετωπίζουν τα ερωτήματά μας ως απλές λέξεις-κλειδιά, αγνοώντας τη σημασία που πιθανόν εμπεριέχουν. Στον κόσμο του Σημασιολογικού Ιστού, το σύστημα θα ήταν σε θέση να απαντήσει σωστά το ερώτημα αυτό αλλά και πιο σύνθετα.
 

ATHANASSIOS

Αθανάσιος Χατζής
#4
Ευχαριστούμε Νίκο, πολύ ενδιαφέρουσα η δημοσίευση αυτή, να σταθώ σε ένα πολύ βασικό σημείο του άρθρου

Για ποιο λόγο δεν έχουμε κάνει αυτό το βήμα;
Επιπλέον, από τη μεριά των χρηστών αλλά και των εταιρειών που δραστηριοποιούνται στο Διαδίκτυο, πέραν της έρευνας δεν υπάρχει καταρχήν κίνητρο για δημοσίευση σημασιολογικά εμπλουτισμένης πληροφορίας. Εξάλλου, απαιτείται αυτός που θα πραγματοποιήσει την επισημείωση να είναι τόσο γνώστης του αντικειμένου όσο και καταρτισμένος τεχνικά ώστε να φέρει εις πέρας σωστά το έργο της επισημείωσης όγκου πληροφορίας.....
Η πρότασή μας βασίζεται σε τρεις βασικούς άξονες:
Ο πρώτος άξονας εντοπίζεται στην ανάγκη για απλοποίηση στη διαδικασία παραγωγής σημασιολογικά εμπλουτισμένης πληροφορίας.
Για να απαντήσω λοιπόν σύντομα στις ερωτήσεις του Δημήτρη, υπάρχει πληθώρα λογισμικού-εργαλείων για να γίνει αυτό το βήμα, και μάλιστα ελεύθερα και δωρεάν, τα οποία συνεχώς εξελίσσονται τουλάχιστον εδώ και δέκα χρόνια. Το θέμα είναι πως τα συνδιάζεις, πως απλοποιείς την διαδικασία, και πως τελικά δίνεις κίνητρο στους απλούς χρήστες, που τις περισσότερες φορές είναι φορείς ενός συγκεκριμένου τομέα να ξεκινήσουν να λειτουργούν σημασιολογικά, να μπορούν εύκολα και γρήγορα να επισημειώνουν, να συνδέουν την πληροφορία, όπως άλλωστε ήδη το κάνουν στο σκληρό δίσκο και στα κοινωνικά δίκτυα.
Ας πάρουμε για παράδειγμα την Wikipedia, πέτυχε γιατί είναι βασισμένη στη συλλογική προσπάθεια όλων και έχει απλούστατη διαδικασία για να προσθέσει κάτι κάποιος. Όλοι έχουν όφελος και για αυτό όλοι συνδράμουν ο καθένας ότι μπορεί.
Το ζητούμενο είναι λοιπόν να δημιουργηθεί μια ομάδα κυρίως πληροφορικών, μαθηματικών για να υλοποιήσουμε και να απλοποιήσουμε την διαδικασία με την οποία θα μπορεί ο καθένας να συμπληρώσει, να διασυνδέσει πληροφορία που είναι σχετική με την Βυζαντινή Μουσική. Έκανες μια προσπάθεια να το περιγράψεις, είναι καλή, αλλά στην πράξη φυσικά απαιτείται πολύ κόπος και αγώνας για το εγχείρημα από αυτή την ομάδα.
Αναφέρθηκε κάτι για επιδότηση, να πω ότι θα μπορούσε να αποτελέσει ίσως και κάτι αρκετά καινοτόμο με προεκτάσεις επιχειρησιακού μοντέλου. Προσωπικά είμαι σε αναζήτηση συνεργασιών με πανεπιστήμια και ιδιωτικούς φορείς σε Ελλάδα και εξωτερικό. Αν υπάρχει κάποια καλή πρόταση να τη συζητήσουμε. Θα μπορούσαμε επίσης να δημιουργήσουμε ομάδα ανοιχτού λογισμικού πάνω σε αυτό που συζητάμε, αυτό έχω κατά νου ανεξάρτητα της οικονομικής ενίσχυσης.

Φιλικά

Αθανάσιος
 

Dimitri

Δημήτρης Κουμπαρούλης, Administrator
Staff member
#5
Το ζητούμενο είναι λοιπόν να δημιουργηθεί μια ομάδα κυρίως πληροφορικών, μαθηματικών για να υλοποιήσουμε και να απλοποιήσουμε την διαδικασία με την οποία θα μπορεί ο καθένας να συμπληρώσει, να διασυνδέσει πληροφορία που είναι σχετική με την Βυζαντινή Μουσική.
Με ενδιαφέρει πολύ αυτή η ιδέα. Όσο περισσότερο διαβάζω για σημασιολογική βάση δεδομένων για την Ψαλτική τόσο ενθουσιάζομαι. Η μεγάλη πρόκληση είναι το κατά πόσο μπορεί να απλοποιηθεί η διαδικασία ώστε απλοί χρήστες να μην αποκαρδιώνονται κατά την προσθήκη δεδομένων. Δεν ξέρω εάν θα είχε νόημα να ξεκινήσουμε ένα πιλοτικό πρόγραμμα μικρού μεγέθους π.χ. μόνο δεδομένα για τους ψάλτες του Πατριαρχικού ναού σαν πυρήνα, να τα βάλουμε σε μια σημασιολογική βάση στο server του analogion.com (http://s3db.org/ φαίνεται να είναι μια δωρεάν και καλή αρχική πρόταση) και να πάρουμε λίγη εμπειρία από το σύστημα στην πράξη. Ή να παίξουμε με το demo σύστημα της s3db κατευθείαν για δοκιμή.
 
Last edited:

ATHANASSIOS

Αθανάσιος Χατζής
#6
Δημήτρη το είδα το μήνυμα για το s3db πιστεύω όταν τελειώσω κάτι που φτιάχνω στον ιατρικό χώρο να μπορέσω να ασχοληθώ περισσότερο....
Όπως έλεγα κάπου αλλού χρειάζεται καταρχήν να φτιαχνούν vocabularies για την ψαλτική, ψαλτικά standards, έτσι ώστε αυτά να χρησιμοποιηθούν στον σημασιολογικό ιστό. Θα πρέπει να συμφωνήσει η ψαλτική κοινότητα να χρησιμοποιούμε την ίδια ορολογία για την περιγραφή του υλικού και να είναι φυσικά πολυγλωσσικό. Ο Νίκος ο Δεσπότης και άλλοι έχουν κάνει προσπάθειες προς αυτήν την κατεύθυνση με τα look up tables που χρησιμοποιούν στις βάσεις τους. Αυτά μπορούν να συζητηθούν και σε συνέδρια ψαλτικής, είναι σημαντικό πιστεύω να γίνει ένα ξεκίνημα. Επίσης χρειάζεται και ένα μοντέλο συσχέτισης των όρων π.χ. ιεραρχικό, graph, κλπ. Για παράδειγμα ο Ορθρος και τα μέρη αυτής της ακολουθίας.

Το πιο σημαντικό βήμα στην υλοποίηση είναι να γίνει βάσει εργαλείων που θα διανέμονται δωρεάν στον χρήστη αυτόματη περιγραφή του υλικού που διαθέτει ή αυτόματη περιγραφή σε ένα ιστότοπο που περιέχει υλικό ψαλτικής. Αυτό όμως προυποθέτει ότι υπάρχει ontology, vocabulary, κλπ, κλπ..... Το πρόβλημα που υπάρχει σήμερα με κάθε βάση πολυμέσων, με κάθε συλλογή αρχείων είναι ότι ο κάθε χρήστης έχει κάνει μια δική του αυθαίρετη περιγραφή του αρχείου ή έχει δημιουργήσει εγγραφές πάλι με ένα δικό του τρόπο. Αυτό δεν είναι κακό, μπορεί να είναι πρακτικό αλλά φυσικά το πρόβλημα είναι όταν θέλουμε να ανταλλάξουμε αρχεία μεταξύ μας. Ο συσχετισμός δεν είναι εύκολη υπόθεση για αυτό προκύπτουν τα standards. Και για αυτό ξεκινήσαμε εδώ στο ψαλτολόγιο να ερευνούμε τι χρησιμοποιήσανε π.χ. για βιβλιοθήκες, κλπ.

Επίσης πέραν του συσχετισμού δεν είναι καθόλου πρακτικό και είναι μάλιστα ιδιαίτερα κοπιαστικό να κάθεται κάποιος και να ονοματίζει αρχεία ή για κάθε αρχείο να κάθεται να δημιουργεί μια πλήρη περιγραφή του. Φυσικά το τελευταίο που θα έκανε είναι να κάτσει να το κάνει αυτό για κάποια άλλη βάση έστω και αν υπάρχει κοινό όφελος. Δημιουργείται εύκολα επανάληψη μιας προσπάθειας που έχει κάνει κάποιος ακριβώς επειδή ΔΕΝ ΥΠΑΡΧΕΙ ΣΗΜΕΙΟ ΑΝΑΦΟΡΑΣ standard που να συμφωνούν όλοι. Η λύση του να σβήσεις διπλοεγγραφές από ΜΙΑ βάση δεν λύνει το πρόβλημα του πως άλλοι θα συγχρονήσουν τις δικές τους "βάσεις" συλλογές κλπ...

Αυτό που βλέπω στον παγκόσμιο ιστό να έχει ιδιαίτερη αποίχηση και αποτελεί σίγουρα εξέλιξη στον σημασιολογικό ιστό είναι το λεγόμενο tagging δες τε για παράδειγμα μια αντιπροσωπευτική προσπάθεια με το faviki. Καθώς και τα topic maps και ένα αντιπροσωπευτικό παράδειγμα υλοποίησης με το omnigator .

Φυσικά τίποτα δεν μας εμποδίζει όπως λες να πειραματιστούμε αλλά προσωπικά επειδή δεν μου αρέσει να ξανανακαλύπτω τον τροχό, προτιμώ να κάνω βήματα με αφετηρία την τελευταία λέξη της τεχνολογίας. Αυτό προυποθέτει και πολύ ψάξιμο για να βλέπει κανείς πως κινούνται άλλοι και ποιες οι εξελίξεις σε παρόμοιου τύπου προβλήματα στον χώρο της πληροφορικής. Έχω ήδη κάνει μια μεγάλη συλλογή από links πάνω στον σημασιολογικό ιστό μιας και σκοπεύω να ασχοληθώ και επαγγελματικά με αυτό στο μέλλον. Πιστεύω πως έχει ψωμί όπως λένε..... εύχομαι να έχουμε και άλλους υποστηρικτές στο ψαλτολόγιο προς αυτήν την κατεύθυνση και για υλοποίηση και για θεωρητικές προσεγγίσεις ;-)

Αυτά προς το παρόν..... να τα ξαναπούμε του χρόνου ;-) να'μαστε καλά πρώτα ο Θεός, και μη χειρότερα να ευχηθούμε για την πατρίδα, την Ελλάδα μας, και για τους αδελφούς μας ! Οι αδελφοί του εξωτερικού ας μας έχουν λίγο παραπάνω στις προσευχές τους το χρειαζόμαστε εδώ πέρα.

Αθανάσιος
 

despotis.n

Δεσπότης Νικόλαος
#7
Η αναζήτηση στο Ιnternet έχει τα όριά της. Πληκτρολογήστε μια ερώτηση όπως το «Πόσες γυναίκες έχουν κερδίσει περισσότερα από ένα βραβεία Νομπέλ;» σε μια μηχανή αναζήτησης και θα βρείτε την απάντηση, αλλά μόνο ύστερα από κάποια παραπάνω κλικ και μερικές σύντομες αναγνώσεις.

Αυτό συμβαίνει επειδή οι μηχανές αναζήτησης δεν ξέρουν τι σημαίνουν οι λέξεις. Με απλά λόγια, ταξινομούν τις ιστοσελίδες σε σχέση με το πόσο συχνά η λέξη που έχει τεθεί ως όρος αναζήτησης εμφανίζεται και πόσοι δημοφιλείς ιστότοποι συνδέονται με αυτήν. Δεν ξέρουν ότι το Νομπέλ είναι ένα βραβείο και ότι οι άνθρωποι μπορούν να κερδίσουν βραβεία.

Τα σημειωτικά «μεταδεδομένα» που αρχίζουν τώρα να εισρέουν στο Ιnternet θα βοηθήσουν να βελτιωθούν αυτές οι ελλείψεις. Ο συγγραφέας μιας ιστοσελίδας θα μπορεί να προσθέτει στη λέξη «βραβείο Νομπέλ» έναν σύνδεσμο για μια αναγνώσιμη από μηχανές βάση δεδομένων όπως η Dbpedia.org. Εκεί το «βραβείο Νομπέλ» θα μπορεί να συνδέεται με μια σειρά από ονόματα, το καθένα συνοδευόμενο από το γένος του. Αν αυτά συνδυαστούν με μια μηχανή αναζήτησης η οποία θα διαθέτει μια βασική κατανόηση της δομής των ανθρώπινων φράσεων ίσως η αναζήτηση στον παγκόσμιο ιστό να αρχίσει να βρίσκει όχι απλώς σελίδες αλλά απαντήσεις. Οπως «Μια, η Μαρία Κιουρί».

Αντιγραφή από το άρθρο του Βήματος.
Είναι το τρίτο άρθρο.
 
Top