Φαντάζομαι ο Χάρης Συμεωνίδης και όποιος άλλος τυχόν έχει ασχοληθεί εκτενώς με το αντικείμενο θα μπορεί να μας δώσει πολλές πληροφορίες και τον ευχαριστώ εκ των προτέρων.
Είναι ένα πολύ ενδιαφέρον και πολυδιάστατο θέμα αυτό, που εξέθεσες ακροθιγώς Δημήτρη, και θα χαρώ πολύ αν μέσα από έναν γόνιμο και επιστημονικό διάλογο φθάσουμε σε κάποια χρήσιμα συμπεράσματα κοινής αποδοχής. Σπεύδω όμως να γνωστοποιήσω, ότι λόγω προγραμματισμένης οικογενειακής εξόδου εν όψει του επερχόμενου τριημέρου, δεν θα μπορέσω να παρουσιάσω διεξοδικά, ένα τόσο πολύσχιδές αντικείμενο, ούτε να απαντήσω σε τυχόν αντίλογο, μέχρι την Τρίτη.
Ωστόσο, κλέβω λίγο χρόνο για να εκθέσω κάποιες προσωπικές σκέψεις γύρω από το θέμα και κάποιες λογικές παραμέτρους του αντικειμένου αυτού, που μπορούν να γίνουν έναυσμα για περαιτέρω διερεύνηση.
Κατ' αρχάς πρέπει να πω, πως το θέμα αυτό με απασχόλησε απο τα τέλη της 10ετίας του '90 (δηλ. πάνω από 10 χρόνια). Για να πάρω κάποιες κατευθύνσεις, επισκέφθηκα αρκετές φορές στην Φυσικομαθηματική Σχολή του Α.Π.Θ. τον ήδη μακαριστό εξ αγχιστείας θείο μου Γιώργο Μπλέρη, καθηγητή Στατιστικής στη Σχολή αυτή.
Σύντομα καταλήξαμε, πως το αντικείμενο άπτεται τουλάχιστον τριών επιστημών: της Μουσικής - Μουσικολογίας, της Ακουστικής - Φυσικής και της Στατιστικής - Μαθηματικών. Η προσέγγιση μέσω μιας επιστήμης, αποκλειουμένων των δύο άλλων, θα οδηγούσε εύκολα σε λάθος συμπεράσματα.
Σύντομα μου γνώρισε το καινούργιο τότε, Antares Autotune, ένα πρόγραμμα που ξεκίνησε ως εργαλείο μέτρησης σεισμικών δονήσεων και κατάληξε σήμερα να είναι το κορυφαίο επαγγελματικό world standard εργαλέιο (must για όλα τα studio ηχογραφήσεων διεθνώς). Με to Antares λύνεται το πρόβλημα του αλγορίθμου και όλης της μαθηματικής διαδικασίας, αφού σου δίνει απ' ευθείας, οπτικοποιημένη, τη συνάρτηση παραγόμενης συχνότητας στον χρόνο.
Ακόμα, λύνει τα προβλήματα θορύβων στις ηχογραφήσεις, αφού υπάρχει η δυνατότητα παραμετροποήσης της περιοχής συχνοτήτων που επικεντρώνεται. Έτσι, στις περισσότερες περιπτώσεις ψαλτικής φωνής, επιλέγοντας Alto/tenor voice ή Low male voice, αφήνει απ' έξω στην καταγραφή συχνότητες πολύ ψηλές ή πολύ χαμηλές (θόρυβο, ισοκρατήματα κλπ).
Το πρόβλημα που παραμένει και του οποίου η προσέγγισή θέλει μεγάλη προσοχή, είναι αυτό του φυσικού βιμπραρίσματος της φωνής. Το οποίο και σε συνδυασμό με την παλαιότητα μπορεί να "θολώσει" το παραγόμενο φάσμα σε κάποιους φθόγγους. Γενικά, το Autotune, όταν το θόλωμα αυτό είναι μεγάλο, προτιμά να μην επιστρέφει τίποτα, αφήνοντας κενό το σημείο αυτό. Έτσι είμαστε σίγουροι πως οι συχνότητες που μας παρουσιάζει είναι αυτές που σίγουρα υπάρχουν.
Εκθέτω εδώ, εν συνομία, όσο αυτό είναι δυνατόν, τις βασικές παραμέτρους για μια αξιόπιστη φασματογράφηση, στις οποίες κατέληξα μετά από τη συνεργασία μου με τον μακαριστό Γεώργιο Μπλέρη, ο οποίος επέμενε ότι ο ρόλος του μουσικού - γνώστη του αντικειμένου της στατιστικής ανάλυσης είναι ιδιαίτερα σημαντικός, και στο σημείο αυτό έτρεφε βαθύ θαυμασμό για τις ικανότητες μου. Βέβαια, ο ίδιος (όπως και πολλοί καθηγητές μου στο Πανεπιστήμιο) πίστευε πως χαραμιζόμουν, που δεν ασχολήθηκα με την έρευνα στην Ιατρική επιστήμη, όπου θα διέπρεπα, αλλά αυτό είναι μια άλλη ιστορία, έκανα τις επιλογές μου. Έτσι λοιπόν:
1. Οι καθαρότερες και σε σχετικά κοντινή λήψη (χωρίς μεγάλο βάθος στον ήχο) ηχογραφήσεις, παράγουν ευκρινέστερες και καθαρότερες φασματογραφήσεις. Ωστόσο,
βελτιώνοντας με τεχνικά μέσα (κομπρέσορας, αφαίρεση θορύβου, ενίσχυση συχνοτήτων φωνής, αφαίρεη βάθους) την ηχογράφηση, μπορούμε να βελτιώσουμε και το αποτέλεσμα της φασματογράφησης.
2. Εκτός κι αν η ηχογράφηση είναι σε στούντιο, με δεδομένο δηλαδή πως δεν έχει μετακινηθεί η βάση, είναι
άτοπο να προσπαθούμε να βρούμε την συχνότητα ενός φθόγγου, παίρνοντας το
Μέσο Όρο των συχνοτήτων των εμφανίσεων του φθόγγου αυτού. Αλλά, ακόμα και τότε η μέθοδος αυτή δεν μπορεί να θεωρηθεί αξιόπιστη, καθώς σε διαφορετικές κινήσεις της μελωδίας και κάτω από τους νόμους των έλξεων, του γλισσάντο κ.λ.π. ο φθόγγος μπορεί να
διαφοροποιείται έως και δραματικά σε δυο διαφορετικές εμφανίσεις του. Φροντίζουμε λοιπόν να φασματογραφούμε μικρό αριθμό φθόγγων κάθε φορά και μάλιστα στην ίδια μουσική φράση.
3. Η κάθε φωνή, έχει διαφορετική χροιά και φυσικό βιμπράρισμα. Έτσι, υπάρχουν φωνές που παρουσιάζουν αξιοσημείωτη σταθερότητα και ελάχιστη διακύμανση στη συχνότητα που παράγουν σε κάθε φθόγγο και άλλες με πολύ μεγαλύτερη διακύμανση (χωρίς να σημαίνει πάντα ότι οι πρώτες είναι κατ' ανάγκην και καλύτερες φωνές από τις δεύτερες). Για να πετύχουμε την τέλεια μέθοδο εξαγωγής συχνοτήτων από τις φασματογραφήσεις θα έπρεπε να κάνουμε μια
"ειδική" στατιστική ανάλυση για την κάθε φωνή. Και λέω ειδική, γιατί δεν υπάρχει ασφαλής τρόπος μόνο με μαθηματικά κριτήρια, να πάρεις τα σωστά αποτελέσματα. Πολλές φορές λ.χ., κάποια φωνή πθανόν να βιμπράρει διάφορους φθόγγους
έως και ένα ημιτόνιο προς τα επάνω, έχοντας ταυτόχρονα και
μεγαλύτερη ένταση στην κορυφή του βιμπράτο παρά στον βασικό φθόγγο αυτόν καθ' εαυτόν. Εδώ πρέπει να υπεισέλθει ο μουσικός - μουσικολόγος, ο οποίος "διαβάζοντας" το γράφημα σε πραγματικό χρόνο, θα υποδείξει πού είναι η εννοούμενη νότα και πού το βιμπράρισμα. Μετά από κάποια εξοικείωση αυτό βέβαια γίνεται σχετικά εύκολα, αλλά
με καθαρά μαθηματική μέθοδο, υπάρχουν φωνές που θα οδηγήσουν
σε λάθος καθορισμό του τονικού ύψους ενός φθόγγου που εκφέρουν μέχρι και 2 τμ. της 72άρας κλίμακας.
4. Έχει μεγάλη σημασία να γνωρίζουμε, εάν θέλουμε να καταμετρήσουμε το ακριβές τονικό ύψος των παραγόμενων φθόγγων ή
τα διαστήματα που παράγουν οι φθόγγοι αυτοί. Έτσι τα προβλήματα της προηγούμενης παραγράφου (3.) μπορούν να προσπεραστούν, καθώς η ίδια φωνή παράγει ίδιας ποιότητας γραφήματα σε διάφορους φθόγγους.
Παίρνοντας λοιπόν απλώς τον Μ.Ο. του φάσματος του κάθε φθόγγου, είναι πιθανόν να πέσουμε έξω στον απόλυτο καθορισμό του τονικού ύψους των (συνήθως από +1 έως -1 τμ. της 72άρας κλίμακας), αλλά επειδή το λάθος θα είναι ίδιο(παρόμοια απόκλιση) για τους διάφορους φθόγγους,
πρακτικά εκμηδενίζεται το λάθος στην αποτύπωση της απόστασης των φθόγγων, δηλ. του διαστήματος.
Έτσι λοιπόν, ως απάντηση, στην πολύ καλή ερώτηση του Shota,
O Πα του Παναγιωτίδη είναι κάπου μέσα το D2 και το D#2, αλλα ακριβώς πού;;; Και ποίο είναι ο Ζω τού;;
...ανεβάζω ξανά το γράφημα της φωνής του Παναγιωτίδη, σημειώνοντας με μαύρη λεπτή γραμμή, την κοντινότερη τιμή στο αντικειμενικό ύψος των φθόγγων που εκφέρει. Είναι σχεδόν 1 τμ. της 72άρας χαμηλώτερα από αυτό που βγήκε με τον Μ.Ο., αλλά
τα διαστήματα παραμένουν τα ίδια!
Χαραλάμπης