Αυτόματη Μουσική Μεταγραφή
ΓΡΑΦΕΙ Ο ΕΜΜΑΝΟΥΗΛ ΜΠΕΝΕΤΟΣ

Αυτόματη μουσική μεταγραφή είναι η διαδικασία μετατροπής μιας ηχητικής μουσικής εγγραφής σε μουσική σημειογραφία, όπως για παράδειγμα παρτιτούρα ή συμβολικό αρχείο σε ηλεκτρονική μορφή. Συνηθέστερη εφαρμογή των συστημάτων αυτόματης μουσικής μεταγραφής είναι η δυνατότητα που παρέχεται στους ερμηνευτές-εκτελεστές μουσικών έργων να αποθηκεύουν και να αναπαράγουν, σε δεύτερο χρόνο, μια ηχογραφημένη εκτέλεση. Τα τελευταία χρόνια, το θέμα της αυτόματης μουσικής μεταγραφής έχει προσελκύσει σημαντικό ερευνητικό ενδιαφέρον στον χώρο της μουσικής τεχνολογίας χάρις στις νέες εφαρμογές που προκύπτουν από αυτό το είδος μεταγραφής, όπως σε συστήματα αναζήτησης μουσικής πληροφορίας (π.χ. αναζήτηση μελωδίας ή μοτίβου σε ηχογραφήσεις), σε διαδραστικά μουσικά συστήματα (π.χ. αυτόματη μουσική συνοδεία σε ζωντανές εκτελέσεις), στη μουσική εκπαίδευση (π.χ. συστήματα αυτόματης εκμάθησης μουσικών οργάνων) και, τέλος, στα πεδία της συστηματικής και υπολογιστικής μουσικολογίας (για αυτοματοποιημένη ανάλυση μουσικών ηχογραφήσεων).

Το θέμα της αυτόματης μουσικής μεταγραφής είναι διακλαδικό, καθώς συνδυάζει στοιχεία πληροφορικής, εφαρμοσμένων μαθηματικών, μουσικολογίας, ακουστικής και ψυχολογίας. Μπορεί να χωριστεί σε υποκατηγορίες, στις οποίες περιλαμβάνονται ο εντοπισμός των νοτών (και ταυτόχρονα ο χρόνος έναρξης και η διάρκεια κάθε νότας), η αναγνώριση μουσικών οργάνων, η εκτίμηση ρυθμικής πληροφορίας (π.χ. ρυθμός, μέτρο) και η εκτίμηση εκφραστικών χαρακτηριστικών (π.χ. δυναμικές, άρθρωση). 

Το θεμελιώδες πρόβλημα της αυτόματης μεταγραφής είναι η αναγνώριση ταυτόχρονων μουσικών τόνων (multi-pitch detection). H μουσική μεταγραφή είναι μια δύσκολη και χρονοβόρα διαδικασία ακόμη και για ειδικούς μουσικούς και μουσικολόγους. Και ενώ το πρόβλημα της αυτόματης μεταγραφής μονοφωνικής μουσικής θεωρείται λυμένο, η δημιουργία ενός αυτόματου συστήματος ικανού να μεταγράψει μουσική χωρίς περιορισμούς αναφορικά με το μουσικό είδος, τα όργανα ή τον βαθμό πολυφωνίας παραμένει ένα ανοικτό ερευνητικό θέμα, ειδικά για μουσικές εγγραφές με πυκνή πολυφωνία και πολλά όργανα (όπως συμβαίνει στη συμφωνική μουσική). 

Μία από τις μελλοντικές προκλήσεις είναι η δημιουργία συστημάτων τα οποία να μπορούν να λειτουργήσουν σε πραγματικό χρόνο, καθώς τα τρέχοντα συστήματα απαιτούν μεγάλους χρόνους εκτέλεσης. Επίσης, ανοικτό θέμα παραμένει η αξιοποίηση της μουσικολογικής πληροφορίας (π.χ. μουσική κλίμακα, συγχορδίες) για τη βελτίωση της τελικής μεταγραφής.

Στο Eργαστήριο Μουσικής Πληροφορικής του Πανεπιστημίου City του Λονδίνου η τρέχουσα έρευνα στο θέμα της αυτόματης μεταγραφής επικεντρώνεται στη δημιουργία αποδοτικών συστημάτων, τα οποία να μπορούν να μεταγράψουν μεγάλους όγκους ηχητικών εγγραφών σε μικρό χρονικό διάστημα, καθώς και στη χρήση μουσικολογικών μοντέλων που θα βελτιώσουν την απόδοση των συστημάτων μεταγραφής. Πραγματοποιείται επίσης έρευνα σχετικά με τη δημιουργία συστημάτων που να υποστηρίζουν αλλαγές στο κούρδισμα, καθώς και διαφορετικές αρθρώσεις φθόγγων, όπως βιμπράτο και τρέμολο. Ταυτόχρονα, σε συνεργασία με το Πανεπιστήμιο του Βοσπόρου (Boğaziçi University), πραγματοποιείται έρευνα στον χώρο της εθνομουσικολογίας με στόχο την αυτόματη μεταγραφή κλασικής τουρκικής μουσικής.

Η λειτουργία ενός τυπικού συστήματος αυτόματης μουσικής μεταγραφής παρουσιάζεται στο παρακάτω παράδειγμα, χρησιμοποιώντας τα πρώτα δύο μέτρα του Μενουέτου σε σολ μείζονα του J. S. Bach, BWV Αnh 114 (βλ. σύνδεσμο κατωτέρω, για το σχετικό ηχητικό υλικό). Στην εικ. 1 απεικονίζεται η κυματομορφή της ηχητικής εγγραφής, που χρησιμοποιείται ως είσοδος σε ένα σύστημα αυτόματης μεταγραφής.

Λόγω του ότι σε κάθε μουσική νότα αντιστοιχεί μία συγκεκριμένη ηχητική συχνότητα (ονομάζεται επίσης θεμελιώδης συχνότητα), η μονοδιάστατη κυματομορφή απαιτείται να μετατραπεί σε μία δισδιάστατη αναπαράσταση ως προς τον χρόνο και τη συχνότητα (φασματογράφημα). Στην εικ. 2 απεικονίζεται το φασματογράφημα για την ίδια εγγραφή, όπου παρατηρείται ότι για κάθε παραγόμενη νότα δημιουργούνται πολλαπλές οριζόντιες γραμμές ως προς τον χρόνο, οι οποίες δείχνουν την ύπαρξη ενέργειας σε μία συγκεκριμένη θεμελιώδη συχνότητα, όπως και στα ακέραια πολλαπλάσια αυτής της συχνότητας (οι λεγόμενες αρμονικές). Χρησιμοποιώντας τεχνικές αυτόματης μεταγραφής το φασματογράφημα μπορεί να μετατραπεί σε μια δισδιάστατη αναπαράσταση αντιληπτών τόνων ως προς τον χρόνο. 

Η εικ. 3 απεικονίζει μία τέτοια αναπαράσταση για το ηχητικό παράδειγμα, όπου παρατηρείται ενέργεια σε συγκεκριμένες νότες (στην εικόνα η τιμή κλίμακας MIDI 60 αντιστοιχεί στο μεσαίο ντο σε ένα πιάνο). Με κατάλληλη επεξεργασία της αναπαράστασης αντιληπτών τόνων – χρόνου μπορούμε να καταλήξουμε σε μια συμβολική μουσική αναπαράσταση, όπως για παράδειγμα το πεντάγραμμο της εικ. 4.


(O δρ Εμμανουήλ Μπενέτος είναι ερευνητής [research fellow] στο Eργαστήριο Μουσικής Πληροφορικής του Πανεπιστημίου City του Λονδίνου.)

Ηχητικό υλικό
Bach Segment

 

Εικ. 1
Εικ. 2
Εικ. 3
Εικ. 4

..