1) Κύριε Αγιομυργιαννάκη, μιλήστε μας λίγο για τον εαυτό σας, ποιο είναι το αντικείμενο των σπουδών σας και πως αποφασίσατε να ιδρύσετε μια εταιρεία στην Αγγλία που να ασχολείται με το αντικείμενο του AI;
Σπούδασα Επιστήμη Υπολογιστών στο Πανεπιστήμιο Κρήτης, αλλά αρκετά νωρίς αφιερώθηκα στα μαθηματικά και στην επεξεργασία σημάτων φωνής, μέχρι και το μεταδιδακτορικό επίπεδο. Για αρκετά χρόνια βασιζόμουν σε υποτροφίες για να συνεχίσω τις σπουδές μου, και γι’ αυτό οφείλω ευγνωμοσύνη στο κοινωνικό κράτος της εποχής που επέτρεψε σε εκείνον τον επίμονο φοιτητή να χτίσει ένα γερό μαθηματικό υπόβαθρο δίχως πολλές αγγαρείες. Απολαμβάνω να λύνω δύσκολα προβλήματα αλλά μετά από τρεις εφευρέσεις που σε άλλες χώρες, όπως η Σουηδία, θα είχαν γίνει εταιρείες συνειδητοποίησα ότι το ελληνικό περιβάλλον και σύστημα δεν παρείχε τη δυνατότητα να μετατρέψω τις εφευρέσεις σε προϊόντα. Θεώρησα ότι αυτό οφείλεται στο ότι η Ελλάδα είναι στην περιφέρεια των εξελίξεων, και μετακόμισα πρώτα στη Γαλλία και μετά στην Αγγλία για να είμαι πιο κοντά στα τεχνολογικά κέντρα της Αμερικής που ανέδειξαν εταιρείες κολοσσούς ‘όπως η Google. Δεν ήθελα ποτέ μου να μετακομίσω στην Αμερική λόγω οικογένειας και αυτό μου κόστισε σε χρόνο. Μου πήρε 10 χρόνια, πολλά εκ των οποίων στα Orange Labs και εντός της Google, για να μαζέψω τις γνώσεις που χρειάζονται να χτίσω μια εταιρεία υψηλής τεχνολογίας. Επέλεξα το Λονδίνο ως το καλύτερο μέρος να φτιάξει κάποιος μια εταιρεία υψηλής τεχνολογίας εκτός Αμερικής. Το ΑΙ, ή για να είμαστε ακριβείς, το Deep Learning, είναι απλά ένα εργαλείο για να λύνουμε προβλήματα.
2) Πότε ξεκίνησαν οι δοκιμές για τα Altered Services και πότε ξεκίνησε η εμπορική τους διάθεση;
Ξεκινήσαμε τις δοκιμές αρκετά νωρίς, αλλά η εμπορική τους διάθεση άρχισε σταδιακά πριν από έναν χρόνο, επειδή αφιερώσαμε αρκετό χρόνο να φτιάξουμε ένα ολοκληρωμένο προϊόν επεξεργασίας ήχου και φωνής στο διαδίκτυο και όχι απλά μια τεχνολογία.
3) Πριν από λίγες ημέρες υπήρξαν δημοσιεύματα ότι δημοφιλείς εταιρείες της βιομηχανίας του gaming χρησιμοποιούν την τεχνολογία σας σε διαδικασίες voice acting και μάλιστα δημιουργήθηκε σάλος και αντιδράσεις. Ποια είναι η θέση σας πάνω στο θέμα;
Δεν με εκπλήσσει καθόλου. Σε όλη την ιστορία της ανθρωπότητας, όταν άνθρωποι και εταιρίες καινοτομούσαν ή έκαναν κάτι εντελώς διαφορετικό για τα δεδομένα της εποχής, υπήρχαν φόβοι και περιστασιακά κάποιες αντιδράσεις, άλλοτε μεγάλες άλλοτε μικρές. Όσο η κοινωνία εκπαιδεύεται στις νέες τεχνολογίες, τόσο τις απομυθοποιεί και τις αποδαιμονοποιεί. Το ίδιο συμβαίνει και με την τεχνολογία του ΑΙ, που κάνει κάποιους να φοβούνται ότι θα χάσουν τις δουλειές τους και ότι όλο αυτό θα έχει αντίκτυπο στην εργασία τους.
Όπως λένε και οι Άγγλοι if that was the case, τότε η ανθρωπότητα δεν θα έκανε όλα αυτά τα μεγάλα βήματα στην τεχνολογία που έχουν κάνει τη ζωή μας πιο εύκολη.
Τώρα όσον αφορά πιο συγκεκριμένα το κομμάτι του voice acting, ο σκοπός του κάθε voice actor θα έπρεπε να είναι διαφορετικός. Θα έπρεπε να μελετούν τα νέα δεδομένα που έρχονται, το πώς μπορούν να φανούν παραγωγικοί και να εξελιχθούν με τις νέες τεχνολογίες και τα νέα εργαλεία που έρχονται και όχι να φοβούνται ή να παραπονιούνται ότι μια τεχνολογία θα τους αφαιρέσει την εργασία τους. Όπως ανέφερα και παραπάνω αυτό πάντα υπήρχε και πάντα θα υπάρχει από διάφορούς ανθρώπους, ευτυχώς το σύνολο δεν σκέφτεται έτσι και γι᾽ αυτόν τον λόγο προχωράμε και σαν κοινωνία με ευρηματικότητα και νέες τεχνολογίες.
Όπως έλεγε και ο Σωκράτης: Αξιοποίησε το χρόνο σου για να κάνεις τον εαυτό σου καλύτερο. Μάθε από τα γραπτά των άλλων έτσι ώστε ν᾽ αποκτήσεις εύκολα αυτά που οι άλλοι έχουν εργαστεί σκληρά για να τ᾽ αποκτήσουν.
Αν λοιπόν σκεφτούν θετικά και αξιοποιήσουν τις δυνατότητες που τους προσφέρονται, τότε θα διαπιστώσουν ότι μπορούν να χρησιμοποιήσουν τις νέες τεχνολογίες προς όφελός τους, και ότι το αποτέλεσμα όλες οι εταιρίες θα το στηρίξουν και θα είναι διατεθειμένες να το πληρώσουν. Για παράδειγμα, ένας Βρετανός ηθοποιός που χρησιμοποίησε το εργαλείο μας να κάνει 40 διακριτούς χαρακτήρες, προσλήφθηκε να δώσει φωνή σε ένα παιχνίδι για το οποίο δεν υπήρχε πλάνο να γίνουν ηχογραφήσεις. Και αυτές μόνο οι περιπτώσεις είναι χιλιάδες κάθε χρόνο. Με άλλα λόγια το προϊόν μας μπορεί να δημιουργήσει μια νέα τεράστια αγορά δισεκατομμυρίων δολαρίων για τη δημιουργία περιεχόμενου Voice Over το οποίο τώρα δεν ηχογραφείται.
Το προϊόν μας, Altered Studio, είναι ουσιαστικά ένα Photoshop for Voice, το οποίο κάνει προσιτές σε επαγγελματίες τις τεχνολογίες φωνής οι οποίες αυτή την στιγμή είναι διαθέσιμες μονάχα σε μεγάλες εταιρείες. Εκδημοκρατίζει την τεχνολογία δηλαδή. Όπως υπήρχαν αντιδράσεις για το PhotoShop όταν πρωτοβγήκε, έτσι υπάρχουν και για την Altered. Κανείς όμως τώρα δεν παραπονιέται για το PhotoShop και όλοι απολαμβάνουν το εικαστικό αποτέλεσμα που οι καλλιτέχνες παράγουν με αυτό. Ένα εργαλείο είναι και το Altered Studio, τίποτα παραπάνω. Μείωσε το PhotoShop την εργασία των καλλιτεχνών; Όχι, απλά αύξησε την παραγωγή περιεχομένου και δημιούργησε το επάγγελμα του γραφίστα στο οποίο απασχολούνται επιτυχώς πολλοί καλλιτέχνες. Ως τα τώρα έχουμε παρατηρήσει το εξής φαινόμενο: δεν υπάρχει άνω όριο στην ζήτηση όμορφου περιεχομένου. Όσο πιο πολύ παράγεται τόσο πιο πολύ θα καταναλώνεται.
Το Altered Studio έχει πολλαπλές χρήσεις και εργαλεία, αλλά αυτό που προκάλεσε σάλο και βαβούρα είναι το Speech-To-Speech Morphing. Αυτό το εργαλείο χρειάζεται έναν άνθρωπο να καθοδηγεί την φωνή. Γενικώς, κάνει έναν απλό άνθρωπο να ακούγεται σαν έναν επαγγελματία, ενώ στα χέρια ενός καλού ηθοποιού το σύστημα πραγματικά πετάει. Δεν αντικαθιστά τον άνθρωπο καθώς βασίζεται σε αυτόν.
Αυτό έχει γίνει αντιληπτό στην γειτονιά μας, την Βρετανία, όπου ο ειδικός τύπος μας κατατάσσει ως την καλύτερη Voice AI επιλογή για τους ηθοποιούς, ενώ το Βρετανικό Κράτος μας έχει βραβεύσει με χρηματοδοτήσεις προκειμένου να βελτιώσουμε την ανταγωνιστικότητα της βρετανικής οικονομίας καθώς θεωρούν ότι θα ωφελήσει την κοινωνία.
Δεν επιδιώκουμε να αντικαταστήσουμε τους ηθοποιούς όπως κάνουν οι τεχνολογίες Text-To-Speech, αλλά να ενισχύσουμε την παραγωγικότητα τους ώστε να είναι πολύ δύσκολο να αντικατασταθούν από αυτόματα ΑΙ συστήματα.
Δεν είναι η τεχνολογία που βλάπτει τους ανθρώπους, είναι οι ίδιες οι επιλογές των ανθρώπων και η θλιβερή ανθρώπινη φύση όπως ο πόλεμος στην Ουκρανία το αναδεικνύει.
Οι τεχνολογικές επαναστάσεις έχουν ένα κοινό χαρακτηριστικό, όμως χειροτερεύουν τις συνθήκες αυτών που δεν είναι σε θέση να συμμετάσχουν. Γι’ αυτό η Altered έχει την αποστολή να προσφέρει το τεχνολογικό πλεονέκτημα σε όσο το δυνατόν περισσότερους επαγγελματίες ώστε στο μέλλον κανείς να μην βρεθεί δίχως να έχει τα εργαλεία που θα του επιτρέπουν να είναι ανταγωνιστικός.
Η τεχνολογία λειτουργεί σαν την παλίρροια που σηκώνει όλες τις βάρκες, και τις μικρές και τις μεγάλες.
4) Πόσο κοντά είμαστε στο να μπορεί η τεχνητή νοημοσύνη να αντικαταστήσει επαρκώς έναν voice actor σε ένα επαγγελματικό project;
Εξαρτάται από το επαγγελματικό project. Παραγωγές πολύ μικρού μήκους με συγκεκριμένο τρόπο ομιλίας όπως Ειδήσεις, Διαφημίσεις, Εκπαιδευτικό Περιεχόμενο, κτλ, μπορούν να γίνουν αρκετά πειστικά. Όσο το περιεχόμενο και η πολυπλοκότητα του περιεχομένου μεγαλώνει, τόσο πιο πολύ μεγαλώνουν οι απαιτήσεις από πλευράς του ακροατή και τόσο πιο απαραίτητος γίνεται ο voice actor.
Οι παραστάσεις σε ταινίες, τα video games, κτλ, είναι προβλήματα Γενικής Τεχνητής Νοημοσύνης (AGI: Artificial General Intelligence) και χρειάζονται ευρύτερη κατανόηση του περιεχομένου και βαθιά αντίληψη της ανθρώπινης κατάστασης. Δεν το βλέπω να γίνεται στα επόμενα 10 χρόνια, το μέγιστο που μπορώ να επιχειρήσω κάποια πρόβλεψη, ειδικά καθώς το ΑΙ φαίνεται να έχει βρει κάποιας μορφής τοίχο από πλευράς ενεργειακής κατανάλωσης. Ίσως να μην έχουμε την ενέργεια να εκπαιδεύσουμε τέτοια συστήματα και να χρειαστεί να περιμένουμε την επόμενη τεχνολογική επανάσταση από την Φυσική ή την Βιολογία για να προχωρήσουμε.
Επίσης, ας σημειώσουμε ότι δεν επαρκεί η γενική τεχνητή νοημοσύνη για το acting, ακριβώς για τον ίδιο λόγο που δεν επαρκεί να πάρεις κάποιον τυχαίο άνθρωπο από τον δρόμο και να τον βάλεις σε μια ταινία. Χρειαζόμαστε και τον μοναδικό ανθρώπινο παράγοντα, αυτόν τον συνδυασμό τυχαιότητας και ιδιαιτερότητας που κάνει έναν χαρακτήρα ενδιαφέρον στους πολλούς.
Τα εργαλεία της Altered βρίσκονται μεταξύ των δύο αυτών άκρων. Ο άνθρωπος βάζει την νοημοσύνη και η μηχανή την τεχνική της επαγγελματικής φώνησης.
5) Τα εργαλεία σας μπορούν να αξιοποιηθούν και κακόβουλα; Κάποιος π.χ. μπορεί να δημιουργήσει deepfake content και να το κάνει ακόμη πιο ρεαλιστικό με μία φωνή πολύ κοντά σε αυτόν που θέλει να αντιγράψει. Υπάρχουν μηχανισμοί από την εταιρεία σας που προστατεύουν τα πνευματικά δικαιώματα και τις φωνές επαγγελματιών στο χώρο του θεάματος ή ουσιαστικά η ευθύνη είναι αποκλειστικά του χρήστη των εργαλείων σας;
Είναι αλήθεια ότι οι τεχνολογία μας, όπως κάθε δυνατή τεχνολογία, μπορεί να χρησιμοποιηθεί κακόβουλα. Γι’ αυτό έχουμε χτίσει πολλαπλές δικλείδες ασφαλείας. Έχουμε κωδικοποιήσει τις αρχές μας σε ένα σύνολο Principles and Pledges τις οποίες έχουμε αναρτήσει στην ιστοσελίδα μας. Στο επιχειρηματικό επίπεδο, είμαστε πολύ επιλεκτικοί στις επιλογές των πελατών μας:
Δεχόμαστε μόνο επώνυμους πελάτες. Απορρίπτουμε πελάτες για τους οποίους έχουμε υποψίες ή ενδείξεις ότι η χρήση από πλευράς τους δεν είναι νόμιμη ή ηθική, ζητάμε υπογραφές και επιβεβαιώσεις δικαιωμάτων από τους κατόχους των φωνών, κάνουμε ελέγχους του ιστορικού τους κτλ. Στο τεχνικό επίπεδο, διατηρούμε κωδικοποιημένο ιστορικό, στο οποίο μπορούμε να ανατρέξουμε αν προκύψει κάποια νομική υπόθεση στην οποία έχει εμπλακεί κάποια από τις φωνές που έχουμε φτιάξει για τρίτους. Αυτό παρέχει accountability και λειτουργεί αποτρεπτικά σε επίδοξους παραβάτες.
6) Πόσες και ποιες γλώσσες υποστηρίζουν τα εργαλεία σας; Είναι η ελληνική μέσα σε αυτά;
Ναι, τα μοντέλα Timbre που λανσάραμε πριν από λίγους μήνες υποστηρίζουν τα ελληνικά. Αυτά τα μοντέλα αλλάζουν το χρώμα της φωνής, το σώμα του ομιλητή, αν θέλετε. Μπορώ να επιβεβαιώσω ότι δουλεύουν μια χαρά και με Κρητικές μαντινάδες.
Τα μοντέλα Clone που αλλάζουν την προφορά, δουλεύουν σε πολλαπλές διαλέκτους, αλλά μόνο για Αγγλικά. Λόγω καταγωγής, θα ήθελα να φτιάξω σε κάποια στιγμή να φτιάξω ένα μοντέλο για Αγγλικά με Κρητική προφορά. :) (γέλια)
7) Ποια τα επόμενα σχέδιά σας για τα εργαλεία της Altered;
Θέλω να γεμίσω τους τεράστιους εικονικούς χώρους του metaverse και gaming worlds με voice-over περιεχόμενο υψηλής καλλιτεχνικής αξίας.
Για την καλύτερη εμπειρία σου θα θέλαμε να σε παρακαλέσουμε να το απενεργοποιήσεις κατά την πλοήγησή σου στο site μας ή να προσθέσεις το enternity.gr στις εξαιρέσεις του Ad Blocker.
Με εκτίμηση, Η ομάδα του Enternity