Η φωνή που ακούγεται είναι του Sharwin Raghoebardajal, ενός director of software engineering στη Sony Interactive Entertainment που εργάζεται στο κομμάτι video game technology, AI, computer vision, και face technology για το PlayStation Studios Advanced Technology Group. Η Aloy απαντάει στα ερωτήματα παίρνοντας και τις κατάλληλες εκφράσεις και το demo είναι ένα δείγμα του πως θα μπορούσε να αλληλεπιδρά ο παίκτης με τους ήρωες των games στο -όχι και τόσο μακρινό- μέλλον.
Το demo αυτό χρησιμοποιεί την τεχνολογία whisper for speech-to-text της OpenAI και τα μοντέλα GTP-4 και Llama 3 για τη λήψη αποφάσεων. Για τη δημιουργία των απαντήσεων χρησιμοποιείται το Emotional Voice Synthesis (EVS) της ίδιας της Sony, που αξιοποιεί την τεχνολογία Mockingbird. Δείτε το video εδώ.
Για την καλύτερη εμπειρία σου θα θέλαμε να σε παρακαλέσουμε να το απενεργοποιήσεις κατά την πλοήγησή σου στο site μας ή να προσθέσεις το enternity.gr στις εξαιρέσεις του Ad Blocker.
Με εκτίμηση, Η ομάδα του Enternity