H Νορβηγία είναι μια πανέμορφη χώρα. Η καταπράσινη άνοιξή της απλώνεται διαδοχικά και στήνει ένα μεθυστικό καμβά με την πολυχρωμία του νότου και την κρυστάλλινη ομορφιά του βορρά. Οι χειμώνες έχουν ποικιλία, τα καλοκαίρια και το φθινόπωρο επίσης, αρκεί βέβαια να ζεις σε μέρος που βλέπει θάλασσα. Δύσκολο, γενικά, να αντισταθείς στη γοητεία της, ακόμα και αν προέρχεσαι από την Ελλάδα. Παράλληλα είναι μία από τις πλουσιότερες χώρες στον κόσμο, με τη μεσαία τάξη να ζει μια ιδιαίτερα άνετη ζωή, η κοινωνική και δικαστική της δικαιοσύνη λειτουργεί ως παγκόσμιο υπόδειγμα και, ως κερασάκι στην τούρτα, η εργασία είναι μόνο 7,5 ώρες (με μισή ώρα διάλειμμα) και κάθε λεπτό υπερωρίας πληρώνεται στο ακέραιο. Με άλλα λόγια ένα εξαιρετικό κοινωνικοοικονομικό σύστημα που οι ειδικοί ονομάζουν «state capitalism» και, οι λιγότεροι ειδικοί, «τούμπανο χώρα». [σ.α.: Ξεκάθαρα πιο εύστοχοι οι λιγότερο ειδικοί.]
Παρόλα αυτά έχει ένα μεγάλο και αγιάτρευτο πρόβλημα: το όριο ταχύτητας είναι 110 χιλιόμετρα στην εθνική και 40, 60 και 80 στις υπόλοιπες οδικές αρτηρίες. Είναι ένα μεγάλο βάσανο, ιδιαίτερα για κάποιον που προέρχεται από το νότο, να αναγκάζεται να οδηγεί τόσο αργά, τόσο συχνά. Επαναστατεί το DNA, ανασηκώνονται τα εσώτερα νεύρα, η πίεση χτυπάει κόκκινο. O Νορβηγός, από την άλλη, δεν πτοείται και αγοράζει ακριβά και γρήγορα αυτοκίνητα, τα οποία ξέρει ότι ποτέ δεν πρόκειται να τα ευχαριστηθεί όσο θα ήθελε πραγματικά. Εκ πρώτης όψεως, βέβαια, ούτε γάτα ούτε ζημιά. Εκ δεύτερης, όμως, τα πράγματα περιπλέκονται. Ξέρετε πόσο σουρεαλιστικό είναι να οδηγείς με 60 και να έχεις πίσω σου μία Lamborghini για σαράντα ολόκληρα λεπτά, δίχως να κορνάρει ή να σου «κάνει φώτα»; Συνειδητοποιείτε το ψυχικό σθένος που χρειάζεται για να προσπεράσεις μία Porsche οδηγώντας ένα Mitsubishi 1.300 κυβικών; Φτάνεις στο σημείο να αμφισβητείς την πνευματική σου κατάσταση, την ίδια την πραγματικότητα, την ισορροπία μιας ζωής.
Ο Νορβηγός, όμως, έχει μάθει να ευχαριστιέται με την αίσθηση της ποιότητας όταν αυτή, κυρίως, αδυνατεί να του προσφέρει όλα όσα μπορεί. Έχει, δηλαδή, καταλάβει τι χρειάζεται για να ανταπεξέλθει στην πεζή καθημερινότητα: όταν δεν μπορείς να απολαύσεις την ουσία των πραγμάτων, όπως, π.χ., την ταχύτητα σε ένα γρήγορο αυτοκίνητο, το καλύτερο που έχεις να κάνεις είναι να συμφιλιωθείς με την ιδέα της ταχύτητας και να επαναπροσδιορίσεις τις απολαύσεις σου. Υγιές μεν, στάσιμο δε.
Oι gamers, δυστυχώς, υπό αυτή την άποψη είμαστε Νορβηγοί. Και λέω «δυστυχώς» διότι, αντίθετα με τον Νορβηγό που πρέπει να ακολουθήσει το νόμο, εμείς έχουμε σε μεγάλο βαθμό επιλέξει οικειοθελώς να ασχολούμαστε περισσότερο με την αίσθηση των πραγμάτων και λιγότερο με την ουσία. Ζούμε την πιο επιτυχημένη ιστορικά περίοδο της βιομηχανίας, όπου η πρόσβαση στα videogames είναι πολύπλευρη και πολυεπίπεδη, όπου αρχίζουμε και ωριμάζουμε σε κοινωνικά θέματα, όπου εξελισσόμαστε ως τέχνη και ως ψυχαγωγία. Παρόλα αυτά ακόμα φοβόμαστε να απαιτήσουμε το κάτι παραπάνω. Είμαστε ευχαριστημένοι με το εύρος και την ιδέα της ατμόσφαιρας του Assassin’s Creed: Odyssey, αλλά δεν μας ενοχλεί το γεγονός ότι μπορούμε να σφυρίξουμε σε χίλιους εχθρούς και να έρθουν όλοι στο σημείο που κρυβόμαστε ώστε να δολοφονηθούν. Μεθάμε τις αισθήσεις μας με το Uncharted 4: A Thief’s End, αλλά δεν αναρωτιόμαστε πόσο πεζή σχεδιαστικά είναι η μνήμη των εχθρών, οι οποίοι αναβοσβήνουν τα οπτικοακουστικά τους μέσα αναλόγως με το που κρύβεται ο Nathan. Χαλάμε ατελείωτες ώρες σε ένα ΜΜΟ κάνοντας επαναλαμβανόμενες αποστολές, σαν ρομπότ, δίχως να μας ενοχλεί πόσο χαμένος δημιουργικά πηγαίνει ο τεράστιος κόσμος του. Η απόλαυσή μας είναι πολλές φορές η σκιά μιας απόλαυσης, διότι μας απασχολεί η εικόνα της δύναμης του επόμενο PlayStation ή Xbox και όχι πώς θα χρησιμοποιηθεί ουσιαστικά αυτή η δύναμη.
Με άλλα λόγια είμαστε εμείς οι κάτοχοι της Lamborghini και της Porsche που ανέφερα παραπάνω, ικανοποιημένοι να διατηρούμε χαμηλές ταχύτητες αρκεί να ξέρουμε, απλά, ότι είναι δυνατό θεωρητικά να τις ξεπεράσουμε. Ευτυχώς για εμάς, αυτή η έλλειψη τόλμης που μας διακρίνει δεν θα διαρκέσει για πολύ, αφού η βασική επανάσταση στα videogames και το μοναδικό κομμάτι που περιορίζει τις πραγματικές τους δυνατότητες, η Τεχνητή Νοημοσύνη (ΤΝ), εξελίσσεται πυρετωδώς στο παγκόσμιο εργαστήριο και ετοιμάζεται να κάνει σύντομα μία μεγαλειώδη εμφάνιση προς το επόμενο εξελικτικό μας στάδιο. Ένας από τους σημαντικότερους επιστήμονες και πρωτεργάτες αυτής της επανάστασης είναι ο Γιώργος Γιαννακάκης, καθηγητής, συγγραφέας και διευθυντής του Institute of Digital Games στο Πανεπιστήμιο της Μάλτας, η σελίδα του οποίου στη Wikipedia περιγράφει ξεκάθαρα τη θέση που του αναλογεί, μία θέση που δεν μπορεί παρά να εξιτάρει τη φαντασία όλων μας: «ένας από τους πιο επιτυχημένους επιστήμονες στη διασταύρωση μεταξύ της Τεχνητής Νοημοσύνης και των Videogames».
Πάρτε βαθιά ανάσα, το σκάψιμο αναμένεται να είναι βαθύ.
Το ΑΙ, αυτή η ασύλληπτη επανάσταση.
Ευχαριστούμε για το χρόνο που μας δίνετε καθηγητά, μεγάλη χαρά να σας έχουμε. Θα ήθελα να ξεκινήσω με κάποια βασικά, ώστε να βάλουμε ένα ορισμένο πλαίσιο στην κουβέντα. Μπορούμε να ορίσουμε τι ακριβώς εννοούμε με τεχνητή νοημοσύνη (ΤΝ); Υπάρχουν κάποιες βασικές αρχές που ακολουθούνται στον ορισμό της, είτε αναφερόμαστε, π.χ., σε videogames είτε σε κινητά είτε σε ρομπότ;Καθ. Γιώργος Γιαννακάκης: Ευχαριστώ πολύ για την πρόσκληση, είναι δική μου η χαρά που με φιλοξενείτε στο site σας. Υπάρχουν πολλαπλοί ορισμοί της τεχνητής νοημοσύνης. Κατά γενική ομολογία όμως η ΤΝ μπορεί να οριστεί ως η μελέτη υπολογιστικών διαδικασιών που προσπαθούν να μιμηθούν ανθρώπινες ικανότητες, οι οποίες με τη σειρά τους υπονοούν κάποια ευφυΐα. Η μάθηση, η προσαρμοστικότητα, η εξαγωγή συμπερασμάτων, η επίλυση προβλημάτων, και η αναγνώριση συναισθημάτων είναι μερικές από αυτές τις ικανότητές μας. Η βασική αρχή της μίμησης των πολλαπλών εκφάνσεων της ανθρώπινης νοημοσύνης είναι γενική ανεξάρτητα του τομέα εφαρμογής: από τα παιχνίδια και τα κινητά, στις εφαρμογές υγείας, στο internet, στα αυτόνομα οχήματα και στα drones.
Όπως αναφέρετε και στο βιβλίο σας, Artificial Intelligence and Games, oι υπολογιστές ξεκίνησαν να μαθαίνουν να παίζουν επιτραπέζια παιχνίδια από τη δεκαετία του 1950, με τη δημιουργία του αλγόριθμου Minimax από τον Alan Turing αλλά και την εφεύρεση της ενισχυτικής μάθησης (σήμερα ορίζεται ως «reinforcement learning») από τον Arthur Samuel. Μπορείτε να μας εξηγήσετε πόσο σημαντικά είναι αυτά τα δύο επιτεύγματα για την ΤΝ στα videogames και κατά πόσο -και αν- έχουν ξεπεραστεί σήμερα από άλλες τεχνικές;
Καθ. Γιώργος Γιαννακάκης: Είναι αστείο και μόνο να σκεφτεί κανείς ότι οι βασικές αρχές της αναζήτησης μέσω δέντρων απόφασης (από τον Turing) και της ενισχυτικής μάθησης (από τον Samuel) παραμένουν ατόφιες μέχρι και σήμερα. Τα βασικά τους στοιχεία βρίσκονται πίσω από σημαντικούς αλγόριθμους που κατάφεραν να επιλύσουν πολύ δύσκολα σύγχρονα προβλήματα, όπως οι αλγόριθμοι AlphaGo και AlphaZero της DeepMind, οι οποίοι παίζουν το επιτραπέζιο παιχνίδι Go καλύτερα από οποιονδήποτε παγκόσμιο πρωταθλητή.
Προφανώς τα τελευταία 60 και πλέον χρόνια έχουν γίνει τεράστια άλματα στην πρόοδο της ΤΝ. Σήμερα βρισκόμαστε στο σημείο να μιλάμε για την 4η βιομηχανική επανάσταση μέσω της ΤΝ, κυρίως λόγω των εκπληκτικών αποτελεσμάτων της σε πολύ δύσκολα προβλήματα. Τα ποιοτικά χαρακτηριστικά των αλγόριθμων του σήμερα (όπως η βαθιά μάθηση/deep learning), η διαθεσιμότητα μεγάλων δεδομένων (big data) αλλά και η συνεχής αύξηση της υπολογιστικής ισχύος, έχουν δώσει στην ΤΝ τεράστια ώθηση την τελευταία δεκαετία. Το αποτέλεσμα είναι ότι με την ΤΝ μπορούμε σήμερα να λύσουμε προβλήματα που φανταζόμαστε ότι θα λυθούν σε δεκαετίες στο μέλλον.
Είναι σημαντικό να τονίσουμε ότι τα παιχνίδια ευθύνονται για αυτήν την εξέλιξη της ΤΝ σε μεγάλο βαθμό: τόσο ως προβλήματα που καλείται να επιλύσει η ΤΝ παραδοσιακά, αλλά και ως τομέας που εισήγαγε νέες τεχνολογίες. Είναι χαρακτηριστικό ότι η ιδέα του προγραμματισμού μέσω της GPU (κάρτας γραφικών), που είναι η πλέον διαδεδομένη στη μηχανική μάθηση (machine learning) σήμερα, έχει προκύψει ως λύση για τη γρήγορη γραφική απεικόνιση (rendering) στα first person shooters.
Τα επιτραπέζια παιχνίδια όπως το σκάκι και η ντάμα έχουν υπάρξει τα κύρια παιχνίδια που δοκιμάζουμε την εξέλιξη της ΤΝ εδώ και δεκαετίες. Για ποιο λόγο τα έχουμε προτιμήσει τόσο καιρό για αυτό το σκοπό και τι πραγματικά σημαίνουν οι νίκες της ΤΝ απέναντι στην ανθρώπινη νοημοσύνη;
Καθ. Γιώργος Γιαννακάκης: Είναι πολλοί οι λόγοι που καθιστούν τα επιτραπέζια παιχνίδια σαν το Σκάκι και την Ντάμα ιδανικά για τη μελέτη της ΤΝ. Έχουν σαφώς καθορισμένους κανόνες, παίζονται μέσα σε πολύ συγκεκριμένα, προκαθορισμένα όρια, είναι παιχνίδια πλήρους πληροφορίας για τον αντίπαλο, δεν εμπεριέχουν τύχη (π.χ. μέσω ενός ζαριού) και είναι παιχνίδια εναλλαγής σειράς (turn-based). Τέλος είναι πολύ δημοφιλή στις περισσότερες χώρες και θεωρούνται, κατά γενική ομολογία, ως περίπλοκα παιχνίδια που απαιτούν ιδιαίτερες ικανότητες από τους ανθρώπους. Είναι προφανές ότι η εμπειρική επίλυση αυτών των παιχνιδιών θα αποτελούσε μια κατάκτηση για την ΤΝ. Η νίκη του Deep Blue έναντι του Kasparov το 1997 και η επίλυση της Ντάμας από την ομάδα του Πανεπιστημίου της Αλμπέρτας το 2007, μας έμαθαν ότι οι υπολογιστές μπορούν να επιλύσουν τα ίδια προβλήματα με εμάς αλλά με διαφορετικούς τρόπους.
Τα τελευταία χρόνια η Google DeepMind κατάφερε να παίξει ορισμένα παιχνίδια του Atari 2600. Γιατί είναι σημαντική μια τέτοια εξέλιξη;
Καθ. Γιώργος Γιαννακάκης: Η ομάδα της Deepmind, το 2015, με τη χρήση βαθιάς ενισχυτικής μάθησης (deep reinforcement learning) δεν κατάφερε απλά να παίξει όλα τα παιχνίδια της πλατφόρμας Atari 2600, κατάφερε να παίξει πολλά από αυτά καλύτερα από κάθε άνθρωπο. Η εξέλιξη αυτή πρόσθεσε ένα ακόμα ορόσημο στα επιτεύγματα της ΤΝ, καθώς τα παιχνίδια του Atari 2600 είναι παιχνίδια πραγματικού χρόνου ενώ κάποια από αυτά εμπεριέχουν τυχαιότητα. Η επιτυχία του αλγόριθμου DQN έθεσε σημαντικές βάσεις για την κυριαρχία των τεχνικών βαθιάς μάθησης και εκτός παιχνιδιών, σε όλα δηλαδή τα πεδία της ΤΝ.
Αρχές της δεκαετίας του 1980 η ΤΝ δεν είχε τη σημασία που έχει σήμερα. Όσο απομακρυνθήκαμε από το νόημα του «playability» και σταθεροποιηθήκαμε στην έννοια του «gameplay», τότε η ΤΝ απέκτησε τη δική της ξεχωριστή οντότητα και πολλά videogames κρίνονται από το πόσο καλή ή κακή είναι. Μία τέλεια ΤΝ βέβαια δεν προσφέρει καλό gameplay. Πόσο δύσκολο είναι για τις σύγχρονες ομάδες ανάπτυξης να δημιουργήσουν μία ΤΝ που να έχει την κατάλληλη ισορροπία μεταξύ δυσκολίας και…κλεψίματος;
Καθ. Γιώργος Γιαννακάκης: Είναι σαφώς δυσκολότερο να δημιουργήσουμε ΤΝ η οποία δεν παίζει απλώς για να κερδίσει αλλά παίζει με τον κατάλληλο τρόπο έναντι οποιουδήποτε αντίπαλου. Κατά μια έννοια η εύρεση της κατάλληλης ισορροπίας (balancing) ή ακόμα περισσότερο της κατάλληλης εμπειρίας (experience) φαντάζουν ως άγια δισκοπότηρα του σύγχρονου σχεδιασμού και ανάπτυξης παιχνιδιών.
Η εξέλιξη της ΤΝ σε ένα videogame σήμερα διαφέρει ανά περίπτωση. Είναι ακόμα εντυπωσιακή η ΤΝ που συναντήσαμε στο Halo, 18 χρόνια πριν, και από τι εξαρτάται η καλύτερη εφαρμογή της γενικότερα;
Καθ. Γιώργος Γιαννακάκης: Νομίζω ότι έχουμε πολλά παραδείγματα παιχνιδιών με εξαιρετική ΤΝ σε πολύ δυσκολότερα παιχνίδια - όπως π.χ. η πρόσφατη επιτυχία του AlphaStar στο StarCraft. Η τεχνολογία είναι πλέον σε μεγάλο βαθμό διαθέσιμη. Εξαρτάται από το σχεδιαστή τι έμφαση και προϋπολογισμό θα δώσει στην ΤΝ για να επιτύχει καλύτερα αποτελέσματα. Μιλώντας για προϋπολογισμό, νομίζω ότι η επένδυση σε εναλλακτικούς ρόλους της ΤΝ στα παιχνίδια είναι ενδεχομένως πιο προσοδοφόρα: αυτοί περιλαμβάνουν, μεταξύ άλλων, καταγραφή των προφίλ των παίκτη (player profiling), διαδικαστική δημιουργία περιεχομένου (procedural content generation), χρήση της ΤΝ στη δοκιμή παιχνιδιών κ.ο.κ.
Ζούμε σε μια περίοδο που οι μεγάλες εταιρείες δεν επενδύουν αρκετά πλέον σε single player games με τη δικαιολογία ότι οι πωλήσεις τους δεν είναι αρκετές ή ότι εμπεριέχουν μεγάλο ρίσκο. Προσωπικά πιστεύω ότι η στασιμότητα στην ΤΝ είναι ένας βασικός παράγοντας για την όποια αδιαφορία του κοινού απέναντι σε τίτλους single player. Πιστεύετε ότι είμαστε σε μια μεταβατική περίοδο όπου η ΤΝ θα χάσει τη σημασία της συγκριτικά με το online multiplayer ή στο μεταίχμιο να ανακαλύψουμε τις πραγματικές της δυνατότητες;
Καθ. Γιώργος Γιαννακάκης: Ο βασικός περιορισμός δεν βρίσκεται στην ΤΝ αλλά στον τρόπο που σχεδιάζουμε παιχνίδια με αυτήν. Τα παιχνίδια παραδοσιακά σχεδιάζονται με γνώμονα που δεν τοποθετεί την ΤΝ σε κεντρικό ρόλο γιατί, απλούστατα, η ΤΝ ήταν για δεκαετίες πολύ περιορισμένη. Ακαδημαϊκά μιλώντας, εδώ και πολλά χρόνια τα finite state machines και ο AlphaStar, για παράδειγμα, δεν θεωρούνται από πολλούς ερευνητές ως αλγόριθμοι ΤΝ. Ήρθε ο καιρός να ενημερωθούμε και να αρχίσουμε να εκμεταλλευόμαστε όλα τα πλεονεκτήματα της σύγχρονης ΤΝ για το σχεδιασμό παιχνιδιών. Για το καλό των παιχνιδιών και το δικό μας, ως παίκτες και ως σχεδιαστές.
Ας μην ξεχνάμε ότι, δυνητικά, η ΤΝ μπορεί να αναλάβει οποιονδήποτε ρόλο που μπορεί να αναλάβει κάποιος από εμάς σε σχέση με τα παιχνίδια: μπορεί να τα παίξει, να τα σχεδιάσει, να τα αξιολογήσει, να κάνει μάρκετινγκ κ.ο.κ.
Τα παιχνίδια στρατηγικής σήμερα χρησιμοποιούν ακόμα σχεδιαστικά μοντέλα του 1990, όπου «έξυπνη» ΤΝ θεωρείται αυτή που κλέβει, στην ουσία, με ένα σωρό μπόνους που δεν λαμβάνει ο παίκτης και τα οποία αποσκοπούν να ανεβάσουν τεχνητά τη δυσκολία. Πόσο μακριά είμαστε από την ικανότητα του ΑΙ να παίξει με τους ίδιους κανόνες σε ένα τέτοιο πολύπλοκο σύστημα και να μπορεί να μας ανταγωνιστεί, τρόπον τινά, επί ίσοις όροις;
Καθ. Γιώργος Γιαννακάκης: Είμαστε πολύ κοντά - πολύ πιο κοντά από ό,τι φανταζόμασταν. Η πρόσφατη νίκη του AlphaStar της Deepmind έναντι κορυφαίων επαγγελματιών παικτών του StarCraft είναι η απόδειξη. Παρ’ ότι δεν είμαστε ακόμα σε θέση να πούμε ότι ο AlphaStar παίζει το παιχνίδι επί ίσοις όροις με επαγγελματίες παίκτες, το αποτέλεσμα παραμένει σημαντικό. Χωρίς να θέλω να κάνω ακριβείς προβλέψεις, αλλά, δεδομένης της διαθέσιμης τεχνολογίας (π.χ. βαθιά και ενισχυτική μάθηση, στοχαστική αναζήτηση δέντρου αποφάσεων), νομίζω ότι η ΤΝ που θα μπορεί να νικήσει οποιοδήποτε αντίπαλο σε οποιαδήποτε παιχνίδι στρατηγικής είναι πολύ πιο κοντά.
Το διάσημο Forza Motorsport χρησιμοποιεί τα λεγόμενα Drivatars, αντιπάλους με ΤΝ που μαθαίνουν από τους παίκτες που αγωνίζονται για να προσφέρουν πιο απρόβλεπτη εμπειρία στην οδήγηση. Είναι αυτό μια λύση για να έχουμε πιο πολυεπίπεδη ΤΝ στα videogames;
Καθ. Γιώργος Γιαννακάκης: Ναι, βεβαίως. Η μάθηση μέσω μίμησης (imitation learning) που χρησιμοποιούν και τσ Drivatars είναι ένας τρόπος που επιτρέπει την ύπαρξη πολυεπίπεδης ΤΝ στα παιχνίδια. Ένας άλλος τρόπος είναι η ενισχυτική μάθηση (reinforcement learning). Και οι δύο μέθοδοι, για παράδειγμα, αλλά με παραλλαγμένες μορφές, χρησιμοποιούνται από τον πρόσφατο και άκρως επιτυχημένο AlphaStar.
Με αφορμή τα Drivatars, μπορείτε να μας πείτε μερικά λόγια για το Player Modeling και σε τι βαθμό μπορεί να βοηθήσει για τη δημιουργία πιο πειστικού ΑΙ;
Καθ. Γιώργος Γιαννακάκης: Η μοντελοποίηση παίκτη (player modeling) μελετά κυρίως τη χρήση ΤΝ για τη δημιουργία υπολογιστικών μοντέλων παικτών. Με τον όρο «μοντέλο» αναφέρομαι σε μια μαθηματική αναπαράσταση που μπορεί να είναι ένα σύνολο κανόνων, παραμέτρων ή πιθανοτήτων το οποίο περιγράφει τη συνάρτηση μεταξύ των χαρακτηριστικών του παίκτη και της αλληλεπίδρασής του με το παιχνίδι, καθώς και την ανταπόκριση του παίκτη σε αυτήν την αλληλεπίδραση.
Τα παιχνίδια μπορούν να προκαλέσουν δυναμικά και σύνθετα συναισθήματα στον παίκτη, οι εκδηλώσεις των οποίων δεν μπορούν να καταγραφούν με τις κλασικές μεθόδους της ψυχολογίας. Έτσι, η κατανόηση και η μοντελοποίηση της αλληλεπίδρασης μεταξύ παίκτη και παιχνιδιού μπορεί να θεωρηθεί ως το «ιερό δισκοπότηρο» στο σχεδιασμό και την ανάπτυξη ενός παιχνιδιού. Ο σωστός σχεδιασμός της αλληλεπίδρασης και της εμπειρίας μπορεί να οδηγήσει σε ένα επιτυχημένο παιχνίδι που προσφέρει μοναδικές στιγμές στους παίκτες του. Οι μέθοδοι ΤΝ που χρησιμοποιούνται για τη μοντελοποίηση παίκτη βασίζονται κυρίως σε game/player analytics, data mining και machine learning.
Μπορούμε να εστιάσουμε λίγο σε αυτό το ιερό δισκοπότηρο; Αυτή η σχέση μεταξύ του παίκτη και της ΤΝ, αυτή η αλληλεπίδραση, μπορεί να σημαίνει ότι θα έχουμε ΤΝ με την ικανότητα να δημιουργεί νέες στρατηγικές σε πραγματικό χρόνο απέναντι σε παίκτες ώστε να τους αντιμετωπίσει, π.χ. σε ένα fighting game, προσφέροντας έτσι μια πρωτόγνωρη ποικιλία;
Καθ. Γιώργος Γιαννακάκης: Ακριβώς. Αυτός είναι ένας από τους απώτερους στόχους της μοντελοποίησης παίκτη: η εξατομίκευση της εμπειρίας. Αν δούμε μια τυπική σημερινή διάδραση μεταξύ ενός παιχνιδιού και ενός παίκτη, θα παρατηρήσουμε ότι ο μόνος που μαθαίνει κάτι από αυτήν τη διάδραση είναι ο παίκτης. Σε μια «δίκαιη» αλληλεπίδραση μεταξύ ανθρώπου και μηχανής, κάποιος θα περίμενε να πράττει το ίδιο και η μηχανή: να μας μαθαίνει!
Ποια είναι τα στοιχεία που κάνουν μια ΤΝ πραγματικά ενδιαφέρουσα για έναν άνθρωπο;
Καθ. Γιώργος Γιαννακάκης: Ενδιαφέρουσα είναι η ΤΝ η οποία μπορεί και κάνει πράγματα που οι άνθρωποι βρίσκουν ενδιαφέροντα - και αυτά κατά γενική ομολογία είναι απαντήσεις σε μη σαφώς ορισμένα προβλήματα ή μη συμβατικές προτάσεις και αποφάσεις. Οι τομείς που βλέπω ως τους πλέον ενδιαφέροντες μέσα στα παιχνίδια είναι αυτός της υπολογιστικής δημιουργικότητας (computational creativity) και του συναισθηματικού υπολογισμού (affective computing): ο πρώτος συσχετίζεται με τη διαδικαστική παραγωγή περιεχομένου (procedural content generation) και ο δεύτερος με τη μοντελοποίηση παίκτη (player modelling).
Η απάντησή σας μας φέρνει σε μία από τις μεγαλύτερες σύγχρονες προκλήσεις στα videogames: την παραγωγή περιεχομένου. Μπορείτε να μας εξηγήσετε πώς μπορεί να βοηθήσει σε αυτό η μέθοδος του procedural generation; Υπάρχει κάποιος περιορισμός και σε ποιες κατηγορίες μπορεί να χρησιμοποιηθεί; Επιπρόσθετα, ποιος πιστεύετε ότι είναι ο τελικός σκοπός (ή όριο) της μεθόδου; Μήπως η παραγωγή ολοκληρωμένων videogames;
Καθ. Γιώργος Γιαννακάκης: Η διαδικαστική δημιουργία περιεχομένου (procedural content generation, PCG) είναι μια αναπτυσσόμενη μορφή ΤΝ. Ενώ τα παιχνίδια ενσωμάτωναν αλγόριθμους δημιουργίας περιεχομένου ήδη από τις αρχές της δεκαετίας του 1980, π.χ. το Rogue και το Elite, το ερευνητικό ενδιαφέρον στον ακαδημαϊκό χώρο έχει επιταχυνθεί μόλις την τελευταία δεκαετία. Οι αλγόριθμοι PCG αναφέρονται σε μεθόδους για την παραγωγή περιεχομένου παιχνιδιών, είτε αυτόνομα είτε με περιορισμένη ανθρώπινη συμβολή. Το περιεχόμενο ενός παιχνιδιού περιλαμβάνει επίπεδα, χάρτες, κανόνες, γραφικά, ιστορίες, αντικείμενα, αποστολές, μουσική, όπλα, οχήματα, χαρακτήρες κ.λπ. Η πιο συνηθισμένη χρήση PCG είναι για τη δημιουργία επιπέδων και εδάφους, για παράδειγμα στο Spelunky και το No Man's Sky.
Και ναι, ο τελικός στόχος του PCG είναι η υποβοήθηση της παραγωγής ολοκληρωμένων παιχνιδιών. Είναι σημαντικό όμως να σημειώσω ότι το PCG δεν μπορεί να αντικαταστήσει όλα όσα μπορεί να δημιουργήσει ένας σχεδιαστής ή ένας καλλιτέχνης. Αντ' αυτού, η ΤΝ μπορεί να αυξήσει τη δημιουργικότητα των μεμονωμένων δημιουργών μέσω της ενσωμάτωσης PCG σε ευφυή εργαλεία σχεδιασμού.
Αυτό σημαίνει ότι μπορεί κάποιος καλλιτέχνης να δημιουργήσει μια σχεδιαστική βάση και η ΤΝ να την εφαρμόσει και να προσθέσει αρκετή ποικιλία ώστε να έχουμε, π.χ., τη δημιουργία κουλτούρας (ενδυμασίες, όπλα, σχεδιασμός κτιρίων κ.τ.λ.) σε έναν πολιτισμό από NPCs ενός MMORPG; Μπορεί να υπάρξει δηλαδή ομαλή συνεργασία μεταξύ του οράματος ενός καλλιτέχνη σε ένα videogame και των επιλογών της ΤΝ;
Καθ. Γιώργος Γιαννακάκης: Ναι, αυτός είναι ένας βασικός ρόλος του PCG: ο «δημιουργικός διάλογος» με ένα σχεδιαστή και η υποβοήθηση της σχεδιαστικής διαδικασίας. Κατ’ επέκταση, το παράδειγμα που αναφέρετε είναι δυνητικά πιθανό, αν και όχι εύκολο. Παρόμοια παραδείγματα είναι η συδημιουργία (παίκτη-μηχανής) χαρακτήρων στο Spore ή και η πρόσφατη μεταφορά στιλ (style transfer) γραφικών από το PUBG στο Fortnite.
Σε παιχνίδια σαν το Diablo που βασίζονται απλά και μόνο στην εξερεύνηση και στη δράση, το procedural generation λειτουργεί εξαιρετικά. Αντίθετα, σε παιχνίδια όπως το Skyrim ή το Elite Dangerous, όπου το αυτοματοποιημένο περιεχόμενο είναι μέρος του gameplay, το αποτέλεσμα είναι άψυχο και ρομποτικό λόγω της επανάληψης. Θα μπορέσει ποτέ το procedural generation να χρησιμοποιηθεί για τη δημιουργία περιεχομένου που βασίζεται λίγο περισσότερο, π.χ., στη δουλειά ενός σεναριογράφου ή ενός σχεδιαστή που συνθέτει ολόκληρα chain quests και NPCs σε ένα RPG;
Καθ. Γιώργος Γιαννακάκης: Οι αλγόριθμοι δημιουργίας περιεχομένου μπορούν να καθορίσουν τόσο την πλοκή του παιχνιδιού όσο και τους τρόπους με τους οποίους απεικονίζεται (ή αφηγείται) μια ιστορία μέσω του περιβάλλοντος. Η διαδραστική αφήγηση στα παιχνίδια εξαρτάται σε μεγάλο βαθμό από το μοντέλο που έχει το σύστημα για τον κόσμο. Τα παιχνίδια που βασίζονται σε αφηγήσεις, όπως π.χ. το Heavy Rain, μπορεί να περιλαμβάνουν χιλιάδες γραμμές διαλόγου από διάφορους συγγραφείς. Για να επιτευχθεί διαδραστική αφήγηση το παιχνίδι θα πρέπει να μπορεί να επιλέγει απαντήσεις (ή διαδρομές) με βάση το τι θα κάνει ή θα πει ο παίκτης, όπως π.χ. στο Facade.
Για να μη χρειαστεί ένας συγγραφέας να απεικονίσει όλην την ιστορία του παιχνιδιού σε μια βάση δεδομένων, μπορούν να χρησιμοποιηθούν προσεγγίσεις που βασίζονται σε υπάρχοντα δεδομένα από υπάρχουσες ιστορίες ή κομμάτια αυτών. Αυτά τα δεδομένα μπορούν να προέλθουν από χιλιάδες παίκτες που έχουν ήδη αλληλεπιδράσει με τους NPCs ενός παιχνιδιού και έτσι να τους εκπαιδεύσουν ώστε να απαντήσουν με παρόμοιο τρόπο χρησιμοποιώντας μηχανική μάθηση. Αντ' αυτού, θα μπορούσε κανείς να χρησιμοποιήσει δεδομένα, π.χ., από την Wikipedia, έτσι ώστε να βρει κοινά στοιχεία μεταξύ διαφορετικών πραγματικών προσώπων που μπορούν να γίνουν οι ίδιοι χαρακτήρες σε ένα παιχνίδι μυστηρίου.
Η χρήση PCG για τη δημιουργία περιεχομένου για σενάρια και ιστορίες είναι από τα πλέον δύσκολα προβλήματα δημιουργίας περιεχομένου. Δεδομένων όμως των πρόσφατων σημαντικών βημάτων στον χώρο του natural language generation (μέσω του deep learning) το μέλλον φαντάζει ιδιαίτερα φωτεινό και για αυτόν το χώρο.
Η πολυπλοκότητα των videogames έχει αυξηθεί σε πολύ μεγάλο βαθμό και πολλά από αυτά απεικονίζουν ολόκληρους κόσμους, με χώρες, πόλεις και NPCs. H πειστική συμπεριφορά των NPCs είναι πολύ βασική για το λεγόμενο «suspension of disbelief» του παίκτη. Μπορείτε να μας εξηγήσετε τι είναι το Affective Computing και αν μπορούν πτυχές του να εφαρμοστούν ώστε οι NPCs να συμπεριφέρονται πιο πειστικά - να δείχνουν φόβο, περιέργεια, γενναιότητα κ.τ.λ. για γεγονότα που λαμβάνουν χώρα γύρω τους;
Καθ. Γιώργος Γιαννακάκης: Μιλάμε βεβαίως για το συναισθηματικό υπολογισμό στον οποίο αναφέρθηκα προηγουμένως στην τοποθέτηση μου για το player modelling. O συναισθηματικός υπολογισμός είναι μέγιστης σημασίας τόσο για την κατανόηση των παικτών, όσο και για τη δημιουργία NPCs που είναι πιο πειστικοί στον τρόπο που παίζουν το παιχνίδι αλλά και στον τρόπο που εκφράζονται συναισθηματικά. Μπορεί παράλληλα να χρησιμοποιηθεί και για πολύ πιο ποιοτικό testing των παιχνιδιών.
Επίσης, ο συναισθηματικός υπολογισμός περιλαμβάνει τρόπους χρήσης μηχανικής μάθησης για την εξαγωγή κάποιας υποτιθέμενης σχέσης μεταξύ του τι κάνει ένας παίκτης όταν παίζει και του τι αισθάνεται. Σε μια πρόσφατη συνεργασία μας, π.χ., με την Ubisoft Massive, καταφέραμε να προβλέψουμε τα επίπεδα κινήτρου (motivation) των παικτών στο Tom Clancy’s the Division αποκλειστικά και μόνο παρατηρώντας το τι κάνουν στο παιχνίδι - τα μοντέλα πρόβλεψής μας αγγίζουν τη βεβαιότητα (ακρίβεια άνω του 90%)!
Αναφέρατε την πρόσφατη συνεργασία σας με την Ubisoft. Πόσο συχνές είναι αυτές οι συνεργασίες; Υπάρχει ουσιαστική σχέση μεταξύ των εταιρειών videogames με τους επιστήμονες της ΤΝ και ποιο πιστεύετε ότι θα είναι το αμέσως επόμενο μεγάλο άλμα στην ΤΝ ώστε να βελτιωθεί η εμπειρία των παικτών;
Καθ. Γιώργος Γιαννακάκης: Βεβαίως, οι συνεργασίες μεταξύ εταιρειών και πανεπιστημίων είναι ολοένα και πιο συχνές. Οι προσεγγίσεις είναι αμοιβαίες όταν και οι δύο πλευρές επιθυμούν να λύσουν παρόμοια προβλήματα, όπως π.χ. procedural content generation, player modeling, analytics, NPC agent control, κ.ο.κ. Οι συνεργασίες γίνονται στα πλαίσια χορηγιών από τις εταιρείες ή στα πλαίσια κοινών ερευνητικών προγραμμάτων (π.χ. Horizon 2020, NSF). Η ομάδα μου, όπως και πολλές άλλες ομάδες στο χώρο, ήταν πάντα σε επαφή με τη βιομηχανία παιχνιδιών με στόχο την επίλυση πραγματικών προβλημάτων. Βλέπω εξίσου σημαντική τόσο τη βασική όσο και την εφαρμοσμένη έρευνα στο χώρο της ΤΝ (αλλά και γενικά), καθώς η μία μπορεί να εξάγει συμπεράσματα που θα προωθηθούν από την άλλη.
Αξίζει να αναφέρω ότι, σε πολλές περιπτώσεις, οι ακαδημαϊκοί δεν ενδιαφέρονται για τα θέματα της βιομηχανίας παιχνιδιών και αντίστοιχα οι εταιρείες δεν ενδιαφέρονται για τους πομπώδεις αλγόριθμους των ερευνητών. Αυτό βεβαίως δεν το βλέπω ως πρόβλημα αλλά σαν μια καθόλα υγιή σχέση μεταξύ των δύο, καθώς ο κάθε χώρος προσφέρει στην ανάπτυξη ΤΝ με διαφορετικούς τρόπους και μέσω διαφορετικών πρισμάτων.
Μιλώντας πιο γενικά, συμμερίζεστε καθόλου τους φόβους που διατυπώνονται από διάφορους επιστήμονες για την εξέλιξη της ΤΝ; Υπάρχει κάποιο όριο που δεν πρέπει να ξεπεράσουμε και στα videogames;
Καθ. Γιώργος Γιαννακάκης: Σε γενικές γραμμές δεν συμμερίζομαι αυτούς τους φόβους για πολύ απλούς λόγους. Θα αναφέρω τέσσερις από τους πιο σημαντικούς για χάρη συντομίας: α) η ΤΝ που παράγουμε σήμερα απέχει πολύ από να είναι γενικευμένη (μπορεί να λύσει μόνο ένα συγκεκριμένο πρόβλημα), β) ο τρόπος με τον οποίο «σκέφτονται» οι μηχανές δεν συνάδει απαραίτητα με την ανθρώπινη νοημοσύνη, γ) η εξέλιξη της ΤΝ και της υπολογιστικής ισχύος είναι ουσιαστικά πολύ πιο αργές από ό,τι φανταζόμαστε ή παρουσιάζεται στα Μέσα και δ) η ΤΝ δεν μας μισεί. [σ.α.: Give it time. Give it time.]
Τα μόνο όρια που δεν πρέπει να υπερβούμε σε καμία περίπτωση είναι ηθικής φύσεως. Κάτω από αυτό το πρίσμα θα τοποθετήσω θέματα προκαταλήψεων και στερεοτύπων που εισάγουμε (άθελα ή ηθελημένα μας) σε αλγόριθμους ΤΝ. Για παράδειγμα, φανταστείτε έναν αλγόριθμο τεχνητής όρασης που εκπαιδεύεται να κατανοήσει διαφορές στον τρόπο που σχεδιάζουμε ένα παιχνίδι. Ο αλγόριθμος εκτίθεται σε χιλιάδες εικόνες δεδομένων εκπαίδευσης, οι περισσότερες από τις οποίες δείχνουν τον τρόπο που σχεδιάζουν άντρες από την Ελλάδα. Ο αλγόριθμος είναι πιθανό να μάθει ότι ο καλός σχεδιασμός προέρχεται αποκλειστικά και μόνο από Έλληνες, ενώ οτιδήποτε διαφορετικό σε επίπεδο σχεδιασμού (π.χ. από οποιαδήποτε γυναίκα ή οποιοδήποτε άλλο μέρος του κόσμου) θα αναγνωρίζεται ως κακός. Συγχαρητήρια, μόλις δημιουργήσαμε μια ΤΝ με ρατσιστικό συμπέρασμα! Επιγραμματικά, η σωστή χρήση δεδομένων και η διαφάνεια των αλγορίθμων είναι απαραίτητα για μια ηθική ΤΝ.
Από το σήμερα στο αύριο
Η Τεχνητή Νοημοσύνη στα videogames δεν είναι απλά αποτέλεσμα ενός έξυπνου αλγόριθμου ή κάποιας σχεδιαστικής επιλογής που μεταμορφώνει τη ρομποτική αντίδραση ενός NPC σε κάτι που θυμίζει ανθρώπινη επαφή. Η ΤΝ είναι ο μοναδικός τρόπος για να μάθουμε, μια για πάντα, ποια είναι τα πραγματικά όρια των videogames. Ένας κόσμος ΜΜΟ όπου οι NPC πολίτες του αντιδρούν πειστικά στις μεταβολές του, όπου οι αποστολές δημιουργούνται δυναμικά και που το gameplay δεν είναι εγκλωβισμένο στο αιώνιο grind. Ένα fighting game που αντιδρά στις τεχνικές των παικτών, ένας πολιτισμός σε κάποιο μακρινό πλανήτη ενός space simulator που φτιάχνει μοναδικά όπλα, ένα παιχνίδι στρατηγικής που δεν κλέβει αλλά χρησιμοποιεί πολιτικές, τακτικές βασισμένες σε αληθινά γεγονότα, ένα sports game όπου οι ομάδες μπορούν να κάνουν έξυπνες επιλογές ανάλογα με την πορεία ενός αγώνα, ενός πρωταθλήματος, μίας μεταγραφής.Περισσότερο απ’ όλα, όμως, ίσως η ΤΝ να μην είναι απλά η αιτία για να βελτιώσουμε την εμπειρία ενός videogame, αλλά, όπως συμβαίνει με άλλα είδη τέχνης, να μάθουμε κάτι για τον εαυτό μας, ως παίκτες και ως άνθρωποι. Αυτή η συναισθηματική επιφοίτηση ή λύτρωση που μας προσφέρει απλόχερα ένα βιβλίο, ένα θεατρικό έργο, μία κινηματογραφική ταινία, ένα τραγούδι ή ένας πίνακας ζωγραφικής, ίσως να μην είναι δυνατή από το gameplay όπως το ξέρουμε σήμερα. Ίσως να υπάρχει ένα στάδιο πάνω από το gameplay όπου μπορούμε να φτάσουμε μόνο μέσω της ΤΝ, ένα σημείο όπου πιθανά κάποιος NPC, σχεδόν ακούσια, μας διδάξει μέσω του ψηφιακού κόσμου μια αλήθεια που μπορεί, αυτόνομα, να χρησιμοποιηθεί καλόβουλα και αποτελεσματικά στην καθημερινότητά μας.
Αρκεί, βέβαια, να είμαστε έτοιμοι να ζητήσουμε κάτι παραπάνω από τη σκιά της απόλαυσης που προσφέρουν οι CPU και οι GPU αυτού του κόσμου. Όχι κάτι ρεαλιστικό, δηλαδή, αλλά κάτι ανθρώπινο.
Να είστε καλά και μην ξεχνάτε: σκάβοντας πας στην πόλη.
Το άρθρο κόσμουν τρία πρωτότυπα σχέδια, ειδικά για την περίσταση, του εξαιρετικού Βασίλη Γεωργακόπουλου.
Βρείτε τον Ηλία Παππά στο Facebook και στο twitter
Πολύ ενδιαφέροντα όλα όσα μας λέει ο καθηγητής και το εξαιρετικό άρθρο του Ηλία. Θα ήθελα να σταθώ στις προβλέψεις του για το μέλλον του A.I. οι οποίες. όπως γίνεται συνήθως, είναι πολύ συντηρητικές από πλευράς επιστημόνων: δεν μιλάμε για κάποιο ενδεχόμενο super intelligence τύπου Skynet. Στην πραγματικότητα ένας αλγόριθμος αναγνώρισης προσώπου, άλλος ένας για πλοήγηση drone και μια εκρηκτική γόμωση είναι τα τρια πράγματα που απαιτούνται για την κατασκευή ενός hunter-killer drone και αυτά βρίσκονται προ πολλού στο στάδιο της ανάπτυξης και της εφαρμογής. Η Google έχει παραδεχτεί ότι ασχολείται με την ανάπτυξη οπλικού A.I. για λογαριαμό της κυβέρνησης των ΗΠΑ και ασφαλώς δεν γνωρίζουμε καν τι κάνει η Tencent και άλλες εταιρείες στην Κίνα. Μπορεί να μην κινδυνεύουμε ακόμα από κάποιο rogue ASI, αυτό όμως δε σημαίνει ότι δεν υπάρχουν σοβαροί κίνδυνοι στο άμεσο μέλλον.
Είναι μεγάλη κουβέντα και κυρίως πρέπει πρώτα να ξεχωρίσουμε τη διαφορά μεταξύ αυτόνουμου επικίνδυνου ΑΙ και ΑΙ που μπορεί να γίνει επικίνδυνο στα χέρια των ανθρώπων. Δυστυχώς, το δεύτερο βλέπω ότι έχει πολλές περισσότερες πιθανότητες να συμβεί από το πρώτο.
Υπάρχουν και πολλά άλλα θέματα. Πόσο καλλιτεχνικό θα είναι το επίτευγμα ενός ΑΙ σε ένα παιχνίδι; Θα αποκλείσει προγραμματιστές από το χώρο εργασίας; Πώς θα σχεδιάζονται πλέον τα open world, αν η παραγωγή περιεχομένου δεν είναι τόσο μεγάλο πρόβημα; Πόσο θα δεθούμε με πιο ρεαλιστικούς NPC -που θα είναι η μεγαλύτερη επανάσταση στα games - την ώρα που δενόμαστε με αυτούς που έχουμε τώρα; Και έχει νόημα να κάνουμε όλες αυτές τις ερωτήσεις αν το αποτέλεσμα είναι η εξέλιξη; Είναι τόσα πολλά τα ερωτήματα για τα videogames που μόνο το να τα σκέφτεσαι είναι τρομερά συναρπαστικό.