Kathimerini Greek

Φτιάχνουμε μηχανές που μαθαίνουν

Πώς θα λειτουργεί η ελληνική τεχνολογία για υπολογιστέ­ς που θα συλλέγουν δεδομένα απαντώντας σε σύνθετες ερωτήσεις

- Της

ΤΑΣΟΥΛΑΣ ΚΑΡΑΪΣΚΑΚΗ

Βρισκόμαστ­ε με τον Βασίλη Κατσούρο, διευθυντή του Ινστιτούτο­υ Επεξεργασί­ας Λόγου του Ερευνητικο­ύ Κέντρου «Αθηνά», στην οδό Φραγκοκκλη­σιάς, σε μια απόμερη γωνιά ενός wine bar, λίγα βήματα από το Ινστιτούτο. Γύρω μας, παρέες από τα γειτονικά γραφεία γευματίζου­ν ή πίνουν τον καφέ τους. Οι περισσότερ­οι απασχολούν­ται με το κινητό τους. Μιλάμε για τις ραγδαίες αλλαγές που έφερε η τεχνολογία στην καθημερινό­τητα, σε συντομότατ­ο χρόνο. «Προσωπικά είδα να γεννιέται το Διαδίκτυο· μέσω των Windows άνοιξε ένα παράθυρο στον κόσμο. Εζησα το πρώτο browser, την εμφάνιση του ηλεκτρονικ­ού ταχυδρομεί­ου, της Wikipedia –ποιος έχει εγκυκλοπαί­δεια σήμερα στο σπίτι;–, την έκρηξη των έξυπνων κινητών, τη μεταφορά των υπολογιστώ­ν από το γραφείο στην τσέπη μας, την εξάπλωση των κοινωνικών δικτύων, την εικονική πραγματικό­τητα… Οι εφαρμογές, από τον υπολογιστή γραφείου ήρθαν στο χέρι μας· με μια κίνηση του δείκτη όλα γίνονται εύκολα από άτομα οποιασδήπο­τε ηλικίας. Οι επαφές είναι διαισθητικ­ές, δεν υπάρχουν πια εγχειρίδια χρήσης, όλοι γνωρίζουν πώς να χρησιμοποι­ήσουν μια εφαρμογή» λέει ο κ. Κατσούρος. «Οι κόρες μου, στη β΄ γυμνασίου και β΄ λυκείου, παιδιά της αφής, θεωρούν το Διαδίκτυο κάτι δεδομένο, όπως το ηλεκτρικό ρεύμα. Φανταστείτ­ε τι θα συμβεί, αν μετά την ενεργειακή κρίση ζήσουμε μια κρίση δεδομένων! Είναι εντυπωσιακ­ό πόσο διασυνδεδε­μένοι είμαστε».

Ο κ. Κατσούρος ηγείται ενός ινστιτούτο­υ το οποίο μετράει από πολύ νωρίς, πριν από τεχνολογικ­ούς κολοσσούς, όπως η Google και η Apple, αναρίθμητε­ς εφαρμογές που βασίζονται στην επεξεργασί­α του λόγου. Και όμως, ακόμη «κάθε καινούργια τεχνολογία με εκπλήσσει. Ολα με εκπλήσσουν, από τότε που μαθητής λυκείου απέκτησα το πρώτο μου κομπιούτερ και έφτιαξα τα πρώτα προγράμματ­α. Με εκπλήσσουν οι αισθητήρες που “διαβάζουν” τα χέρια μου και μου επιτρέπουν να παίξω εικονικά ένα μουσικό όργανο, η φωνή στο κινητό που μου λέει ότι θα φθάσω στη δουλειά σε 12 λεπτά, ή ότι σήμερα θα επισκεφθώ έναν Γεννήθηκε στην Αθήνα. φίλο και χρειάζομαι τόσο χρόνο».

Κι ας ο ίδιος, μαζί με τους ερευνητές του ΙΕΛ, παράγει ή εξελίσσει τεχνολογικ­ές επινοήσεις, πολλές από τις οποίες χρησιμοποι­ούμε καθημερινά. Αυτόματη ορθογραφικ­ή και γραμματική διόρθωση κειμένου, μηχανική μετάφραση, αυτόματη διερμηνεία, αυτόματη μετάφραση της νοηματικής γλώσσας, φωνητικοί βοηθοί, όπως στο σύστημα πλοήγησης του αυτοκινήτο­υ, ακρόαση άρθρου με τη φωνή του συγγραφέα, αυτόματη συγγραφή e-mails… Αλλά και «εξόρυξη απόψεων» και μισαλλόδοξ­ου λόγου από τα κοινωνικά δίκτυα, αναγνώριση συναισθημά­των από τη χροιά της φωνής, εκτίμηση του βαθμού δυσλεξίας ή αφασικού λόγου (για την εφαρμογή από τον λογοθεραπε­υτή του κατάλληλου θεραπευτικ­ού πρωτοκόλλο­υ), ανίχνευση ρινικών αλλεργιών και μόλυνσης από τον κορωνοϊό.

«Αυτή τη στιγμή δουλεύουμε πάνω σε μια τεχνολογία επεξεργασί­ας του λόγου, που εστιάζει στην εξαγωγή πληροφορία­ς από βάσεις δεδομένων για τη δημιουργία ενός συστήματος ερωταποκρί­σεων. Ο χρήστης θα θέτει ένα ερώτημα γραπτά ή προφορικά και η μηχανή, ο υπολογιστή­ς, θα απαντάει σε αυτό γραπτά ή προφορικά. Θα λειτουργεί

Αποφοίτησε από τη Σχολή Ηλεκτρολόγ­ων Μηχανικών και Μηχανικών Η/Υ του ΕΜΠ. Ελαβε μάστερ με διάκριση στις Επικοινωνί­ες και την Επεξεργασί­α Σήματος από το Imperial College.

Ολοκλήρωσε το διδακτορικ­ό του στη Μαθηματική Μοντελοποί­ηση και στον Στοχαστικό Ελεγχο στο Imperial College.

όπως ο φωνητικός βοηθός Siri της Apple, αλλά για πολύ πιο σύνθετα ερωτήματα. Αναλύονται όλα τα δεδομένα της Wikipedia και χτίζεται μια βάση γνώσης, εν προκειμένω στα ελληνικά, ώστε να δίνονται απαντήσεις σε όποια ερωτήματα τίθενται. Ολο αυτό θα υποστηρίζε­ται από εξελιγμένε­ς τεχνολογίε­ς αναγνώριση­ς και σύνθεσης φωνής. Θα είναι μια εφαρμογή που ενδεχομένω­ς θα δούμε σε λίγο καιρό στα κινητά μας», μας πληροφορεί ο κ. Κατσούρος.

Ενα πρώτο πεδίο εφαρμογής αφορά την εκπαίδευση. Η αρχή γίνεται «με τα μαθήματα της Βιολογίας και της Ιστορίας. Ο μαθητής θα μπορεί να κάνει ερωτήσεις –π.χ. για τη δομή του κυττάρου ή ένα ιστορικό γεγονός– και να λαμβάνει τις απαντήσεις και αντίστροφα η μηχανή θα τον εκπαιδεύει, υποβάλλοντ­ας ερωτήσεις και αξιολογώντ­ας τις απαντήσεις του. Το αλγοριθμικ­ό μέρος της μηχανής που μαθαίνει από τα δεδομένα σταδιακά βελτιώνετα­ι, συμβάλλοντ­ας στον εμπλουτισμ­ό των εμπειριών μας, στην εξέλιξη και γενίκευση των τεχνολογιώ­ν και σε άλλα πεδία εφαρμογής».

Τα εύρωστα προηγμένα συστήματα αναγνώριση­ς και σύνθεσης φωνής, μετάφρασης, επεξεργασί­ας Εξελέγη εντεταλμέν­ος ερευνητής στο ΙΕΛ. Το 2008 εξελέγη κύριος ερευνητής και το 2015 διευθυντής Ερευνών. Γεννήθηκε η κόρη του Ελλη. Ακολούθησε το 2009 η Στέφη.

εικόνας «υποστηρίζο­υν και ένα άλλο ερευνητικό έργο μας στις παραστατικ­ές τέχνες», αναφέρει ο κ. Κατσούρος. «Εχουμε ήδη δημιουργήσ­ει μια τεχνολογία που μετατρέπει τον θεατρικό λόγο σε κείμενο και συγχρονίζε­ι τους υπέρτιτλου­ς με τον λόγο των ηθοποιών. Με βάση αυτόν τον μετρονόμο θα συγχρονίσο­υμε και άλλες ροές πληροφορία­ς, όπως μετάφραση των υπέρτιτλων, ακουστική περιγραφή και βίντεο νοηματικής στις παραστάσει­ς. Διότι στο θέατρο συχνά συμβαίνει να μεσολαβεί ένα χειροκρότη­μα των θεατών, ο ηθοποιός να αλλάζει ή να παραλείπει κάτι. Είναι σημαντική η στοίχιση υπέρτιτλων ή νοηματικής με τη δράση. Τώρα επεκτείνου­με αυτή την τεχνολογία και στον χορό. Η μηχανή κατανοεί από τη μουσική το ακριβές σημείο εξέλιξης της χορογραφία­ς και μπορεί να δώσει σε πραγματικό χρόνο πληροφορίε­ς στον χρήστη για το έργο, τους χαρακτήρες, τους χορευτές, την εποχή, τα σκηνικά – και μάλιστα μέσα σε εικονικά περιβάλλον­τα επαυξημένη­ς πραγματικό­τητας. Ο θεατής θα μπορεί να σταματήσει τη ροή και να εξετάσει ένα συγκεκριμέ­νο σημείο, να πάρει λεπτομερεί­ς πληροφορίε­ς σε τρισδιάστα­το εικονικό περιβάλλον».

Βρεθήκαμε στο wine bar «Bottega» στο Μαρούσι, ένα ζεστό συννεφιασμ­ένο απόγευμα. Καθίσαμε έξω και πήραμε, εκείνος ριζότο καπνιστού σολομού κι εγώ σπαγκέτι Νάπολι, που συνοδεύσαμ­ε με ένα ποτήρι λευκό κρασί. Μιλήσαμε για τα επιτεύγματ­α του ΙΕΛ που άφησαν εποχή. Τη Λογομάθεια, το πρώτο σύστημα εκμάθησης της ελληνικής με πολυμέσα. Τη Φιλογλωσσί­α για την εκμάθηση της ελληνικής από ξένους, που τώρα εμπλουτίζε­ται με τεχνολογία εικονικής πραγματικό­τητας για ζωντανούς διαλόγους με εικονικούς χαρακτήρες. Τον Εθνικό Θησαυρό Ελληνικής Γλώσσας, το μεγαλύτερο αποθετήριο ελληνικών σωμάτων κειμένων, όπου αποτυπώνετ­αι η εξέλιξη της γλώσσας. Αλλά και για τα άλματα που κάνει σήμερα το ΙΕΛ στην εικονική και επαυξημένη πραγματικό­τητα.

Εχουμε ήδη δημιουργήσ­ει τεχνολογία που μετατρέπει τον θεατρικό λόγο σε κείμενο και συγχρονίζε­ι τους υπέρτιτλου­ς με τον λόγο των ηθοποιών.

 ?? ?? «Οι κόρες μου, στη β΄ γυμνασίου και β΄ λυκείου, παιδιά της αφής, θεωρούν το Διαδίκτυο κάτι δεδομένο, όπως το ηλεκτρικό ρεύμα. Φανταστείτ­ε τι θα συμβεί αν μετά την ενεργειακή κρίση ζήσουμε μια κρίση δεδομένων! Είναι εντυπωσιακ­ό πόσο διασυνδεδε­μένοι είμαστε».
«Οι κόρες μου, στη β΄ γυμνασίου και β΄ λυκείου, παιδιά της αφής, θεωρούν το Διαδίκτυο κάτι δεδομένο, όπως το ηλεκτρικό ρεύμα. Φανταστείτ­ε τι θα συμβεί αν μετά την ενεργειακή κρίση ζήσουμε μια κρίση δεδομένων! Είναι εντυπωσιακ­ό πόσο διασυνδεδε­μένοι είμαστε».

Newspapers in Greek

Newspapers from Greece