Καινοτομία

ΑΙ δημιουργεί βιντεοταινία από λίγες αράδες κειμένου!

Ένας νέος αλγόριθμος τεχνητής νοημοσύνης τροφοδοτείται με λίγες γραμμές κειμένου και τις μετατρέπει σε -προς το παρόν σύντομη- βιντεοταινία.

Μπορεί οι ταινίες να μη διεκδικούν Όσκαρ (όχι ακόμη τουλάχιστον), αλλά στο μέλλον μια τέτοια τεχνική αναμένεται να αξιοποιηθεί ευρέως από τον τομέα της ψυχαγωγίας (π.χ. οι σεναριογράφοι θα μπορούν να βλέπουν δοκιμαστικά πώς φαίνεται το σενάριό τους) έως της εγκληματολογίας (π.χ. θα μπορεί να αναπαραχθεί οπτικά η σκηνή ενός φόνου ή ενός τροχαίου από μια μαρτυρική κατάθεση).

Οι ερευνητές, με επικεφαλής τον Γιτόνγκ Λι του Τμήματος Επιστήμης των Υπολογιστών του Πανεπιστημίου Ντιουκ της Β.Καρολίνα, που παρουσίασαν τη δουλειά τους σε συνέδριο της Ένωσης για την Προώθηση της Τεχνητής Νοημοσύνης στη Λουιζιάνα των ΗΠΑ, σύμφωνα με το "Science", εκπαίδευσαν τον αλγόριθμό τους, έτσι ώστε όταν κανείς πληκτρολογεί π.χ. «παιγνίδι στο λιβάδι» ή «σέρφινγκ στη θάλασσα», να δημιουργείται αυτόματα μια σχετική σύντομη βιντεοταινία.

Το σύστημα ανταποκρίνεται ακόμη και σε «παράλογα» κείμενα, όπως «ιστιοπλοΐα στο χιόνι» ή «γκολφ στην πισίνα», πράγμα πολύ χρήσιμο για καλλιτεχνικές δημιουργίες με φαντασία.

Η τεχνητή νοημοσύνη βελτιώνεται συνεχώς στο να καταλαβαίνει το περιεχόμενο των εικόνων και να βάζει τις κατάλληλες λεζάντες σε φωτογραφίες. Πιο δύσκολο είναι το αντίστροφο, δηλαδή να παράγει εικόνες από λεζάντες. Ενώ έως τώρα είχε αποδειχθεί σχεδόν αδύνατο να παράγονται κινούμενες εικόνες (βίντεο) από λεζάντες και εν γένει από σύντομα κείμενα.

Το νέο σύστημα μηχανικής μάθησης είναι ο πρώτος αλγόριθμος μετατροπής κειμένου σε βίντεο που καταφέρνει να πετύχει σχετικά καλά αποτελέσματα. Δεν είναι τέλειες οι ταινίες του, αλλά αρχίζουν να μοιάζουν με πραγματικά βίντεο.

Ο αλγόριθμος είναι ένα νευρωνικό δίκτυο, που επεξεργάζεται τα δεδομένα με τρόπο παρεμφερή με τους νευρώνες του εγκεφάλου. Στη διάρκεια της αυτοεκπαίδευσής του, αξιολογεί συνεχώς τις επιτυχίες και τα λάθη του, βελτιώνοντας έτσι σταδιακά τις επιδόσεις του.

Ακόμη κάνει λάθη (π.χ. μπορεί να μπερδέψει την ιστιοπλοΐα με το kitesurfing), τα βίντεό του διαρκούν μόλις λίγα δευτερόλεπτα και έχουν μέγεθος γραμματοσήμου, ενώ οι φιγούρες των ανθρώπων συχνά εμφανίζουν παραμόρφωση. Αλλά αποτελεί μια πρόοδο και, επιπλέον, επιτρέπει σε κάποιον να πάρει μια ιδέα για το πώς είναι να κάνει σκι στην έρημο!

ΑΠΕ - ΜΠΕ

Σχόλια