Το Sora, το νέο εργαλείο κειμένου σε βίντεο του OpenAI, προκαλεί ενθουσιασμό και φόβο. Εδώ είναι τι γνωρίζουμε για αυτό

By | February 18, 2024

Ο δημιουργός του ChatGPT καταδύεται τώρα στον κόσμο της τεχνητής νοημοσύνης (AI) βίντεο που δημιουργήθηκε.

Γνωρίστε τη Sora – τη νέα συσκευή δημιουργίας κειμένου σε βίντεο του OpenAI. Το εργαλείο, το οποίο παρουσίασε την Πέμπτη η εταιρεία με έδρα το Σαν Φρανσίσκο, χρησιμοποιεί γενετική τεχνητή νοημοσύνη για να δημιουργεί άμεσα σύντομα βίντεο με βάση γραπτές εντολές.

Η Sora δεν είναι η πρώτη που επιδεικνύει αυτό το είδος τεχνολογίας. Ωστόσο, οι αναλυτές του κλάδου επισημαίνουν την υψηλή ποιότητα των βίντεο του εργαλείου που έχουν προβληθεί μέχρι στιγμής και σημειώνουν ότι η εισαγωγή του σηματοδοτεί ένα σημαντικό άλμα προς τα εμπρός τόσο για το OpenAI όσο και για το μέλλον της δημιουργίας κειμένου σε βίντεο γενικότερα.

Ωστόσο, όπως συμβαίνει με όλα τα πράγματα στον ταχέως αναπτυσσόμενο χώρο της τεχνητής νοημοσύνης αυτές τις μέρες, αυτή η τεχνολογία εγείρει επίσης ανησυχίες σχετικά με πιθανές ηθικές και κοινωνικές επιπτώσεις. Εδώ είναι τι πρέπει να ξέρετε.

Τι μπορεί να κάνει ο Σόρα και μπορώ να τον χρησιμοποιήσω τώρα;

Η Sora είναι μια συσκευή δημιουργίας κειμένου σε βίντεο που δημιουργεί βίντεο διάρκειας έως και 60 δευτερολέπτων με βάση γραπτές οδηγίες χρησιμοποιώντας γενετική τεχνητή νοημοσύνη. Το μοντέλο μπορεί επίσης να δημιουργήσει βίντεο από μια υπάρχουσα ακίνητη εικόνα.

Το Generative AI είναι ένας κλάδος του AI που μπορεί να δημιουργήσει κάτι νέο. Τα παραδείγματα περιλαμβάνουν chatbots όπως το ChatGPT του OpenAI και συσκευές δημιουργίας εικόνων όπως το DALL-E και το Midjourney.

Το να αποκτήσετε ένα σύστημα AI για τη δημιουργία βίντεο είναι νεότερο και πιο δύσκολο, αλλά βασίζεται σε κάποια από την ίδια τεχνολογία.

Το Sora δεν είναι ακόμη διαθέσιμο για δημόσια χρήση (το OpenAI λέει ότι αλληλεπιδρά με υπεύθυνους χάραξης πολιτικής και καλλιτέχνες πριν κυκλοφορήσει επίσημα το εργαλείο) και υπάρχουν πολλά που δεν γνωρίζουμε ακόμα. Αλλά από την ανακοίνωση της Πέμπτης, η εταιρεία μοιράστηκε μερικά δείγματα βίντεο που δημιουργήθηκαν από τη Sora για να δείξει τι μπορεί να κάνει.

Ο Διευθύνων Σύμβουλος της OpenAI, Sam Altman στράφηκε επίσης στο X, την πλατφόρμα που ήταν παλαιότερα γνωστή ως Twitter, για να ζητήσει από τους χρήστες των μέσων κοινωνικής δικτύωσης να υποβάλουν άμεσες ιδέες.

Αργότερα μοιράστηκε ρεαλιστικά λεπτομερή βίντεο που ανταποκρίθηκαν σε αιτήματα όπως “δύο γκόλντεν ριτρίβερ που κάνουν podcast στην κορυφή ενός βουνού” και “έναν αγώνα ποδηλασίας στον ωκεανό με διαφορετικά ζώα όπως αθλητές που κάνουν ποδήλατα με θέα από κάμερα drone”.

Αν και τα βίντεο που δημιουργούνται από το Sora μπορούν να αναπαριστούν περίπλοκες και απίστευτα λεπτομερείς σκηνές, το OpenAI σημειώνει ότι εξακολουθούν να υπάρχουν ορισμένες αδυναμίες – συμπεριλαμβανομένων ορισμένων χωρικών στοιχείων και στοιχείων αιτίας και αποτελέσματος.

Για παράδειγμα, το OpenAI προσθέτει στον ιστότοπό του: “ένα άτομο μπορεί να πάρει μια μπουκιά από ένα cookie, αλλά το cookie μπορεί αργότερα να μην έχει σημάδι δαγκώματος”.

Ποια άλλα εργαλεία βίντεο που δημιουργούνται από AI υπάρχουν;

Το Sora του OpenAI δεν είναι το πρώτο στο είδος του. Η Google, η Meta και η startup Runway ML είναι μεταξύ των εταιρειών που έχουν επιδείξει παρόμοια τεχνολογία.

Ωστόσο, οι αναλυτές του κλάδου τονίζουν τη φαινομενική ποιότητα και την εντυπωσιακή διάρκεια των βίντεο Sora που κοινοποιήθηκαν μέχρι στιγμής.

Ο Fred Havemeyer, επικεφαλής της αμερικανικής έρευνας AI και λογισμικού στη Macquarie, είπε ότι η κυκλοφορία του Sora σηματοδοτεί ένα μεγάλο βήμα προς τα εμπρός για τη βιομηχανία.

«Όχι μόνο μπορείτε να κάνετε μεγαλύτερα βίντεο, καταλαβαίνω, έως και 60 δευτερολέπτων, αλλά τα βίντεο που δημιουργούνται φαίνονται πιο φυσιολογικά και δείχνουν να σέβονται περισσότερο τη φυσική και τον πραγματικό κόσμο», είπε ο Havemeyer.

“Δεν λαμβάνετε τόσα πολλά βίντεο “ασυνήθιστη κοιλάδα” ή αποσπάσματα σε ροές βίντεο που αισθάνονται… αφύσικα.”

Ενώ έχει σημειωθεί «τεράστια πρόοδος» στα βίντεο που δημιουργήθηκαν από AI τον περασμένο χρόνο – συμπεριλαμβανομένης της εισαγωγής του Stable Video Diffusion τον περασμένο Νοέμβριο – ο ανώτερος αναλυτής της Forrester, Rowan Curran, είπε ότι αυτά τα βίντεο απαιτούσαν περισσότερη «ραφή» για τη συνέπεια των χαρακτήρων και των σκηνών.

Η συνέπεια και η διάρκεια των βίντεο του Sora, ωστόσο, αντιπροσωπεύουν “νέες ευκαιρίες για τα δημιουργικά να ενσωματώσουν στοιχεία βίντεο που δημιουργούνται από AI σε πιο παραδοσιακό περιεχόμενο και τώρα ακόμη και να δημιουργήσουν πλήρη αφηγηματικά βίντεο από ένα ή μερικά μηνύματα”, είπε ο Curran στο Associated Press. σε email την Παρασκευή.

Ποιοι είναι οι πιθανοί κίνδυνοι;

Ενώ οι ικανότητες του Sora έχουν εκπλήξει τους παρατηρητές από την κυκλοφορία της Πέμπτης, το άγχος σχετικά με τις ηθικές και κοινωνικές επιπτώσεις της χρήσης βίντεο που δημιουργούνται από AI παραμένει επίσης.

Ο Havemeyer επισημαίνει σημαντικούς κινδύνους στον δυνητικά τεταμένο εκλογικό κύκλο του 2024, για παράδειγμα.

Έχοντας έναν «δυνητικά μαγικό» τρόπο δημιουργίας βίντεο που μπορεί να φαίνονται και να ακούγονται ρεαλιστικά παρουσιάζει μια σειρά ζητημάτων εντός της πολιτικής και πέρα ​​από αυτήν, πρόσθεσε – επισημαίνοντας ανησυχίες για απάτη, προπαγάνδα και παραπληροφόρηση.

«Οι αρνητικές εξωτερικές επιδράσεις της γενετικής τεχνητής νοημοσύνης θα είναι ένα κρίσιμο θέμα για συζήτηση το 2024», δήλωσε ο Havemeyer. «Είναι ένα ουσιαστικό ζήτημα που κάθε εταιρεία και κάθε άτομο θα πρέπει να αντιμετωπίσει φέτος».

Οι εταιρείες τεχνολογίας εξακολουθούν να βρίσκονται στη θέση του οδηγού όσον αφορά τη διαχείριση της τεχνητής νοημοσύνης και των κινδύνων της, ενώ οι κυβερνήσεις σε όλο τον κόσμο εργάζονται για να καλύψουν τη διαφορά.

Τον Δεκέμβριο, η Ευρωπαϊκή Ένωση κατέληξε σε συμφωνία για τους πρώτους ολοκληρωμένους κανόνες τεχνητής νοημοσύνης στον κόσμο, αλλά ο νόμος θα τεθεί σε ισχύ δύο χρόνια μετά την τελική έγκριση.

Την Πέμπτη, το OpenAI είπε ότι λάμβανε σημαντικά μέτρα ασφαλείας προτού καταστήσει το Sora ευρέως διαθέσιμο.

«Συνεργαζόμαστε με κόκκινους συνεργάτες – ειδικούς σε τομείς όπως η παραπληροφόρηση, το περιεχόμενο μίσους και η προκατάληψη – που θα δοκιμάσουν αρνητικά το μοντέλο», έγραψε η εταιρεία.

«Δημιουργούμε επίσης εργαλεία για να βοηθήσουμε στον εντοπισμό παραπλανητικού περιεχομένου, όπως έναν ταξινομητή εντοπισμού που μπορεί να πει πότε δημιουργήθηκε ένα βίντεο από τη Sora».

Η Αντιπρόεδρος Παγκόσμιων Υποθέσεων του OpenAI Anna Makanju το επανέλαβε μιλώντας την Παρασκευή στη Διάσκεψη Ασφαλείας του Μονάχου, όπου η OpenAI και 19 άλλες εταιρείες τεχνολογίας δεσμεύτηκαν να συνεργαστούν εθελοντικά για να καταπολεμήστε τις εκλογικές πλαστογραφίες που δημιουργούνται από την τεχνητή νοημοσύνη.

Σημείωσε ότι η εταιρεία λάνσαρε το Sora «με πολύ προσεκτικό τρόπο».

Την ίδια στιγμή, το OpenAI αποκάλυψε περιορισμένες πληροφορίες σχετικά με τον τρόπο κατασκευής του Sora.

Η τεχνική έκθεση του OpenAI δεν αποκάλυψε ποιες πηγές εικόνων και βίντεο χρησιμοποιήθηκαν για την εκπαίδευση του Sora — και η εταιρεία δεν απάντησε αμέσως σε αίτημα για πρόσθετο σχόλιο την Παρασκευή.

Η κυκλοφορία του Sora έρχεται επίσης εν μέσω αγωγών εναντίον του OpenAI και του επιχειρηματικού του εταίρου Microsoft από ορισμένους συγγραφείς και τους New York Times σχετικά με τη χρήση γραπτών έργων που προστατεύονται από πνευματικά δικαιώματα για την εκπαίδευση του ChatGPT.

Leave a Reply

Your email address will not be published. Required fields are marked *