Γιατί είναι τόσο σημαντικό το OpenAI να αναπτύσσει τεχνητή νοημοσύνη καλά στα μαθηματικά

By | December 6, 2023

    <span class=Daboost/Shutterstock” src=”https://s.yimg.com/ny/api/res/1.2/O8VRPc6pstm1RTE.MjECVA–/YXBwaWQ9aGlnaGxhbmRlcjt3PTk2MDtoPTU5MA–/https://media.zenfs.com/en/the_conversation 12027310cf0″ δεδομένα – src=”https://s.yimg.com/ny/api/res/1.2/O8VRPc6pstm1RTE.MjECVA–/YXBwaWQ9aGlnaGxhbmRlcjt3PTk2MDtoPTU5MA–/https://media.zenfs.com/en/the_conversation 2027310cf0″/ >

Με την πρόσφατη απόλυση του OpenAI και τη γρήγορη επαναπρόσληψη του Sam Altman, οι συζητήσεις γύρω από την ανάπτυξη και τη χρήση της τεχνητής νοημοσύνης (AI) βρίσκονται και πάλι στο επίκεντρο. Το πιο ασυνήθιστο είναι ότι ένα εξέχον θέμα στις αναφορές των μέσων ενημέρωσης ήταν η ικανότητα των συστημάτων AI να κάνουν μαθηματικά.

Προφανώς, μέρος του δράματος στο OpenAI σχετιζόταν με την ανάπτυξη από την εταιρεία ενός νέου αλγόριθμου AI που ονομάζεται Q*. Το σύστημα έχει θεωρηθεί μια σημαντική πρόοδος και ένα από τα πιο σημαντικά χαρακτηριστικά του ήταν η ικανότητά του να συλλογίζεται μαθηματικά.

Δεν είναι όμως τα μαθηματικά η βάση της τεχνητής νοημοσύνης; Πώς θα μπορούσε ένα σύστημα τεχνητής νοημοσύνης να έχει προβλήματα με τη μαθηματική λογική, δεδομένου ότι οι υπολογιστές και οι αριθμομηχανές μπορούν να εκτελούν μαθηματικές εργασίες;

Το AI δεν είναι μια ενιαία οντότητα. Είναι ένα συνονθύλευμα στρατηγικών για την εκτέλεση υπολογισμών χωρίς άμεσες οδηγίες από τον άνθρωπο. Όπως θα δούμε, ορισμένα συστήματα AI είναι ικανά στα μαθηματικά.

Ωστόσο, μία από τις πιο σημαντικές τεχνολογίες του σήμερα, τα μεγάλα γλωσσικά μοντέλα (LLM) πίσω από τα chatbots AI, όπως το ChatGPT, έχουν δυσκολευτεί μέχρι στιγμής να μιμηθούν τη μαθηματική λογική. Αυτό συμβαίνει γιατί σχεδιάστηκαν για να επικεντρώνονται στη γλώσσα.

Εάν ο νέος αλγόριθμος Q* της εταιρείας μπορεί να λύσει αόρατα μαθηματικά προβλήματα, τότε αυτό θα μπορούσε κάλλιστα να είναι μια σημαντική ανακάλυψη. Τα μαθηματικά είναι μια αρχαία μορφή ανθρώπινης συλλογιστικής την οποία τα μεγάλα γλωσσικά μοντέλα (LLMs) έχουν αγωνιστεί μέχρι στιγμής να μιμηθούν. Τα LLM είναι τα υποκείμενα συστήματα τεχνολογίας όπως το ChatGPT του OpenAI.

Τη στιγμή της γραφής, οι λεπτομέρειες του αλγόριθμου Q* και των δυνατοτήτων του είναι περιορισμένες αλλά άκρως ενδιαφέρουσες. Επομένως, υπάρχουν πολλές λεπτές λεπτομέρειες που πρέπει να λάβετε υπόψη πριν θεωρήσετε το Q* επιτυχία.

Για παράδειγμα, τα μαθηματικά είναι ένα μάθημα με το οποίο ασχολούνται όλοι σε διαφορετικούς βαθμούς και το επίπεδο των μαθηματικών στο οποίο είναι ικανό το Q* παραμένει αβέβαιο. Ωστόσο, έχουν δημοσιευτεί ακαδημαϊκές εργασίες που χρησιμοποιούν εναλλακτικές μορφές τεχνητής νοημοσύνης για την προώθηση των μαθηματικών σε ερευνητικό επίπεδο (συμπεριλαμβανομένων ορισμένων γραμμένων από εμένα και μιας που γράφτηκε από μια ομάδα μαθηματικών σε συνεργασία με ερευνητές στο Google DeepMind).

Αυτά τα συστήματα τεχνητής νοημοσύνης θα μπορούσαν να περιγραφούν ως ικανά στα μαθηματικά. Ωστόσο, είναι πιθανό ότι το Q* δεν χρησιμοποιείται για να βοηθήσει τους ακαδημαϊκούς με την εργασία τους, αλλά μάλλον για άλλο σκοπό.

Ωστόσο, ακόμα κι αν το Q* δεν μπορεί να ωθήσει τα όρια της έρευνας αιχμής, είναι πολύ πιθανό να βρεθεί κάποιο νόημα στον τρόπο κατασκευής του, το οποίο θα μπορούσε να δημιουργήσει δελεαστικές ευκαιρίες για μελλοντική ανάπτυξη.

Όλο και πιο άνετο

Ως κοινωνία, αισθανόμαστε όλο και πιο άνετα με τη χρήση εξειδικευμένης τεχνητής νοημοσύνης για την επίλυση προκαθορισμένων τύπων προβλημάτων. Για παράδειγμα, οι ψηφιακοί βοηθοί, τα συστήματα αναγνώρισης προσώπου και ηλεκτρονικών συστάσεων θα είναι γνωστά στους περισσότερους ανθρώπους. Αυτό που παραμένει άπιαστο είναι η λεγόμενη «τεχνητή γενική νοημοσύνη» (AGI) που έχει ευρείες συλλογιστικές ικανότητες συγκρίσιμες με αυτές ενός ανθρώπου.

Τα μαθηματικά είναι μια βασική δεξιότητα που φιλοδοξούμε να διδάξουμε σε όλα τα παιδιά σχολικής ηλικίας και σίγουρα θα χαρακτηρίζονταν ως βασικό ορόσημο στην επιδίωξη του AGI. Πώς αλλιώς θα μπορούσαν, λοιπόν, τα μαθηματικά ικανά συστήματα AI να βοηθήσουν την κοινωνία;

Σαμ Άλτμαν

Η μαθηματική νοοτροπία σχετίζεται με ένα πλήθος εφαρμογών, για παράδειγμα κωδικοποίηση και μηχανική, και ως εκ τούτου η μαθηματική λογική είναι μια ζωτικής σημασίας μεταβιβάσιμη δεξιότητα τόσο για την ανθρώπινη όσο και για την τεχνητή νοημοσύνη. Μια ειρωνεία είναι ότι η τεχνητή νοημοσύνη βασίζεται, σε θεμελιώδες επίπεδο, στα μαθηματικά.

Για παράδειγμα, πολλές από τις τεχνικές που εφαρμόζονται από αλγόριθμους τεχνητής νοημοσύνης καταλήγουν τελικά σε μια μαθηματική περιοχή γνωστή ως άλγεβρα μήτρας. Ένας πίνακας είναι απλώς ένα πλέγμα αριθμών, του οποίου μια ψηφιακή εικόνα είναι ένα γνώριμο παράδειγμα. Κάθε pixel δεν είναι τίποτα άλλο από αριθμητικά δεδομένα.

Τα μεγάλα γλωσσικά μοντέλα είναι επίσης εγγενώς μαθηματικά. Με βάση ένα τεράστιο δείγμα κειμένου, ένα μηχάνημα μπορεί να μάθει τις πιθανότητες των λέξεων που είναι πιο πιθανό να ακολουθήσουν μια προτροπή (ή ερώτηση) από τον χρήστη στο chatbot. Εάν θέλετε ένα προεκπαιδευμένο LLM να εξειδικεύεται σε ένα συγκεκριμένο θέμα, μπορεί να προσαρμοστεί στη μαθηματική βιβλιογραφία ή σε οποιονδήποτε άλλο τομέα μάθησης. Ένα LLM μπορεί να δημιουργήσει κείμενο που φαίνεται να κατανοεί τα μαθηματικά.

Δυστυχώς, αυτό παράγει ένα LLM που είναι καλό στο μπλόφα αλλά κακό στις λεπτομέρειες. Το θέμα είναι ότι μια μαθηματική πρόταση είναι, εξ ορισμού, μια πρόταση στην οποία μπορεί να εκχωρηθεί μια σαφής Boolean τιμή (δηλαδή, true ή false). Ο μαθηματικός συλλογισμός είναι ισοδύναμος με τη λογική αφαίρεση νέων μαθηματικών δηλώσεων από εκείνες που είχαν καθοριστεί προηγουμένως.

Ο Συνήγορος του διαβόλου

Φυσικά, οποιαδήποτε προσέγγιση του μαθηματικού συλλογισμού που βασίζεται σε γλωσσικές πιθανότητες θα πάει στραβά. Ένας τρόπος να αντιμετωπιστεί αυτό θα μπορούσε να είναι η ενσωμάτωση κάποιου επίσημου συστήματος επαλήθευσης στην αρχιτεκτονική (ακριβώς πώς είναι χτισμένο το LLM), το οποίο ελέγχει συνεχώς τη λογική πίσω από τα άλματα που γίνονται από το μεγάλο γλωσσικό μοντέλο.

Μια ένδειξη ότι αυτό έγινε θα μπορούσε να βρίσκεται στο όνομα Q*, το οποίο θα μπορούσε εύλογα να αναφέρεται σε έναν αλγόριθμο που αναπτύχθηκε τη δεκαετία του 1970 για να βοηθήσει τον απαγωγικό συλλογισμό. Εναλλακτικά, το Q* θα μπορούσε να αναφέρεται στην Q-learning, στην οποία ένα μοντέλο μπορεί να βελτιωθεί με την πάροδο του χρόνου δοκιμάζοντας και επιβραβεύοντας τα σωστά συμπεράσματα.

Ωστόσο, υπάρχουν πολλές προκλήσεις για τη δημιουργία μαθηματικά ικανών AI. Για παράδειγμα, μερικά από τα πιο ενδιαφέροντα μαθηματικά αποτελούνται από εξαιρετικά απίθανα γεγονότα. Υπάρχουν πολλές περιπτώσεις όπου κάποιος μπορεί να σκεφτεί ότι υπάρχει ένα μοτίβο που βασίζεται σε μικρούς αριθμούς, αλλά αποτυγχάνει απροσδόκητα όταν βρεθούν αρκετές περιπτώσεις. Αυτή η ικανότητα είναι δύσκολο να ενσωματωθεί σε ένα μηχάνημα.

Μια άλλη πρόκληση μπορεί να σας εκπλήξει: η μαθηματική έρευνα μπορεί να είναι εξαιρετικά δημιουργική. Πρέπει να είναι έτσι, γιατί οι επαγγελματίες πρέπει να εφεύρουν νέες έννοιες και να ακολουθούν τους τυπικούς κανόνες ενός παλιού θέματος.

Οποιαδήποτε μεθοδολογία τεχνητής νοημοσύνης που έχει εκπαιδευτεί μόνο για να βρίσκει μοτίβα σε προϋπάρχοντα μαθηματικά δεν θα μπορούσε πιθανώς ποτέ να δημιουργήσει πραγματικά νέα μαθηματικά. Δεδομένης της σχέσης μεταξύ μαθηματικών και τεχνολογίας, αυτό φαίνεται να εμποδίζει τη σύλληψη νέων τεχνολογικών επαναστάσεων.

Αλλά ας παίξουμε για λίγο τον δικηγόρο του διαβόλου και ας αναρωτηθούμε αν η τεχνητή νοημοσύνη θα μπορούσε πραγματικά να δημιουργήσει νέα μαθηματικά. Το προηγούμενο επιχείρημα εναντίον αυτού έχει ένα ελάττωμα, καθώς θα μπορούσε επίσης να ειπωθεί ότι οι καλύτεροι ανθρώπινοι μαθηματικοί είχαν επίσης εκπαιδευτεί αποκλειστικά σε προϋπάρχοντα μαθηματικά. Τα υπέροχα γλωσσικά μοντέλα μας έχουν εκπλήξει στο παρελθόν και θα το κάνουν ξανά.

Αυτό το άρθρο αναδημοσιεύεται από το The Conversation με άδεια Creative Commons. Διαβάστε το αρχικό άρθρο.

Η συζήτησηΗ συζήτηση

Η συζήτηση

Ο Tom Oliver δεν εργάζεται, δεν συμβουλεύεται, δεν κατέχει μετοχές ή δεν λαμβάνει χρηματοδότηση από οποιαδήποτε εταιρεία ή οργανισμό που θα επωφεληθεί από αυτό το άρθρο και δεν έχει αποκαλύψει σχετικές σχέσεις πέρα ​​από τον ακαδημαϊκό του διορισμό.

Leave a Reply

Your email address will not be published. Required fields are marked *