Η τεχνητή νοημοσύνη έχει μεγάλο και αυξανόμενο αποτύπωμα άνθρακα, αλλά υπάρχουν πιθανές λύσεις στον ορίζοντα

By | February 16, 2024

    <classe span=Gorodenkoff/Shutterstock” src=”https://s.yimg.com/ny/api/res/1.2/6SKGvPy7ixHuNFY21y4G5w–/YXBwaWQ9aGlnaGxhbmRlcjt3PTk2MDtoPTU0MA–/https://media.zenfs.com/convers295455555000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 8 8b00569d5″ data-src = “https://s.yimg.com/ny/api/res/1.2/6SKGvPy7ixHuNFY21y4G5w–/YXBwaWQ9aGlnaGxhbmRlcjt3PTk2MDtoPTU0MA–/https://media.zenfs.com/en/the_conversation 00 569d5″/>

Λαμβάνοντας υπόψη τις τεράστιες δυνατότητες επίλυσης προβλημάτων της τεχνητής νοημοσύνης (AI), δεν θα ήταν δύσκολο να σκεφτούμε ότι η τεχνητή νοημοσύνη θα μπορούσε επίσης να μας βοηθήσει να αντιμετωπίσουμε την κλιματική κρίση. Ωστόσο, όταν εξετάζουμε τις ενεργειακές ανάγκες των μοντέλων τεχνητής νοημοσύνης, γίνεται σαφές ότι η τεχνολογία είναι τόσο μέρος του κλιματικού προβλήματος όσο και λύση.

Οι εκπομπές προέρχονται από την υποδομή που σχετίζεται με την τεχνητή νοημοσύνη, όπως η κατασκευή και η λειτουργία κέντρων δεδομένων που διαχειρίζονται τις μεγάλες ποσότητες πληροφοριών που απαιτούνται για την υποστήριξη αυτών των συστημάτων.

Ωστόσο, διαφορετικές τεχνολογικές προσεγγίσεις για το πώς κατασκευάζουμε συστήματα τεχνητής νοημοσύνης θα μπορούσαν να βοηθήσουν στη μείωση του αποτυπώματος άνθρακα τους. Ιδιαίτερα δύο τεχνολογίες δείχνουν υπόσχεση για να γίνει αυτό: η αύξηση των νευρωνικών δικτύων και η δια βίου μάθηση.

Η διάρκεια ζωής ενός συστήματος AI μπορεί να χωριστεί σε δύο φάσεις: εκπαίδευση και εξαγωγή συμπερασμάτων. Κατά τη διάρκεια της εκπαίδευσης, ένα σχετικό σύνολο δεδομένων χρησιμοποιείται για τη δημιουργία και τον συντονισμό – βελτίωση – του συστήματος. Συμπερασματικά, το εκπαιδευμένο σύστημα παράγει προβλέψεις σε δεδομένα που δεν έχουν δει ποτέ πριν.

Για παράδειγμα, η εκπαίδευση μιας τεχνητής νοημοσύνης για χρήση σε αυτοκίνητα αυτόνομης οδήγησης θα απαιτούσε ένα σύνολο δεδομένων με πολλά διαφορετικά σενάρια οδήγησης και αποφάσεις που λαμβάνονται από ανθρώπους οδηγούς.

Μετά τη φάση της εκπαίδευσης, το σύστημα AI θα προβλέπει αποτελεσματικούς ελιγμούς για ένα αυτοοδηγούμενο αυτοκίνητο. Τα τεχνητά νευρωνικά δίκτυα (ANN) είναι μια υποκείμενη τεχνολογία που χρησιμοποιείται στα περισσότερα από τα σημερινά συστήματα τεχνητής νοημοσύνης.

Έχουν πολλά διαφορετικά στοιχεία, που ονομάζονται παράμετροι, οι τιμές των οποίων προσαρμόζονται κατά τη φάση εκπαίδευσης του συστήματος AI. Αυτές οι παράμετροι μπορούν να φτάσουν συνολικά περισσότερα από 100 δισεκατομμύρια.

Αν και ένας μεγάλος αριθμός παραμέτρων βελτιώνει τις δυνατότητες των ANN, κάνουν επίσης διαδικασίες εκπαίδευσης και εξαγωγής απαιτήσεων πόρων. Για να βάλουμε τα πράγματα στη θέση τους, η εκπαίδευση του GPT-3 (ο πρόδρομος του συστήματος AI του σημερινού ChatGPT) παρήγαγε 502 μετρικούς τόνους άνθρακα, που ισοδυναμεί με την οδήγηση 112 βενζινοκίνητων αυτοκινήτων για ένα χρόνο.

Το GPT-3 εκπέμπει επίσης 8,4 τόνους CO2 ετησίως λόγω συμπερασμάτων. Από τότε που ξεκίνησε η έκρηξη της τεχνητής νοημοσύνης στις αρχές της δεκαετίας του 2010, οι απαιτήσεις ισχύος των συστημάτων τεχνητής νοημοσύνης γνωστά ως μοντέλα μεγάλων γλωσσών (LLM) – ο τύπος της τεχνολογίας πίσω από το ChatGPT – έχουν αυξηθεί κατά 300.000.

Με την αυξανόμενη πανταχού παρουσία και την πολυπλοκότητα των μοντέλων τεχνητής νοημοσύνης, αυτή η τάση θα συνεχιστεί, καθιστώντας δυνητικά την τεχνητή νοημοσύνη σημαντική συμβολή στις εκπομπές CO₂. Στην πραγματικότητα, οι τρέχουσες εκτιμήσεις μας μπορεί να είναι χαμηλότερες από το πραγματικό αποτύπωμα άνθρακα της τεχνητής νοημοσύνης λόγω της έλλειψης τυποποιημένων και ακριβών τεχνικών για τη μέτρηση των εκπομπών που σχετίζονται με την τεχνητή νοημοσύνη.

Καμινάδες σε εργοστάσιο παραγωγής ενέργειας.

Αύξηση νευρωνικών δικτύων

Οι προαναφερθείσες νέες τεχνολογίες, τα νευρωνικά δίκτυα επαύξησης (SNN) και η δια βίου μάθηση (L2), έχουν τη δυνατότητα να μειώσουν το διαρκώς αυξανόμενο αποτύπωμα άνθρακα του AI, με τα SNN να λειτουργούν ως ενεργειακά αποδοτική εναλλακτική λύση στα ANN.

Τα ANN λειτουργούν επεξεργάζοντας και μαθαίνοντας μοτίβα δεδομένων, επιτρέποντάς τους να κάνουν προβλέψεις. Λειτουργούν με δεκαδικούς αριθμούς. Για να κάνετε ακριβείς υπολογισμούς, ειδικά όταν πολλαπλασιάζετε αριθμούς με δεκαδικά ψηφία, ο υπολογιστής πρέπει να είναι πολύ ακριβής. Λόγω αυτών των δεκαδικών αριθμών, τα ANN απαιτούν μεγάλη υπολογιστική ισχύ, μνήμη και χρόνο.

Αυτό σημαίνει ότι τα ANN καταναλώνουν περισσότερη ενέργεια καθώς τα δίκτυα γίνονται μεγαλύτερα και πιο περίπλοκα. Τόσο τα ANN όσο και τα SNN εμπνέονται από τον εγκέφαλο, ο οποίος περιέχει δισεκατομμύρια νευρώνες (νευρικά κύτταρα) που συνδέονται μεταξύ τους μέσω συνάψεων.

Όπως ο εγκέφαλος, τα ANN και τα SNN έχουν επίσης συστατικά που οι ερευνητές αποκαλούν νευρώνες, αν και είναι τεχνητά και όχι βιολογικά. Η κύρια διαφορά μεταξύ των δύο τύπων νευρωνικών δικτύων είναι στον τρόπο με τον οποίο οι μεμονωμένοι νευρώνες μεταδίδουν πληροφορίες μεταξύ τους.

Οι νευρώνες στον ανθρώπινο εγκέφαλο επικοινωνούν μεταξύ τους μεταδίδοντας διακοπτόμενα ηλεκτρικά σήματα που ονομάζονται αιχμές. Οι ίδιες οι κορυφές δεν περιέχουν πληροφορίες. Αντίθετα, οι πληροφορίες βρίσκονται στο χρονοδιάγραμμα αυτών των αιχμών. Αυτό το δυαδικό χαρακτηριστικό όλων ή τίποτα των αιχμών (συνήθως αντιπροσωπεύεται ως 0 ή 1) υποδηλώνει ότι οι νευρώνες είναι ενεργοί όταν εκτοξεύονται και αδρανείς διαφορετικά.

Αυτός είναι ένας από τους λόγους για την αποτελεσματική επεξεργασία ενέργειας στον εγκέφαλο.

Ακριβώς όπως ο κώδικας Μορς χρησιμοποιεί συγκεκριμένες ακολουθίες κουκκίδων και παύλων για τη μετάδοση μηνυμάτων, τα SNN χρησιμοποιούν μοτίβα ή χρονισμό αιχμών για την επεξεργασία και τη μετάδοση πληροφοριών. Έτσι, αν και οι τεχνητοί νευρώνες στα ANN είναι πάντα ενεργοί, τα SNN καταναλώνουν ενέργεια μόνο όταν εμφανίζεται μια ακίδα.

Διαφορετικά, έχουν σχεδόν μηδενικές ενεργειακές ανάγκες. Τα SNN μπορεί να είναι έως και 280 φορές πιο ενεργειακά αποδοτικά από τα ANN.

Οι συνάδελφοί μου και εγώ αναπτύσσουμε αλγόριθμους εκμάθησης για SNN που μπορούν να τους φέρουν ακόμη πιο κοντά στην ενεργειακή απόδοση που παρουσιάζει ο εγκέφαλος. Οι χαμηλότερες υπολογιστικές απαιτήσεις υποδηλώνουν επίσης ότι τα SNN μπορούν να λαμβάνουν αποφάσεις πιο γρήγορα.

Αυτές οι ιδιότητες καθιστούν τα SNN χρήσιμα για ένα ευρύ φάσμα εφαρμογών, συμπεριλαμβανομένης της εξερεύνησης του διαστήματος, της άμυνας και των αυτοοδηγούμενων αυτοκινήτων, λόγω των περιορισμένων πηγών ενέργειας που είναι διαθέσιμες σε αυτά τα σενάρια.

Το L2 είναι μια άλλη στρατηγική για τη μείωση των συνολικών ενεργειακών απαιτήσεων των ANN κατά τη διάρκεια ζωής τους, πάνω στην οποία επίσης εργαζόμαστε.

Η διαδοχική εκπαίδευση των ANN (όπου τα συστήματα μαθαίνουν από αλληλουχίες δεδομένων) σε νέα προβλήματα τα κάνει να ξεχνούν τις προηγούμενες γνώσεις τους ενώ μαθαίνουν νέες εργασίες. Τα ANN απαιτούν ανακύκλωση από τη βάση όταν αλλάζει το περιβάλλον λειτουργίας τους, αυξάνοντας περαιτέρω τις εκπομπές που σχετίζονται με την τεχνητή νοημοσύνη.

Το L2 είναι μια συλλογή αλγορίθμων που επιτρέπουν στα μοντέλα AI να εκπαιδεύονται διαδοχικά σε πολλαπλές εργασίες με ελάχιστη ή καθόλου λήθη. Το L2 επιτρέπει στα μοντέλα να μαθαίνουν καθ’ όλη τη διάρκεια της ζωής τους, αξιοποιώντας την υπάρχουσα γνώση χωρίς να χρειάζεται να τα εκπαιδεύσουν εκ νέου από την αρχή.

Ο τομέας της τεχνητής νοημοσύνης αναπτύσσεται ραγδαία και αναδύονται άλλες πιθανές προόδους που θα μπορούσαν να μετριάσουν τις ενεργειακές απαιτήσεις αυτής της τεχνολογίας. Για παράδειγμα, η κατασκευή μικρότερων μοντέλων AI που έχουν τις ίδιες δυνατότητες πρόβλεψης με ένα μεγαλύτερο μοντέλο.

Η πρόοδος στον κβαντικό υπολογισμό – μια διαφορετική προσέγγιση για την κατασκευή υπολογιστών που αξιοποιούν φαινόμενα από τον κόσμο της κβαντικής φυσικής – θα επέτρεπε επίσης ταχύτερη εκπαίδευση και εξαγωγή συμπερασμάτων χρησιμοποιώντας ANN και SNN. Οι ανώτερες υπολογιστικές δυνατότητες που προσφέρει ο κβαντικός υπολογιστής θα μπορούσαν να μας επιτρέψουν να βρούμε ενεργειακά αποδοτικές λύσεις για την τεχνητή νοημοσύνη σε πολύ μεγαλύτερη κλίμακα.

Η πρόκληση της κλιματικής αλλαγής απαιτεί να προσπαθήσουμε να βρούμε λύσεις για τομείς που προχωρούν γρήγορα, όπως η τεχνητή νοημοσύνη, προτού το αποτύπωμα άνθρακα τους γίνει πολύ μεγάλο.

Αυτό το άρθρο αναδημοσιεύεται από το The Conversation με άδεια Creative Commons. Διαβάστε το αρχικό άρθρο.

Η συζήτησηΗ συζήτηση

Η συζήτηση

Η Shirin Dora δεν εργάζεται, δεν συμβουλεύεται, δεν κατέχει μετοχές ή δεν λαμβάνει χρηματοδότηση από οποιαδήποτε εταιρεία ή οργανισμό που θα επωφεληθεί από αυτό το άρθρο και δεν έχει αποκαλύψει σχετικές σχέσεις πέρα ​​από τον ακαδημαϊκό της διορισμό.

Leave a Reply

Your email address will not be published. Required fields are marked *