DeepMind: Η AI της Google τους κερδίζει όλους στα Μαθηματικά – Λύνει προβλήματα γεωμετρίας σε επίπεδο… Ολυμπιάδας

Ένα εργαλείο τεχνητής νοημοσύνης (AI) μπορεί να λύσει προβλήματα γεωμετρίας με την ίδια ακρίβεια με τους συμμετέχοντες στην Διεθνή Μαθηματική Ολυμπιάδα. Το σύστημα, που ονομάζεται AlphaGeometry, μπορεί να αποδείξει ότι μια πρόταση είναι αληθής ή ψευδής, ακόμα κι αν είναι πολύ περίπλοκη.

Για παράδειγμα, η μηχανή μπορεί να αποδείξει ότι η περίμετρος ενός κύκλου είναι ίση με δύο φορές τη διάμετρό του, ή ότι η γωνία ενός τριγώνου ισούται με 180 μοίρες. Μπορεί επίσης να αποδείξει πιο περίπλοκα γεωμετρικά γεγονότα, όπως το Πυθαγόρειο Θεώρημα ή το Θεώρημα των Τριών Καθέτων.

«Η Διεθνής Μαθηματική Ολυμπιάδα είναι μια σύγχρονη αρένα για τους πιο έξυπνους έφηβους μαθηματικούς στον κόσμο», αναφέρουν οι Trieu Trinh και Thang Luong, ερευνητές στο Google DeepMind, σχετικά με το πρωτοποριακό σύστημα τεχνητής νοημοσύνης (AI), AlphaGeometry που περιγράφεται αναλυτικά στο Nature.

Το AlphaGeometry είναι «ένα σύστημα τεχνητής νοημοσύνης που λύνει σύνθετα προβλήματα γεωμετρίας σε επίπεδο που προσεγγίζει έναν άνθρωπο που έχει χρυσό μετάλλιο στην μαθηματική Ολυμπιάδα. Πρόκειται για μια επανάσταση στην απόδοση που έχει η τεχνητή νοημοσύνη», ανακοίνωσαν.

Σε μια συγκριτική αξιολόγηση 30 προβλημάτων γεωμετρίας από τις Ολυμπιάδες, το AlphaGeometry έλυσε 25 εντός του τυπικού χρονικού ορίου της Ολυμπιάδας. Για να το συγκρίνει κανείς […] ο μέσος χρυσός Ολυμπιονίκης έλυσε 25,9 προβλήματα».

Δεν είναι μόνο η βαθμολογία του συστήματος στον διαγωνισμό που είναι εντυπωσιακή. Έχουν περάσει σχεδόν 50 χρόνια από την πρώτη απόδειξη μαθηματικού θεωρήματος με χρήση υπολογιστή – ουσιαστικά μια εργασία brute-force (μια μέθοδος επίλυσης ενός προβλήματος, δοκιμάζοντας όλες τις πιθανές λύσεις) για την απόδειξη του θεωρήματος των τεσσάρων χρωμάτων– και από τότε, το αμφιλεγόμενο πεδίο των αποδείξεων με τη βοήθεια υπολογιστή έχει προχωρήσει ραγδαία. Οι υπολογιστές μπορούν πλέον να βοηθήσουν τους μαθηματικούς να αποδείξουν πιο σύνθετα θεωρήματα χρησιμοποιώντας πιο προηγμένες μεθόδους.

Αλλά πολύ πρόσφατα, με την έλευση τεχνολογιών όπως η μεγάλης κλίμακας ανάλυση δεδομένων (big data) και προηγμένες τεχνικές μηχανικής μάθησης, έχουμε αρχίσει να παρατηρούμε μια στροφή από τη χρήση των υπολογιστών ως απλών έξυπνων αριθμομηχανών, προς την τεχνητή νοημοσύνη που μπορεί να παράγει πραγματικά δημιουργικές αποδείξεις.

Οι υπολογιστές δεν είναι πλέον απλές αριθμομηχανές. Μπορούν να χρησιμοποιηθούν για να δημιουργήσουν νέες ιδέες και να λύσουν προβλήματα με δημιουργικό τρόπο.  Αυτό είναι ένα σημαντικό επίτευγμα, καθώς σημαίνει ότι οι υπολογιστές μπορούν πλέον να βοηθήσουν τους ανθρώπους να κατανοήσουν καλύτερα τον κόσμο γύρω τους και να βρουν λύσεις σε προβλήματα που μέχρι τώρα θεωρούνταν αδύνατο να λυθούν.

Το γεγονός ότι η AlphaGeometry μπορεί να λύσει τα πολύπλοκα μαθηματικά προβλήματα που λύνουν οι συμμετέχοντες στην Ολυμπιάδα μπορεί να αποτελέσει ορόσημο στην έρευνα της τεχνητής νοημοσύνης, όπως εκτιμούν οι Trinh και Luong.

Μέχρι τώρα, ένα τέτοιο πρόγραμμα αντιμετώπιζε τουλάχιστον δύο βασικά εμπόδια. Πρώτον, οι υπολογιστές είναι υπολογιστές και δεν είναι πολύ καλοί σε πράγματα όπως η συλλογιστική ή η εξαγωγή συμπερασμάτων. Δεύτερον, τα μαθηματικά είναι αρκετά δύσκολο να διδαχθούν ακόμα και στο πιο προηγμένο σύστημα μηχανικής μάθησης.
«Τα συστήματα μάθησης όπως τα νευρωνικά δίκτυα είναι πολύ κακά στο να κάνουν «αλγεβρικό συλλογισμό», είχε πει ο David Saxton από το DeepMind, στο New Scientist το 2019.  «Οι άνθρωποι είναι καλοί στα [μαθηματικά]», πρόσθεσε, «αλλά χρησιμοποιούν γενικές συλλογιστικές δεξιότητες που δεν διαθέτουν τα σημερινά συστήματα τεχνητής μάθησης».

Ο Kevin Buzzard, μαθηματικός στο Imperial College του Λονδίνου, επισημαίνει ότι η γεωμετρία είναι μόνο ένας από τους κλάδους στους οποίους πρέπει να διαπρέψουν οι διαγωνιζόμενοι της Μαθηματικής Ολυμπιάδας και ότι μπορεί να είναι πολύ πιο δύσκολο για τους υπολογιστές να είναι εξίσου καλοί στην επίλυση προβλημάτων σε άλλους τομείς, όπως η θεωρία αριθμών. Ωστόσο, λέει ο Buzzard, «το γεγονός ότι οι υπολογιστές κατάφεραν να λύσουν 25 προβλήματα της Ολυμπιάδας, και επιπλέον να δημιουργήσουν αναγνώσιμες από τον άνθρωπο αποδείξεις, είναι πολύ εντυπωσιακό».

Οι ερευνητές έχουν πειραματιστεί στην επίλυση διαφόρων μαθηματικών προβλημάτων χρησιμοποιώντας μεγάλα γλωσσικά μοντέλα – προγράμματα τεχνητής νοημοσύνης που εκπαιδεύονται σε μεγάλες συλλογές κειμένου και τροφοδοτούν τα πιο δημοφιλή chatbots. Τα αποτελέσματα ήταν ενθαρρυντικά αλλά δεν είναι πάντα ακριβή.

Τα γλωσσικά μοντέλα μπορούν να μάθουν να παράγουν κείμενο, να μεταφράζουν γλώσσες, να γράφουν διαφορετικά είδη δημιουργικού περιεχομένου και να απαντούν στις ερωτήσεις σας με έναν ενημερωτικό τρόπο. Όμως δεν κατανοούν πραγματικά τη μαθηματική λογική. Μπορούν να αναπαράγουν μορφές μαθηματικών εκφράσεων που έχουν δει στο παρελθόν, αλλά δεν μπορούν να καταλάβουν αν αυτές οι εκφράσεις είναι σωστές ή λάθος.

Για παράδειγμα, ένα chatbot προσανατολισμένο στα μαθηματικά που ονομάζεται Minerva, που αναπτύχθηκε από την Google για ερευνητικούς σκοπούς, εκπαιδεύτηκε χρησιμοποιώντας προηγμένα μαθηματικά έγγραφα και λύσεις σε βασικά μαθηματικά προβλήματα σχολικού επιπέδου που δημιουργήθηκαν από ανθρώπους. Αν και οι αριθμητικές λύσεις στις οποίες καταλήγει η Minerva είναι συνήθως σωστές, το κείμενο που παράγει για να εξηγήσει το σκεπτικό της είναι συχνά ελαττωματικό και πρέπει να ελεγχθεί από ανθρώπους.

«Εάν ένα σύστημα εκπαιδευτεί στην φυσική γλώσσα, θα μπορεί να παράγει κείμενο σε φυσική γλώσσα, την οποία όμως δεν μπορούμε να εμπιστευτούμε», λέει ο Trieu Trinh, επιστήμονας υπολογιστών στο Google DeepMind στο Mountain View της Καλιφόρνιας και συν-συγγραφέας της εργασίας που δημοσιεύτηκε στο Nature.

Αντί να χρησιμοποιήσουν τη φυσική γλώσσα, ο Trieu Trinh και οι συνεργάτες του ανέπτυξαν μια γλώσσα για τη συγγραφή γεωμετρικών αποδείξεων με μια αυστηρή σύνταξη, παρόμοια με αυτή μιας γλώσσας προγραμματισμού. Ως εκ τούτου, οι απαντήσεις μπορούν να ελεγχθούν εύκολα από έναν υπολογιστή, ενώ εξακολουθούν να βγάζουν νόημα για τους ανθρώπους.

Η ομάδα επικεντρώθηκε σε προβλήματα της Ευκλείδειας γεωμετρίας στα οποία ο στόχος είναι να παραχθεί μια μαθηματική απόδειξη μιας δεδομένης πρότασης. Ενσωμάτωσαν στην προσαρμοσμένη γλώσσα τους δεκάδες βασικούς κανόνες γεωμετρίας, όπως «αν μια ευθεία τέμνει μια δεύτερη ευθεία, θα τέμνει επίσης μια γραμμή που είναι παράλληλη με τη δεύτερη γραμμή».

Στη συνέχεια έφτιαξαν ένα πρόγραμμα για να δημιουργήσει αυτόματα 100 εκατομμύρια «αποδείξεις». Ουσιαστικά, αυτά αποτελούνταν από τυχαίες ακολουθίες απλών αλλά λογικά απροσπέλαστων βημάτων — όπως «δεδομένων δύο σημείων Α και Β, κατασκευάστε το τετράγωνο ABCD».

Το AlphaGeometry εκπαιδεύτηκε σε αυτές τις αποδείξεις που δημιουργήθηκαν από μηχανές. Αυτό σήμαινε ότι το AI ήταν σε θέση να λύσει προβλήματα μαντεύοντας το ένα βήμα μετά το άλλο, με τον ίδιο τρόπο που τα chatbot παράγουν κείμενο. Αλλά σήμαινε επίσης ότι η απόδοσή του ήταν ευανάγνωστη από μηχανές και εύκολο να ελεγχθεί για την ακρίβειά της. Για κάθε πρόβλημα, το AlphaGeometry δεν προσπαθεί απλώς να βρει μια λύση σε ένα πρόβλημα γεωμετρίας. Αντ’ αυτού, προσπαθεί να βρει πολλές πιθανές λύσεις.  Επειδή η AI μπορεί αυτόματα να αποκλείσει τις λανθασμένες λύσεις, κατάφερε να παράγει αξιόπιστα σωστά αποτελέσματα, ακόμη και για προβλήματα γεωμετρίας από τη Διεθνή Μαθηματική Ολυμπιάδα.

Το AlphaGeometry είναι ένα σύστημα τεχνητής νοημοσύνης που συνδυάζει δύο τεχνικές: Χρησιμοποιεί τη μέθοδο brute force, δηλαδή τη δοκιμή όλων των πιθανών έγκυρων απαντήσεων, με τον συμβολικό συλλογισμό. Σε αυτό μπορεί να οφείλεται η δύναμή του , λέει ο Stephan Schulz, επιστήμονας υπολογιστών στο Πανεπιστήμιο Baden-Württemberg στη Στουτγάρδη της Γερμανίας. Αυτή η συνολική προσέγγιση είναι πολλά υποσχόμενη, προσθέτει.

Ο Buzzard λέει ότι η εκπαίδευση του AlphaGeometry σε συνθετικά δεδομένα ξεπερνά ένα από τα μεγάλα δυνητικά εμπόδια στην εφαρμογή των τυπικών μεγάλων γλωσσικών μοντέλων στα μαθηματικά: την απάτη. Όταν ένας νευρωνικός ιστός εκπαιδεύεται σε δισεκατομμύρια κείμενα που έχουν συλλεχθεί από το Διαδίκτυο, «είναι εξαιρετικά δύσκολο να διασφαλιστεί ότι το μοντέλο δεν έχει δει την ερώτηση από πριν».

Η απάτη μπορεί να συμβεί όταν ένα μοντέλο γλώσσας έχει εκπαιδευτεί σε δεδομένα που περιλαμβάνουν τις απαντήσεις σε ερωτήσεις μαθηματικών. Σε αυτήν την περίπτωση, το μοντέλο θα μπορούσε να χρησιμοποιήσει τις γνώσεις του για να απαντήσει σε ερωτήσεις που δεν έχει δει ποτέ πριν.

Η εκπαίδευση του AlphaGeometry σε συνθετικά δεδομένα μειώνει τον κίνδυνο απάτης επειδή τα δεδομένα αυτά δημιουργούνται από έναν υπολογιστή. Αυτό σημαίνει ότι το μοντέλο δεν μπορεί να έχει δει τις απαντήσεις σε ερωτήσεις μαθηματικών πριν.

Η εκπαίδευση της AlphaGeometry με αποδείξεις που παράγονται αυτόματα είχε ακόμη έναν σκοπό, λέει ο συν-συγγραφέας της μελέτης He He, επιστήμονας υπολογιστών στο Πανεπιστήμιο της Νέας Υόρκης. «Θέλουμε να δημιουργήσουμε ένα σύστημα χωρίς ανθρώπινα δεδομένα, ώστε κάποια μέρα να μπορέσει να ξεπεράσει τις ανθρώπινες δυνατότητες», λέει.

Ουσιαστικά, η He He εξηγεί ότι η χρήση ανθρώπινων δεδομένων στην εκπαίδευση ενός γλωσσικού μοντέλου μπορεί να περιορίσει τις δυνατότητες του μοντέλου. Αυτό συμβαίνει επειδή το μοντέλο μαθαίνει να αναπαράγει τις ανθρώπινες γνώσεις και δεν είναι σε θέση να δημιουργήσει νέες ιδέες.

Scroll to Top