Ερευνητές τεχνητής νοημοσύνης από το Stanford και το Πανεπιστήμιο της Ουάσινγκτον κατάφεραν να εκπαιδεύσουν ένα AI μοντέλο «reasoning» (συλλογιστικής) με κόστος κάτω από 50 δολαρίων σε cloud computing πιστώσεις, σύμφωνα με μια νέα ερευνητική εργασία που δημοσιεύθηκε την περασμένη Παρασκευή.
Το μοντέλο, γνωστό ως s1, εμφανίζει επιδόσεις συγκρίσιμες με πρωτοποριακά μοντέλα reasoning, όπως το o1 της OpenAI και το R1 της DeepSeek, σε δοκιμές που αξιολογούν τις μαθηματικές και προγραμματιστικές του ικανότητες. Το s1 είναι διαθέσιμο στο GitHub, μαζί με τον κώδικα και τα δεδομένα εκπαίδευσής του.
Πώς δημιουργήθηκε το s1
Η ομάδα πίσω από το s1 ξεκίνησε με ένα έτοιμο βασικό AI μοντέλο και το βελτίωσε μέσω distillation, μιας διαδικασίας που εξάγει τις «reasoning» ικανότητες ενός άλλου AI μοντέλου εκπαιδεύοντάς το με τις απαντήσεις του.
Οι ερευνητές ανέφεραν ότι το s1 προήλθε από distillation ενός μοντέλου reasoning της Google, του Gemini 2.0 Flash Thinking Experimental. Η τεχνική του distillation είναι η ίδια που χρησιμοποίησαν ερευνητές του Berkeley για να δημιουργήσουν ένα AI reasoning μοντέλο με κόστος περίπου $450 τον προηγούμενο μήνα.
Πώς αλλάζει το AI οικοσύστημα;
Για πολλούς, το γεγονός ότι λίγοι ερευνητές χωρίς μεγάλα χρηματοδοτικά κεφάλαια μπορούν ακόμα να καινοτομήσουν στον χώρο της AI είναι συναρπαστικό. Όμως, η επιτυχία του s1 εγείρει σοβαρά ερωτήματα σχετικά με την εμπορευματοποίηση των AI μοντέλων.
Πού βρίσκεται το «ανταγωνιστικό πλεονέκτημα» αν κάποιος μπορεί να αναπαράγει ένα μοντέλο πολλών εκατομμυρίων δολαρίων με ελάχιστο κόστος;
Δεν αποτελεί έκπληξη ότι τα μεγάλα AI εργαστήρια δεν είναι ικανοποιημένα. Η OpenAI έχει κατηγορήσει τη DeepSeek ότι χρησιμοποίησε τα δεδομένα του API της για να εκπαιδεύσει το μοντέλο της μέσω distillation.
Η τεχνική πίσω από το s1
Οι ερευνητές του s1 αναζητούσαν τον πιο απλό τρόπο για να επιτύχουν ισχυρή reasoning απόδοση και «test-time scaling», δηλαδή τη δυνατότητα ενός AI μοντέλου να σκέφτεται περισσότερο πριν απαντήσει. Αυτές ήταν μερικές από τις καινοτομίες του o1 της OpenAI, τις οποίες προσπάθησαν να αναπαράγουν η DeepSeek και άλλες AI εταιρείες.
Η ερευνητική εργασία του s1 δείχνει ότι τα reasoning μοντέλα μπορούν να προκύψουν μέσω μιας σχετικά μικρής βάσης δεδομένων χρησιμοποιώντας supervised fine-tuning (SFT) – μια διαδικασία όπου ένα AI μοντέλο καθοδηγείται ρητά να μιμηθεί συγκεκριμένες συμπεριφορές από ένα dataset.
Το SFT είναι φθηνότερο σε σύγκριση με τις μεθόδους ενισχυτικής μάθησης (reinforcement learning) μεγάλης κλίμακας, που χρησιμοποίησε η DeepSeek για να εκπαιδεύσει το R1.
Η Google προσφέρει δωρεάν πρόσβαση στο Gemini 2.0 Flash Thinking Experimental μέσω της πλατφόρμας Google AI Studio, αν και με ημερήσιους περιορισμούς χρήσης. Ωστόσο, οι όροι της Google απαγορεύουν την αντίστροφη μηχανική των μοντέλων της για τη δημιουργία ανταγωνιστικών AI υπηρεσιών.
Πώς εκπαιδεύτηκε το s1
Το s1 βασίζεται σε ένα μικρό AI μοντέλο της Qwen, του κινεζικού AI εργαστηρίου που ανήκει στην Alibaba. Το μοντέλο είναι διαθέσιμο για δωρεάν λήψη.
Για να εκπαιδεύσουν το s1, οι ερευνητές δημιούργησαν ένα dataset μόλις 1.000 προσεκτικά επιλεγμένων ερωτήσεων, μαζί με τις αντίστοιχες απαντήσεις και την «πορεία σκέψης» κάθε απάντησης από το Gemini 2.0 Flash Thinking Experimental.
Η εκπαίδευση του s1 διήρκεσε λιγότερο από 30 λεπτά χρησιμοποιώντας 16 Nvidia H100 GPUs. Ο Niklas Muennighoff, ερευνητής του Stanford που εργάστηκε στο project, δήλωσε στο TechCrunch ότι η ίδια διαδικασία σήμερα θα κόστιζε περίπου $20.
Οι ερευνητές εφάρμοσαν επίσης ένα έξυπνο τέχνασμα για να κάνουν το s1 να ελέγχει τις απαντήσεις του και να επιμηκύνει τον χρόνο «σκέψης» του: του είπαν να περιμένει. Η προσθήκη της λέξης «wait» στη διαδικασία reasoning βοήθησε το μοντέλο να φτάσει σε ελαφρώς ακριβέστερες απαντήσεις, σύμφωνα με την έρευνα.
Το μέλλον της AI: Χρειάζονται ακόμα επενδύσεις δισεκατομμυρίων;
Το 2025, η Meta, η Google και η Microsoft σκοπεύουν να επενδύσουν εκατοντάδες δισεκατομμύρια δολάρια στην AI υποδομή τους, με μέρος αυτών των κεφαλαίων να κατευθύνεται στην εκπαίδευση νέων AI μοντέλων.
Αν και η μέθοδος του distillation έχει αποδειχθεί αποτελεσματική για τη φθηνή αναδημιουργία των δυνατοτήτων ενός AI μοντέλου, δεν έχει καταφέρει να δημιουργήσει νέα AI μοντέλα που να υπερβαίνουν δραστικά ό,τι υπάρχει ήδη.
Έτσι, αν και το s1 μπορεί να αποτελεί μια επαναστατική και οικονομική προσέγγιση, τα δισεκατομμύρια που επενδύονται από τις μεγάλες AI εταιρείες ίσως να είναι ακόμη απαραίτητα για να προχωρήσει η καινοτομία σε νέα επίπεδα.