Ο κόσμος της τεχνητής νοημοσύνης είναι συχνά δυσνόητος, γεμάτος τεχνική ορολογία που μπερδεύει ακόμη και τους ειδικούς. Για να κατανοήσουμε πώς λειτουργούν τα μοντέλα που αλλάζουν την καθημερινότητά μας, είναι απαραίτητο να ορίσουμε τις βασικές έννοιες που κυριαρχούν στις ειδήσεις και τις τεχνολογικές αναλύσεις.
Η επανάσταση της γενικής νοημοσύνης
Η Γενική Τεχνητή Νοημοσύνη ή AGI αποτελεί το «ιερό δισκοπότηρο» του κλάδου. Αναφέρεται σε συστήματα που μπορούν να εκτελέσουν οποιαδήποτε γνωστική εργασία τουλάχιστον εξίσου καλά με έναν άνθρωπο. Ενώ τα σημερινά μοντέλα είναι εξειδικευμένα, η AGI υπόσχεται αυτόνομη δράση σε ένα τεράστιο εύρος οικονομικών και δημιουργικών δραστηριοτήτων.
Συμπληρωματικά, οι «AI agents» είναι εργαλεία που δεν περιορίζονται στην κουβέντα, αλλά αναλαμβάνουν να φέρουν εις πέρας πολυεπίπεδα καθήκοντα, όπως ο προγραμματισμός ή η οργάνωση ταξιδιών, δρώντας ως ψηφιακοί βοηθοί με πρωτοβουλία.
Η λογική πίσω από τα μοντέλα
Για να φτάσουμε σε σωστά αποτελέσματα, τα μοντέλα χρησιμοποιούν την «αλυσίδα σκέψης» (chain-of-thought). Αυτή η μέθοδος αναγκάζει την ΤΝ να σπάει ένα δύσκολο πρόβλημα σε ενδιάμεσα λογικά βήματα, παρόμοια με το πώς ένας άνθρωπος λύνει μια εξίσωση στο χαρτί.
Η επεξεργασία αυτή απαιτεί τεράστια υπολογιστική ισχύ, γνωστή ως compute, η οποία βασίζεται σε εξειδικευμένο υλικό όπως οι κάρτες γραφικών GPU.
Εκπαίδευση και μηχανισμοί μάθησης
Στο επίκεντρο βρίσκονται τα Μεγάλα Γλωσσικά Μοντέλα (LLM), όπως το ChatGPT. Πρόκειται για βαθιά νευρωνικά δίκτυα που εκπαιδεύονται σε δισεκατομμύρια κείμενα για να προβλέπουν την επόμενη πιθανή λέξη. Κατά την εκπαίδευση, η σημασία κάθε πληροφορίας καθορίζεται από τα βάρη (weights). Όταν το μοντέλο χρειάζεται εξειδίκευση σε έναν συγκεκριμένο τομέα, εφαρμόζεται το fine-tuning, δηλαδή μια συμπληρωματική εκπαίδευση με στοχευμένα δεδομένα.
Το πρόβλημα των ψευδαισθήσεων
Μια από τις μεγαλύτερες προκλήσεις παραμένουν οι «ψευδαισθήσεις» (hallucinations). Ο όρος περιγράφει την τάση των μοντέλων να επινοούν γεγονότα με απόλυτη σιγουριά, κάτι που συμβαίνει λόγω κενών στα δεδομένα τους. Αυτό καθιστά απαραίτητη την επαλήθευση των απαντήσεων από τον χρήστη. Τέλος, η μονάδα μέτρησης αυτής της επικοινωνίας είναι τα tokens, τα μικρά τμήματα δεδομένων που επιτρέπουν στη μηχανή να μεταφράζει την ανθρώπινη γλώσσα σε μαθηματικούς κώδικες.