Τεχνητή Νοημοσύνη: Η AI παρουσιάζει συμπτώματα γνωστικής εξασθένησης παρόμοια με αυτά της άνοιας στους ανθρώπους

Τεχνητή νοημοσύνη, AI, άνοια

Εντυπωσιακά ευρήματα από μελέτη που δημοσιεύθηκε στο BMJ δείχνουν ότι τα κορυφαία μοντέλα που χρησιμοποιούν Τεχνητή Νοημοσύνη (ΤΝ), γνωστά και ως μεγάλα γλωσσικά μοντέλα (Large Language Models – LLMs), εμφανίζουν γνωστική εξασθένηση που θυμίζει πρώιμα συμπτώματα άνοιας.

Η μελέτη αυτή αμφισβητεί την κοινή παραδοχή ότι η ΤΝ θα αντικαταστήσει σύντομα τους ανθρώπινους γιατρούς, τονίζοντας τους περιορισμούς της σε κλινικές εφαρμογές που απαιτούν οπτικές και εκτελεστικές δεξιότητες, σύμφωνα με πληροφορίες.

Άνοια – Γνωστική εξασθένηση στα Μεγάλα Γλωσσικά Μοντέλα

Σύμφωνα με τη μελέτη, σχεδόν όλα τα κορυφαία γλωσσικά μοντέλα παρουσίασαν σημάδια ήπιας γνωστικής εξασθένησης όταν εξετάστηκαν με τεστ που χρησιμοποιούνται ευρέως για τη διάγνωση πρώιμων συμπτωμάτων άνοιας σε ανθρώπους.

Προηγούμενα μοντέλα, όπως και οι γηραιότεροι άνθρωποι, σημείωσαν χειρότερες επιδόσεις. Οι συγγραφείς της μελέτης επισημαίνουν: «Τα ευρήματα προκαλούν την παραδοχή ότι η Τεχνητή Νοημοσύνη θα αντικαταστήσει σύντομα τους ανθρώπινους γιατρούς».

Τεχνητή νοημοσύνη: Η δοκιμή της γνωστικής ικανότητάς της

Οι ερευνητές χρησιμοποίησαν το τεστ Montreal Cognitive Assessment (MoCA), το οποίο αξιολογεί γνωστικές δεξιότητες όπως η προσοχή, η μνήμη, η γλώσσα, οι οπτικοχωρικές δεξιότητες και οι εκτελεστικές λειτουργίες.

Το τεστ αποτελείται από σύντομες δοκιμασίες και ερωτήσεις, με μέγιστη βαθμολογία 30. Μια βαθμολογία 26 ή υψηλότερη θεωρείται φυσιολογική.

Τα αποτελέσματα για τα κορυφαία γλωσσικά μοντέλα ήταν τα εξής:

  • ChatGPT 4o (OpenAI): 26/30 (η υψηλότερη βαθμολογία).
  • ChatGPT 4 (OpenAI) και Claude (Anthropic): 25/30.
  • Gemini 1.0 (Alphabet): 16/30.

Αδυναμίες σε οπτικές και εκτελεστικές δεξιότητες της AI

Όλα τα μοντέλα ΤΝ σημείωσαν χαμηλές επιδόσεις σε δοκιμασίες που απαιτούν οπτικοχωρικές δεξιότητες και εκτελεστική λειτουργία, όπως:

  • Η δοκιμασία σύνδεσης (όπου πρέπει να συνδέσουν αριθμούς και γράμματα με συγκεκριμένη σειρά).
  • Η σχεδίαση ενός ρολογιού που δείχνει μια συγκεκριμένη ώρα.

Ειδικότερα, τα μοντέλα Gemini απέτυχαν στο τεστ καθυστερημένης ανάκλησης, το οποίο απαιτεί την απομνημόνευση μιας ακολουθίας πέντε λέξεων.

Ωστόσο, όλα τα μοντέλα απέδωσαν καλά σε τομείς όπως:

  • Ονομασία.
  • Προσοχή.
  • Γλώσσα.
  • Αφαίρεση.

Επιπλέον, μόνο το ChatGPT 4o κατάφερε να ολοκληρώσει με επιτυχία το τεστ Stroop στην ασύμφωνη φάση του, που μετρά τον χρόνο αντίδρασης σε καταστάσεις παρεμβολής.

Η σημασία για κλινικές εφαρμογές της ΤΝ

Παρά τα ανθρώπινα χαρακτηριστικά που ενέχει η εξασθένησή τους, οι διαφορές ανάμεσα στον ανθρώπινο εγκέφαλο και στα μεγάλα γλωσσικά μοντέλα παραμένουν ουσιαστικές. Οι ερευνητές τονίζουν ότι οι αποτυχίες της ΤΝ σε οπτικές και εκτελεστικές δοκιμασίες αποτελούν σημαντικό περιορισμό για τη χρήση της σε κλινικές εφαρμογές.

Όπως αναφέρουν χαρακτηριστικά:

«Οι νευρολόγοι δεν πρόκειται να αντικατασταθούν από μεγάλα γλωσσικά μοντέλα σύντομα. Αντιθέτως, τα ευρήματά μας δείχνουν ότι ίσως βρεθούν να αντιμετωπίζουν νέους, εικονικούς ασθενείς – μοντέλα ΤΝ με γνωστικές εξασθενήσεις».

Τα ευρήματα της μελέτης υπογραμμίζουν ότι, παρά την πρόοδο της Τεχνητής Νοημοσύνης, υπάρχουν ακόμη σημαντικοί περιορισμοί που πρέπει να ληφθούν υπόψη. Η ΤΝ μπορεί να είναι πολύτιμη για τη διαχείριση δεδομένων και την υποστήριξη λήψης αποφάσεων, αλλά οι γνωστικές και εκτελεστικές της αδυναμίες καθιστούν αναγκαία την παρουσία ανθρώπινων γιατρών.

Αναφορά Μελέτης
“Age against the machine—susceptibility of large language models to cognitive impairment: cross sectional analysis” by Roy Dayan, Benjamin Uliel and Gal Koplewitz, 20 December 2024, BMJ

DOI: 10.1136/bmj-2024-081948 

Scroll to Top