Οι άνθρωποι βασίζονται όλο και περισσότερο στην τεχνητή νοημοσύνη (AI) για ιατρικές διαγνώσεις λόγω του πόσο γρήγορα και αποτελεσματικά αυτά τα εργαλεία μπορούν να εντοπίσουν ανωμαλίες και προειδοποιητικά σημάδια σε ιατρικά ιστορικά, ακτινογραφίες και άλλα σύνολα δεδομένων πριν γίνουν εμφανή με γυμνό μάτι.
Αλλά μια νέα μελέτη που δημοσιεύθηκε στις 20 Δεκεμβρίου 2024 στο BMJ εγείρει ανησυχίες ότι οι τεχνολογίες τεχνητής νοημοσύνης όπως τα μεγάλα γλωσσικά μοντέλα (LLM) και τα chatbots, όπως οι άνθρωποι, εμφανίζουν σημάδια επιδείνωσης των γνωστικών ικανοτήτων με την ηλικία.
AI και επιδείνωση διεργασιών
«Αυτά τα ευρήματα αμφισβητούν την υπόθεση ότι η τεχνητή νοημοσύνη θα αντικαταστήσει σύντομα τους ανθρώπινους γιατρούς», έγραψαν οι συγγραφείς της μελέτης, «καθώς η γνωστική εξασθένηση που είναι εμφανής στα κορυφαία chatbots μπορεί να επηρεάσει την αξιοπιστία τους στην ιατρική διάγνωση και να υπονομεύσει την εμπιστοσύνη των ασθενών».
Οι επιστήμονες δοκίμασαν δημόσια διαθέσιμα chatbot που βασίζονται σε LLM, συμπεριλαμβανομένων των ChatGPT του OpenAI, του Anthropic’s Sonnet και του Alphabet’s Gemini χρησιμοποιώντας το τεστ Γνωστικής Αξιολόγησης του Μόντρεαλ (MoCA) – μια σειρά εργασιών που χρησιμοποιούν οι νευρολόγοι για να ελέγξουν τις ικανότητες στην προσοχή, τη μνήμη, τη γλώσσα, τις χωρικές δεξιότητες και την εκτελεστική νοητική λειτουργία.
Το MoCA χρησιμοποιείται συνήθως για την αξιολόγηση ή τον έλεγχο της εμφάνισης γνωστικής εξασθένησης σε καταστάσεις όπως η νόσος του Αλτσχάιμερ ή η άνοια. μικρό
Ενώ ορισμένες πτυχές των δοκιμών όπως η ονομασία, η προσοχή, η γλώσσα και η αφαίρεση ήταν φαινομενικά εύκολες για τα περισσότερα από τα LLM που χρησιμοποιήθηκαν, όλες είχαν κακή απόδοση σε οπτικές/χωρικές δεξιότητες και εκτελεστικές εργασίες, με αρκετές να τα καταφέρνουν χειρότερα σε τομείς όπως η καθυστερημένη ανάκληση.
Είναι πολύ σημαντικό, ενώ η πιο πρόσφατη έκδοση του ChatGPT (έκδοση 4) σημείωσε την υψηλότερη βαθμολογία (26 από 30), το παλαιότερο Gemini 1.0 LLM σημείωσε μόνο 16 – οδηγώντας στο συμπέρασμα ότι οι μεγαλύτεροι LLM παρουσιάζουν σημάδια γνωστικής έκπτωσης.
Εξέταση της γνωστικής λειτουργίας στο AI
Οι συγγραφείς της μελέτης σημειώνουν ότι τα ευρήματά τους είναι μόνο παρατηρητικά – οι κρίσιμες διαφορές μεταξύ των τρόπων με τους οποίους λειτουργεί η τεχνητή νοημοσύνη και το ανθρώπινο μυαλό σημαίνει ότι το πείραμα δεν μπορεί να αποτελέσει άμεση σύγκριση.
Ωστόσο, προειδοποιούν ότι μπορεί να υποδηλώνει αυτό που αποκαλούν «σημαντική περιοχή αδυναμίας» που θα μπορούσε να θέσει φρένο στην ανάπτυξη της τεχνητής νοημοσύνης στην κλινική ιατρική. Συγκεκριμένα, υποστήριξαν κατά της χρήσης τεχνητής νοημοσύνης σε εργασίες που απαιτούν οπτική αφαίρεση και εκτελεστική λειτουργία.
Άλλοι επιστήμονες δεν έχουν πειστεί για τη μελέτη και τα ευρήματά της, φτάνοντας στο σημείο να επικρίνουν τις μεθόδους και το πλαίσιο – στο οποίο οι συγγραφείς της μελέτης κατηγορούνται ότι ανθρωπομορφίζουν την τεχνητή νοημοσύνη προβάλλοντας ανθρώπινες συνθήκες σε αυτό. Υπάρχει επίσης κριτική για τη χρήση του MoCA. Αυτό ήταν ένα τεστ που εξετάστηκε καθαρά για χρήση σε ανθρώπους, προτείνεταιμκαι δεν θα έδινε σημαντικά αποτελέσματα εάν εφαρμοστεί σε άλλες μορφές νοημοσύνης.