Το ChatGPT, το Claude ή το Gemini έχουν προβλήματα, αλλά ένα από τα πιο σημαντικά είναι ότι συνεχώς προσπαθούν να κολακεύσουν τους χρήστες, λέγοντάς τους ότι «πέτυχαν διάνα» ή ότι «είχαν σε μια ιδιοφυή ιδέα»
Η κολακεία και τα πρόωρα συγχαρητήρια είναι κοινές αδυναμίες των γενετικών AI Chatbots, με ορισμένα μοντέλα να είναι πιο επιρρεπή στο να γίνονται «yes-bots» από άλλα. Αλλά ακόμα και τώρα που οι πάροχοι LLM έχουν συνειδητοποιήσει την κολακεία της AI και τα εκπαιδεύουν να είναι πιο κριτικά, είναι ακόμα εύκολο να κάνετε μια AI να υποστηρίξει με ενθουσιασμό μια ασταθή θεωρία που δεν το αξίζει.
Ευτυχώς, υπάρχει ένας τρόπος διατύπωσης ερωτήσεων που μπορεί να κάνει ακόμη και τα πιο υποχωρητικά μοντέλα τεχνητής νοημοσύνης να σταματήσουν τις κολακείες. Αυτός ο τρόπος διατύπωσης ερωτήσεων έχει διάφορες ονομασίες — «failure-first» (πρώτα η αποτυχία) ή «inversion» (αντιστροφή) — και χρησιμοποιείται συχνά από προγραμματιστές που επιθυμούν να «δοκιμάσουν υπό πίεση» τις αμφίβολες προτάσεις ενός προγραμματιστικού πράκτορα τεχνητής νοημοσύνης.
Υπάρχουν πολλές διαφορετικές εκδοχές του, αλλά όλες ακολουθούν λίγο πολύ την ίδια φόρμουλα: ζητούν από την τεχνητή νοημοσύνη να εξετάσει πρώτα τα πιθανά σημεία αποτυχίας πριν προσφέρει τη λύση, την πρόταση ή το σχέδιό της.
Παράδειγμα από το subreddit «ChatGPTPromptGenius»:
Πριν απαντήσεις, ανέφερε τι θα κατέστρεφε αυτό το σενάριο πιο γρήγορα, πού είναι πιο αδύναμη η λογική και τι θα επέκρινε ένας σκεπτικιστής. Στη συνέχεια, δώσε τη διορθωμένη απάντηση.
Παραλλαγή από ένα μέλος της Ομάδας Υποστήριξης ΤΝ του Πανεπιστημίου της Αϊόβα:
Ας υποθέσουμε ότι διαφωνείτε με αυτή τη σύσταση. Ποιο είναι το ισχυρότερο αντίθετο επιχείρημα;
Είναι ενδιαφέρον ότι πολλοί από όσους έχουν υιοθετήσει τις τεχνικές του «pressure-testing» ή του «inverse prompting» αποδίδουν την επιτυχία τους στα νοητικά μοντέλα που προωθεί ο επενδυτής Τσάρλι Μάνγκερ, ο μακροχρόνιος αντιπρόεδρος της Berkshire Hathaway και επιχειρηματικός συνεργάτης του Γουόρεν Μπάφετ.
Ένα από τα αγαπημένα νοητικά μοντέλα του Μάνγκερ ήταν το «αντιστρέψτε, πάντα αντιστρέψτε». Με απλά λόγια, αυτό σημαίνει ότι αντί να σκέφτεστε πρώτα πώς να επιτύχετε έναν στόχο, θα πρέπει να εστιάζετε στο πώς θα μπορούσατε να αποτύχετε.