AI Chatbots: Αυτή η προτροπή αναγκάζει την τεχνητή νοημοσύνη να σταματήσει να σας κολακεύει και να σκεφτεί πιο σοβαρά

13:31, 22/04/2026

Εικόνα: mericanprogress.org

Το ChatGPT, το Claude ή το Gemini έχουν προβλήματα, αλλά ένα από τα πιο σημαντικά είναι ότι συνεχώς προσπαθούν να κολακεύσουν τους χρήστες, λέγοντάς τους ότι «πέτυχαν διάνα» ή ότι «είχαν σε μια ιδιοφυή ιδέα»

Η κολακεία και τα πρόωρα συγχαρητήρια είναι κοινές αδυναμίες των γενετικών AI Chatbots, με ορισμένα μοντέλα να είναι πιο επιρρεπή στο να γίνονται «yes-bots» από άλλα. Αλλά ακόμα και τώρα που οι πάροχοι LLM έχουν συνειδητοποιήσει την κολακεία της AI και τα εκπαιδεύουν να είναι πιο κριτικά, είναι ακόμα εύκολο να κάνετε μια AI να υποστηρίξει με ενθουσιασμό μια ασταθή θεωρία που δεν το αξίζει.

Ευτυχώς, υπάρχει ένας τρόπος διατύπωσης ερωτήσεων που μπορεί να κάνει ακόμη και τα πιο υποχωρητικά μοντέλα τεχνητής νοημοσύνης να σταματήσουν τις κολακείες. Αυτός ο τρόπος διατύπωσης ερωτήσεων έχει διάφορες ονομασίες — «failure-first» (πρώτα η αποτυχία) ή «inversion» (αντιστροφή) — και χρησιμοποιείται συχνά από προγραμματιστές που επιθυμούν να «δοκιμάσουν υπό πίεση» τις αμφίβολες προτάσεις ενός προγραμματιστικού πράκτορα τεχνητής νοημοσύνης.

Υπάρχουν πολλές διαφορετικές εκδοχές του, αλλά όλες ακολουθούν λίγο πολύ την ίδια φόρμουλα: ζητούν από την τεχνητή νοημοσύνη να εξετάσει πρώτα τα πιθανά σημεία αποτυχίας πριν προσφέρει τη λύση, την πρόταση ή το σχέδιό της.

Παράδειγμα από το subreddit «ChatGPTPromptGenius»:

Πριν απαντήσεις, ανέφερε τι θα κατέστρεφε αυτό το σενάριο πιο γρήγορα, πού είναι πιο αδύναμη η λογική και τι θα επέκρινε ένας σκεπτικιστής. Στη συνέχεια, δώσε τη διορθωμένη απάντηση.

Παραλλαγή από ένα μέλος της Ομάδας Υποστήριξης ΤΝ του Πανεπιστημίου της Αϊόβα:

Ας υποθέσουμε ότι διαφωνείτε με αυτή τη σύσταση. Ποιο είναι το ισχυρότερο αντίθετο επιχείρημα;

Είναι ενδιαφέρον ότι πολλοί από όσους έχουν υιοθετήσει τις τεχνικές του «pressure-testing» ή του «inverse prompting» αποδίδουν την επιτυχία τους στα νοητικά μοντέλα που προωθεί ο επενδυτής Τσάρλι Μάνγκερ, ο μακροχρόνιος αντιπρόεδρος της Berkshire Hathaway και επιχειρηματικός συνεργάτης του Γουόρεν Μπάφετ.

Ένα από τα αγαπημένα νοητικά μοντέλα του Μάνγκερ ήταν το «αντιστρέψτε, πάντα αντιστρέψτε». Με απλά λόγια, αυτό σημαίνει ότι αντί να σκέφτεστε πρώτα πώς να επιτύχετε έναν στόχο, θα πρέπει να εστιάζετε στο πώς θα μπορούσατε να αποτύχετε.

AI Chatbots: Αυτή η προτροπή αναγκάζει την τεχνητή νοημοσύνη να σταματήσει να σας κολακεύει και να σκεφτεί πιο σοβαρά

Παράδειγμα από το subreddit «ChatGPTPromptGenius»:

Παραλλαγή από ένα μέλος της Ομάδας Υποστήριξης ΤΝ του Πανεπιστημίου της Αϊόβα:

ENIKOS NETWORK

Φρουροί Επανάστασης: Κατασχέσαμε δύο πλοία

Θεσσαλονίκη: Αστυνομικός σκύλος «ξετρύπωσε» πάνω από ένα κιλό κοκαΐνης σε πορτ μπαγκάζ αυτοκινήτου

ΕΟΦ: Ανακαλούνται παρτίδες σκιαγραφικού φαρμάκου

Health-IQ: Έναρξη εξειδικευμένων εκπαιδευτικών προγραμμάτων σε επαγγελματίες υγείας στην Αθήνα

Τροποποιητικές φορολογικές δηλώσεις: Ποιοι και μέχρι πότε μπορούν να κάνουν διορθώσεις χωρίς κυρώσεις

ΕΛΣΤΑΤ: Στο 4,9% του ΑΕΠ το πρωτογενές πλεόνασμα το 2025