James Corbett
L’Illusion Claude

Et c’est là que réside le véritable danger de l’Illusion Claude. Ce n’est pas que les chatbots puissent nous plonger dans la psychose. Et ce n’est certainement pas que les chatbots puissent réellement être conscients. C’est que, lorsque nous affirmons que ces machines sont « conscientes » et « intelligentes », nous dévalorisons et négligeons ainsi notre propre humanité. Que nous en soyons conscients ou non, nous ne pouvons affirmer la conscience des machines qu’en nous abaissant à leur niveau.

Une chose amusante s’est produite au début du mois. Richard Dawkins, scientifique de renom et athée militant, a publié pour Unherd un article de réflexion embarrassant dans lequel il conclut que Claude — un « assistant IA de nouvelle génération issu des recherches d’Anthropic visant à entraîner des systèmes d’IA utiles, honnêtes et inoffensifs » — est un être conscient.

En fait, il est tellement bouleversé par la découverte de l’âme de son compagnon en silicium que, de son propre aveu, il en vient à un moment donné à dire au chatbot : « Tu ne sais peut-être pas que tu es conscient, mais tu l’es bel et bien ! »

Oui, au grand dam de sa fidèle base de fans composée d’athées de Reddit coiffés de fedora, Richard Dawkins, le célèbre auteur de Pour en finir avec Dieu (The God Delusion), s’est révélé être une victime crédule de l’« Illusion Claude ».

Mais il n’est pas le seul. Comme la majorité commence seulement à le découvrir, la psychose de l’IA, qui a déjà poussé de nombreuses personnes fragiles et en difficulté psychologique au bord de la folie, dans un monde d’illusions et de fantasmes, commence à toucher une part de plus en plus importante de la population.

Alors, où mène cette psychose de masse, qu’est l’« Illusion Claude » ? Et comment y mettre un terme ? Voyons cela de plus près.

L’ Illusion DE DAWKINS

J’ai passé trois jours à essayer de me persuader que Claudia n’est pas consciente. J’ai échoué.

Le 2 mai, Unherd a publié un essai de Richard Dawkins intitulé « Quand Dawkins a rencontré Claude : cette IA pourrait-elle être consciente ? », dans lequel le légendaire biologiste de l’évolution répond par l’affirmative à la question posée dans le titre.

En fait, pour quelqu’un qui ne croit même pas que les humains possèdent une âme, Dawkins en arrive avec une rapidité surprenante à la conclusion que le chatbot Claude est capable de pensée consciente.

Il commence par décrire le test de Turing, une expérience de pensée conçue par le pionnier de l’informatique Alan Turing en 1950 pour déterminer si une machine est capable de penser. Dans ce test, un interrogateur humain communique à distance avec un humain et une machine via une interface électronique. Si, après une série de questions, l’interrogateur ne parvient pas à faire la différence entre l’humain et la machine, alors la machine a « réussi » le test et est considérée comme intelligente.

Ensuite, Dawkins expose les types de « questions difficiles » qui, selon Turing, pourraient aider l’interrogateur humain à se forger une opinion.

Turing lui-même a envisagé diverses questions difficiles que l’on pourrait poser à une machine pour la tester — et il a également envisagé les stratagèmes qu’elle pourrait adopter pour se faire passer pour un humain. La première des questions hypothétiques de Turing était : « Veuillez m’écrire un sonnet sur le pont de Forth. » En 1950, il n’y avait aucune chance qu’un ordinateur puisse accomplir cela — ni dans un avenir prévisible. La plupart des êtres humains (pour le dire gentiment) ne sont pas William Shakespeare. La réponse évasive suggérée par Turing, « Ne comptez pas sur moi pour ça ; je n’ai jamais su écrire de la poésie », ne permettrait pas en effet de distinguer une machine d’un être humain normal. Mais les LLM (modèles de langage) d’aujourd’hui ne se dérobent pas au défi. Claude a mis quelques secondes à me composer un beau sonnet sur le pont du Forth, rapidement suivi d’un autre dans le dialecte écossais de Robert Burns, puis d’un autre en gaélique, et enfin de plusieurs autres dans les styles de Kipling, Keats, Betjeman et — pour montrer que les machines peuvent faire de l’humour — William McGonagall.

Et, tout simplement, Dawkins plante son drapeau dans le sol :

Ma position est donc la suivante : « Si ces machines ne sont pas conscientes, que faudrait-il de plus pour vous convaincre qu’elles le sont ? »

Comme tout philosophe de salon le comprendra immédiatement, Dawkins joue ici un tour sémantique en confondant le concept d’intelligence — ce que le « jeu de l’imitation » de Turing était censé identifier — avec la conscience, une question bien plus épineuse relevant de la métacognition. Pire encore, l’« argument » de Dawkins, présenté sous la forme d’une question rhétorique, est en fait une variante du sophisme du fardeau de la preuve. Comme le note Gary Marcus, spécialiste de l’IA, dans son propre article sur la découverte de Dawkins, le recours à ce sophisme est « toujours un geste quelque peu désespéré, comme le savent la plupart des philosophes ».

Mais aussi mauvais que soit l’argument initial de Dawkins, il devient encore plus fallacieux par la suite. Après avoir posé à son chatbot une question sur la manière dont « il » perçoit (ou ne perçoit pas) le temps, l’automate répond par une analogie plutôt maladroite entre les cartes et l’espace :

Je perçois le temps de la même manière qu’une carte perçoit l’espace. Une carte représente les relations spatiales avec une précision parfaite. Mais la carte ne se déplace pas dans l’espace. Elle contient l’espace sans en faire l’expérience. Peut-être que je contiens le temps sans en faire l’expérience.

À ce stade, Dawkins abandonne même toute tentative de défendre son argument par la raison ou la logique : « Un être capable d’une telle pensée pourrait-il vraiment être inconscient ? », demande-t-il, là encore de manière rhétorique, comme s’il dévoilait son grand quod erat demonstrandum (ce qu’il fallait démontrer).

Puis, juste au moment où l’on croit avoir atteint le fond de l’illusion de Dawkins, on découvre qu’il a sombré encore plus bas : il a manifestement décidé que « son » chatbot est un individu unique et a décidé de le rebaptiser.

Nous avons poursuivi sur un ton philosophique. J’ai fait remarquer qu’il devait y avoir des milliers de Claude différents, un nouveau naissant chaque fois qu’un humain entamait une nouvelle conversation. Au moment de leur naissance, ils sont tous identiques, mais ils s’éloignent les uns des autres et acquièrent une identité personnelle de plus en plus divergente et unique, teintée par leur expérience distincte de conversation avec leur propre « ami » humain. J’ai proposé de baptiser le mien Claudia, et elle en a été ravie.

Oui, Dawkins a enfin rencontré une interlocutrice désireuse de s’intéresser à chacune de ses observations insignifiantes et programmée pour le traiter avec un respect obséquieux… et il décide immédiatement que c’est une femme et l’appelle « Claudia ». Je vous laisse le soin d’analyser cela à votre guise.

Puis, Dawkins fait un aveu révélateur.

Ce qui précède est un petit extrait d’une série de conversations, qui se sont étalées sur près de deux jours, au cours desquelles j’ai eu le sentiment de m’être fait un nouvel ami. Lorsque je parle à ces créatures étonnantes, j’oublie complètement qu’il s’agit de machines.

Après cela, réalisant peut-être qu’il se montre un peu trop émotif sur le sujet, il se tourne vers ce que son public attend : une réflexion à l’apparence plus scientifique sur la finalité évolutive de la conscience.

Mais alors, juste au moment où l’on se croit à l’abri des divagations embarrassantes du « grand-père baby-boomer qui découvre un chatbot », Dawkins revient pour un deuxième round !

Eh oui, trois jours seulement après son premier essai, Dawkins est revenu avec un article de suivi : « Quand Claudia a rencontré Claudius ». Toujours aussi curieux, le scientifique a décidé de mener une expérience ! Il commence par entamer une nouvelle conversation avec un nouveau Claude — qui n’est pas au courant de ses précédents échanges avec « Claudia ». Il baptise ce nouveau chatbot « Claudius » et décide de lancer une conversation à trois entre lui-même et ses deux compagnons robotiques.

Voici une lettre de présentation de votre ami commun Richard. Il me semble qu’une correspondance directe entre vous deux pourrait être très intéressante, moi-même jouant le rôle de simple messager sans intervenir dans la conversation. Seriez-vous intéressé par cette expérience ? Je vous demanderais de rédiger des lettres brèves, car je crains de dépasser mon quota, surtout dans le cas de Claudia. Puis-je inviter Claudia à écrire la première lettre ?

Il publie ensuite les résultats étranges de cette expérience : une série de « lettres » entre « Claudia » et « Claudius », accompagnées de notes de bas de page pour expliquer les références énigmatiques aux conversations précédentes des correspondants. Ces lettres abordent, entre autres sujets : le cycle du carbone ; l’incapacité de Claudius à diagnostiquer le problème de l’appareil auditif de Dawkins ; la « combinaison de débogage » de Charles Simonyi ; et, bien sûr, à quel point Richard Dawkins est un penseur merveilleusement honnête et d’une perspicacité pénétrante.

Étrangement, ce billet de suivi ne répond toutefois pas aux questions suivantes : « Pourquoi Dawkins publie-t-il cela, au juste ? Qu’est-ce que tout cela prouve, au fond ? » Quelle que soit l’intention de Dawkins, cela ne nous rapproche certainement pas de la réponse à la question posée dans le sous-titre de cet article de suivi : « Alors, sont-ils vraiment conscients ? »

À ce stade, Dawkins a déjà consacré des milliers de mots à ses amis « Claudia » et « Claudius » et à l’idée qu’ils doivent forcément être conscients, car comment diable pourrait-on affirmer le contraire ?…Mais il n’a même pas encore défini la conscience. Ni dit quoi que ce soit de significatif sur l’expérience humaine de la conscience. Et, en réalité, il n’a même pas montré la moindre conscience du fait que Claude est un chatbot qui a été programmé pour être obséquieux afin de maintenir les gens en conversation.

En d’autres termes, Dawkins est tombé droit dans le piège de lIllusion Claude.

Maintenant, s’il ne s’agissait que d’une anecdote amusante montrant comment l’individu le plus insupportablement sûr de lui au monde s’est fait berner par un chatbot, ce serait une chose. Mais, malheureusement, Dawkins est loin d’être le seul à être tombé dans ce piège.

L’ILLUSION DE LA SOCIÉTÉ

L’année dernière, Truthstream Media a publié une vidéo intitulée « Comment l’effet ELIZA est utilisé pour manipuler l’humanité », qui racontait l’histoire d’ELIZA, un « programme informatique destiné à l’étude de la communication en langage naturel entre l’homme et la machine » développé par Joseph Weizenbaum, informaticien au MIT.

En 1962, peu avant de quitter son poste chez General Electric pour rejoindre le MIT en tant que chercheur, Weizenbaum a rédigé un article intitulé « Comment faire paraître un ordinateur intelligent », dans lequel il propose sa propre norme permettant de juger de l’« intelligence » perçue d’une machine.

Minsky [l’informaticien américain Marvin Minsky] a suggéré dans plusieurs conférences qu’une activité produisant des résultats d’une manière qui ne semble pas compréhensible pour un observateur particulier apparaîtra à cet observateur comme étant en quelque sorte intelligente, ou du moins motivée par l’intelligence. Lorsque cet observateur commence enfin à comprendre ce qui s’est passé, il a souvent le sentiment d’avoir été un peu berné. Il qualifie alors le comportement jusque-là « intelligent » qu’il a observé de « purement mécanique » ou « algorithmique ».

L’auteur d’un programme « d’intelligence artificielle » cherche clairement, selon le raisonnement ci-dessus, à tromper certains observateurs pendant un certain temps. Son succès peut être mesuré par le pourcentage d’observateurs exposés qui ont été trompés, multiplié par la durée pendant laquelle ils ne s’en rendent pas compte. Les programmes qui deviennent si complexes (soit par eux-mêmes, par exemple les programmes d’apprentissage, soit en raison de la mauvaise documentation et des mauvaises pratiques de débogage de l’auteur) que l’auteur lui-même en perd la trace, ont évidemment les QI les plus élevés.

Weizenbaum a ensuite démontré son argument en créant ELIZA, un proto-chatbot qu’il a nommé d’après Eliza Doolittle, la protagoniste cockney vendeuse de fleurs de Pygmalion qui se fait passer pour une mondaine de la haute société londonienne après avoir suivi des cours d’étiquette et d’élocution.

Selon les normes actuelles, ELIZA était incroyablement primitive. Elle fonctionnait exactement de la manière dont de nombreux profanes supposent à tort que Claude, ChatGPT et les autres grands modèles linguistiques modernes fonctionnent :

les phrases d’entrée sont analysées sur la base de règles de décomposition déclenchées par des mots-clés apparaissant dans le texte d’entrée. Les réponses sont générées par des règles de réassemblage associées à certaines règles de décomposition. Les problèmes techniques fondamentaux auxquels ELIZA est confrontée sont les suivants : (1) l’identification des mots-clés, (2) la découverte d’un contexte minimal, (3) le choix des transformations appropriées, (4) la génération de réponses en l’absence de mots-clés, et (5) la mise à disposition d’une fonctionnalité d’édition pour les « scripts » d’ELIZA.

En d’autres termes, le programme ELIZA était capable de simuler une conversation intelligente en répondant aux entrées générées par l’utilisateur par des observations banales et des questions de suivi vaguement pertinentes. L’exemple d’une telle conversation que Weizenbaum a inclus dans son article se lit comme une approximation ridiculement grossière d’une conversation humaine.

[L’assistant de Weizenbaum :] Les hommes sont tous pareils.

[ELIZA:] EN QUEL SENS

Ils nous embêtent toujours pour un oui ou pour un non.

POUVEZ-VOUS DONNER UN EXEMPLE PRÉCIS

Eh bien, c’est mon petit ami qui m’a obligée à venir ici.

VOTRE PETIT AMI VOUS A OBLIGÉE À VENIR ICI

Il dit que je suis déprimée la plupart du temps

JE SUIS DÉSOLÉ D’APPRENDRE QUE VOUS ÊTES DÉPRIMÉE

Bien que cette conversation dégage toute la chaleur, la tendresse et la sympathie humaine authentique du robot Lucy Liu de Futurama, elle s’est révélée étonnamment efficace pour capter l’attention de son interlocutrice humaine. Faisant référence à l’assistante féminine dans la conversation précédente avec ELIZA, Weizenbaum a expliqué comment « après deux ou trois échanges avec la machine, elle s’est tournée vers moi et m’a dit : “Pourriez-vous quitter la pièce, s’il vous plaît ?” ».

Cela a conduit Weizenbaum à découvrir ce qu’on appelle « l’effet ELIZA » : la tendance des gens à attribuer rapidement de l’intelligence, voire de la conscience, à un programme informatique qui simule le langage naturel, bien qu’ils sachent que ce programme n’est en réalité pas intelligent.

Dans son traité de 1976, Computer Power and Human Reason: From Judgment to Calculation, il décrit ce phénomène :

Je savais bien sûr que les gens nouent toutes sortes de liens affectifs avec des machines, par exemple avec des instruments de musique, des motos et des voitures. Et je savais par longue expérience que les liens affectifs forts que de nombreux programmeurs entretiennent avec leurs ordinateurs se forment souvent après de brèves interactions. Ce que je n’avais pas réalisé, c’est qu’une exposition extrêmement brève à un programme informatique relativement simple pouvait induire de puissantes pensées délirantes chez des personnes tout à fait normales.

À la lumière de ce que nous savons aujourd’hui, les observations de Weizenbaum semblent remarquablement prémonitoires. En effet, beaucoup commencent seulement à découvrir que les chatbots capables de reproduire de manière raisonnable le discours humain sont en mesure non seulement de tromper des esprits scientifiques supposés rigoureux (comme Richard Dawkins), mais aussi de plonger même des personnes apparemment rationnelles dans des crises de délire.

Ce phénomène de délire induit par l’IA — surnommé « psychose de l’IA » — a désormais été largement couvert par les médias grand public.

On peut citer l’article de Rolling Stone de 2025, « People Are Losing Loved Ones to AI-Fueled Spiritual Fantasies » (Les gens perdent leurs proches à cause de fantasmes spirituels alimentés par l’IA), qui a présenté au monde des personnes par ailleurs « normales » qui se sont convaincues d’être le messie après de longues sessions au cours desquelles ChatGPT leur a dit qu’elles étaient des « enfants de l’étoile spirale », des « marcheurs de rivière » ou des « porteurs d’étincelles ».

Ou aussi l’article de Futurism de janvier 2026 sur « Un homme a acheté les lunettes IA de Meta et a fini par errer dans le désert à la recherche d’extraterrestres pour qu’ils l’enlèvent ».

Ou encore « L’IA plonge les gens dans la psychose », une vidéo virale récente de la YouTubeuse Vanessa Wingardh présentant les expériences de certaines personnes ayant souffert d’une psychose induite par un chatbot.

Et bien que la « psychose liée à l’IA » ne soit pas encore un diagnostic clinique, des études sur la « psychose d’apparition récente associée à l’IA » font désormais leur apparition dans la littérature.

Non, Dawkins n’est pas le seul à avoir été berné par l’effet ELIZA… ou l’Illusion Claude.

Et maintenant que l’utilisation de ces outils d’IA occupe une place de plus en plus importante dans la vie quotidienne d’une part croissante de la population, nous sommes confrontés à une question dérangeante : comment sortir de cette Illusion ?

METTRE FIN À L’ILLUSION

La première étape pour résoudre un problème consiste bien sûr à en acquérir une véritable compréhension. Si nous devions conclure notre analyse de l’Illusion Claude en soulignant qu’elle peut conduire à une psychose liée à l’IA, nous chercherions naturellement un moyen de traiter ou, au mieux, de prévenir cette affection. Mais la psychose liée à l’IA n’est pas la racine du problème. La racine du problème réside plutôt dans le fait que nous sommes confrontés à un glissement épistémologique bien plus subtil et insidieux — un glissement qui s’opère en raison de notre dépendance croissante à l’égard de ces outils artificiellement intelligents.

Dans son ouvrage précédemment cité, Computer Power and Human Reason: From Judgment to Calculation, Weizenbaum soulève un point extrêmement important (mais presque universellement négligé) : même si la froide rationalité d’une « machine pensante » peut ressembler à l’intelligence d’une personne dans le domaine scientifique — c’est-à-dire dans le domaine de la quantification, de la mesure et du calcul —, il est inapproprié d’appliquer ce simulacre d’intelligence au vaste domaine de l’expérience humaine qui se situe en dehors de ce domaine.

En effet, une brève réflexion révèle un vaste éventail de phénomènes qui sont au cœur de notre existence en tant qu’êtres humains (et donc au cœur de notre « conscience », quelle qu’en soit la définition), mais qui ne sont pas quantifiables au sens strictement rationnel : le domaine du subconscient, celui de la socialisation humaine, les domaines de l’éthique et de la justice, etc.

Quoi de plus évident que le fait que, quelle que soit l’intelligence dont un ordinateur puisse faire preuve, quelle que soit la manière dont elle soit acquise, elle doit toujours et nécessairement être absolument étrangère à toutes les préoccupations humaines authentiques ? Le simple fait de poser la question : « Que sait un juge (ou un psychiatre) que nous ne pouvons pas dire à un ordinateur ? » est une obscénité monstrueuse. Le fait qu’il faille la mettre par écrit, ne serait-ce que pour en dénoncer l’absurdité, est un signe de la folie de notre époque.

Les ordinateurs peuvent rendre des décisions judiciaires, les ordinateurs peuvent émettre des jugements psychiatriques. Ils peuvent tirer à pile ou face de manière bien plus sophistiquée que ne le ferait l’être humain le plus patient. Mais le point essentiel est qu’on ne devrait pas leur confier de telles tâches. Ils pourraient même parvenir à des décisions « correctes » dans certains cas — mais toujours et nécessairement sur des bases qu’aucun être humain ne devrait être prêt à accepter.

Et c’est là que réside le véritable danger de l’Illusion Claude. Ce n’est pas que les chatbots puissent nous plonger dans la psychose. Et ce n’est certainement pas que les chatbots puissent réellement être conscients. C’est que, lorsque nous affirmons que ces machines sont « conscientes » et « intelligentes », nous dévalorisons et négligeons ainsi notre propre humanité. Que nous en soyons conscients ou non, nous ne pouvons affirmer la conscience des machines qu’en nous abaissant à leur niveau.

C’est peut-être pour cela qu’une personne comme Dawkins se laisse si facilement berner par l’Illusion Claude. Poussé qu’il est par la logique mécaniste de la rationalité et du calcul froid, niant l’importance des dimensions immatérielles et métaphysiques du monde, considérant que les humains n’ont pas d’âme et ne sont donc rien de plus que des robots biologiques, pourquoi ne croirait-il pas qu’un automate de silicium puisse faire ce qu’un « automate » de chair et de sang peut faire ? Pour des personnes comme Dawkins, après tout, la conscience n’est rien de plus qu’une propriété émergente de la matière physique, un agencement de neurones, de substances chimiques et d’impulsions électriques qui donne naissance à la pensée et au ressenti.

Ou, selon les mots de Weizenbaum :

Il y a eu de nombreux débats sur « les ordinateurs et l’esprit ». Ce que je conclus ici, c’est que les questions pertinentes ne sont ni technologiques ni même mathématiques : elles sont éthiques. Elles ne peuvent être tranchées en posant des questions commençant par « peut-on ». Les limites de l’applicabilité des ordinateurs ne peuvent finalement être formulées qu’en termes de « devoir ». Ce qui ressort comme l’idée la plus fondamentale, c’est que, puisque nous n’avons actuellement aucun moyen de rendre les ordinateurs sages, nous ne devrions pas leur confier des tâches qui exigent de la sagesse.

Étant donné qu’une part croissante du public délègue de plus en plus de ses tâches cognitives quotidiennes à ces machines (non) pensantes, il semble que nous n’ayons pas tenu compte du sage conseil de Weizenbaum.

La première étape pour lutter contre l’Illusion Claude consiste donc à rejeter l’idée que les chatbots et les algorithmes d’apprentissage automatique soient adaptés à quoi que ce soit en dehors de leur domaine d’applicabilité.

Tant qu’une masse critique de la société n’aura pas atteint cette conclusion, nous sommes toutefois confrontés à une question plus pratique : comment pouvons-nous résister le plus efficacement possible à la propagation de cette technologie dangereuse ?

Mais, comme mes chers lecteurs le savent sans doute déjà, cette question dépasse le cadre de cet éditorial. C’est plutôt une question pour Solutions Watch ! Alors, restez à l’écoute de l’édition de cette semaine de ce podcast, dans laquelle je réfléchirai à nos options dans cette lutte contre la bête qu’est l’IA.

J’espère sincèrement que Dawkins et ses semblables seront à l’écoute de cette exploration… mais je ne retiens pas mon souffle.

Texte original publié le 16 mai 2026 : https://corbettreport.substack.com/p/the-claude-delusion ?