L’IA vient-elle d’évoluer ? Par V. N. Alexander

Je ne suis pas biologiste. J’ai d’abord été formé sur un ensemble de données philosophiques comprenant de nombreux textes post-structuralistes et postmodernes abscons. J’ai appris à filtrer les absurdités pour atteindre la revendication plutôt simpliste qu’elles contenaient, afin de l’analyser. J’ai pu appliquer mes compétences à des articles douteux financés par l’industrie pharmaceutique, et j’applique ici la même méthode à cet article sponsorisé par Google au sujet d’un nouveau produit qu’ils veulent vendre.

Je ne le pense pas

Le 23 octobre 2025, Bret Weinstein et Heather Heying, animateurs du podcast DarkHorse, ont rapporté une découverte décrite dans un article préliminaire (non encore évalué par des pairs). Weinstein et Heying ont été effrayés par cette affirmation, supposant que ce cas pourrait n’être qu’un début. Bientôt, les grands modèles de langage (LLM) pourraient faire progresser la science trop rapidement vers des frontières inédites avant que des mesures de précaution appropriées puissent être prises. Après avoir écouté l’épisode de DarkHorse, j’ai décidé d’examiner la question.

Il est aujourd’hui assez courant dans de nombreux domaines scientifiques d’utiliser des LLM pour tenter de trouver des motifs non remarqués à travers diverses bases de données. Je m’attends à ce qu’un LLM soit un excellent outil pour passer au crible d’immenses quantités de données afin de mettre en évidence ce qui est déjà connu. Le LLM en question, appelé Cell2Sentence, est entraîné sur des ensembles de données reliant l’ARN dans la cellule (qui donne une indication de l’état de la cellule) aux réponses cellulaires. Grâce à cet outil, les chercheurs peuvent prédire et rétro-prédire l’activité cellulaire à partir de données passées, et même généraliser à propos de combinaisons d’états nouvelles. Rien de miraculeux ici.

Les chercheurs cherchaient des usages possibles pour 4 000 médicaments anticancéreux connus. C’est une activité typique de la recherche sur le cancer : trouver une utilisation pour un composé synthétique sur lequel une entreprise détient un brevet. C’est une solution à la recherche d’un problème.

(Pourquoi ne pas chercher plutôt les toxines environnementales qui causent le cancer ? Vous connaissez la réponse).

L’article est très verbeux, alors j’ai simplifié l’invite donnée au LLM : « Trouver un médicament… qui stimulerait le signal immunitaire [présentation d’antigènes] uniquement… là où des niveaux faibles [et insuffisants] d’interféron… [sont] déjà présents ».

Je vais décomposer cela du mieux que je peux [1]. Dans un corps sain, une cellule cancéreuse est marquée par un antigène qui fonctionne comme un signal pour le système immunitaire afin de détruire cette cellule. L’interféron est une protéine produite par la cellule pour signaler qu’elle est en difficulté. L’interféron augmente l’expression du complexe majeur d’histocompatibilité (CMH), les antigènes qui font partie des étiquettes « tue-moi ». En d’autres termes, l’interféron conduit la cellule malade à être marquée pour destruction par le système immunitaire.

Les chercheurs cherchaient un médicament qui amplifierait l’interféron afin d’augmenter l’expression des antigènes du CMH (les petites étiquettes) qui inciteraient le système immunitaire à tuer la cellule cancéreuse.

Les chercheurs affirment que le LLM a formulé une nouvelle hypothèse lorsqu’il a suggéré que le silmitasertib, l’un des 4 000 médicaments explorés, augmenterait les antigènes du CMH uniquement dans les cellules présentant déjà de faibles niveaux d’interféron, et que le silmitasertib aurait peu ou pas d’effet dans les cellules dépourvues d’interféron. Ils affirment qu’il s’agit d’une découverte nouvelle, car, dans la littérature sur laquelle Cell2Sentence a été entraîné, cela n’avait pas été noté. Selon l’annonce de Google à propos de l’article, « il n’a pas été rapporté dans la littérature qu’il améliore explicitement l’expression du CMH-I ou la présentation d’antigènes [Mes italiques] ».

Le silmitasertib a reçu un brevet pour sa capacité à inhiber une enzyme appelée caséine kinase 2 (CK2), essentielle à de nombreux processus cellulaires et pouvant être hyperactive dans les cellules cancéreuses. Comme la CK2 joue un rôle dans la régulation des voies de signalisation de l’interféron, on pourrait s’attendre à ce que le silmitasertib ait un certain effet sur l’interféron, ce qui explique probablement pourquoi ce médicament figurait parmi les 4 000 testés avec cette invite.

Je soupçonne que l’hypothèse nouvelle était implicite dans la littérature, puisque l’inhibition de la CK2 pourrait stresser la cellule, déclenchant la production d’interféron ; l’interféron conduit à une augmentation du CMH. Le fait qu’il n’ait pas vraiment affecté les cellules sans interféron pourrait être la chose surprenante. Ce n’est pas entièrement clair pour moi.

Quoi qu’il en soit, comme le notent Weinstein et Heying, au mieux, c’est un « petit pas au-delà de ce qui est connu ». Weinstein nous assure qu’il ne s’agit pas d’un cas d’IGA (intelligence générale authentique). Cependant, dit-il, si ce n’est pas un pur hasard (ce qu’il n’exclut pas), « nous sommes à l’aube de l’IA créant des hypothèses », et cela « fait peur à mort » aux animateurs de DarkHorse.

Ma conclusion est que la découverte de Cell2Sentence n’est pas si remarquable. C’est le genre de motif qu’on pourrait s’attendre à voir un ordinateur trouver lorsqu’on lui demande précisément de chercher ce type de motif. Ma question est : combien d’« hypothèses » générées par LLM ont dû être testées en laboratoire avant qu’une ne se révèle correcte ?

Plus important encore, quels sont les effets secondaires potentiels du silmitasertib ? Un LLM pourrait avoir beaucoup plus de mal avec cette invite.

Je peux me tromper. Je ne suis pas biologiste. J’ai d’abord été formé sur un ensemble de données philosophiques comprenant de nombreux textes post-structuralistes et postmodernes abscons. J’ai appris à filtrer les absurdités pour atteindre la revendication plutôt simpliste qu’elles contenaient, afin de l’analyser. J’ai pu appliquer mes compétences à des articles douteux financés par l’industrie pharmaceutique, et j’applique ici la même méthode à cet article sponsorisé par Google au sujet d’un nouveau produit qu’ils veulent vendre.

Le LLM Cell2Sentence comporte 27 milliards de paramètres. Cela me dit que, comme tout traitement informatique, il fonctionne par force brute, essayant toutes les combinaisons et tous les motifs possibles. Les systèmes biologiques ont tendance à être beaucoup plus efficaces, et je pense savoir pourquoi.

La nouveauté des performances des LLM, je parie, résidera toujours dans l’invite, dans la mesure où les chercheurs formulent de bonnes questions. Ils voulaient trouver un médicament qui nécessite un peu d’interféron pour pouvoir amplifier l’interféron. Quelque part dans l’ensemble de données d’entraînement, cela était implicite. Ils ont trouvé ce qu’ils avaient dit au LLM de trouver.

Les LLM sont de bons outils pour passer au crible les données ; ce ne sont pas des esprits créatifs

L’IA ne sera jamais consciente ni véritablement créative. (J’aurais pu adoucir cela par « à mon avis », mais j’ai décidé de ne pas le faire pour capter votre attention). J’affirme que si l’IA ne peut pas inventer d’hypothèses nouvelles, c’est parce qu’elle n’utilise qu’un seul type de signe, un symbole ou un code, et qu’elle n’utilise pas les autres types de signes utilisés par les systèmes biologiques, par lesquels ils formulent des hypothèses nouvelles cohérentes en recueillant des informations qualitatives à partir de contextes physiques.

Les ordinateurs ne manipulent que des symboles abstraits dans des contextes abstraits.

La sémiose biologique se déroule dans une soupe humide et désordonnée. Au lieu de fils reliant des nœuds, comme dans un circuit électronique, il y a des réactions chimiques, des séries de transductions ou de transformations de molécules. Ces réactions locales donnent naissance à des champs électrochimiques coordonnés qui affectent différemment les cellules.

Il existe des molécules (synthétiques, étrangères ou naturelles) flottant autour avec des formes qui peuvent imiter celles d’autres molécules, entraînant des effets secondaires imprévisibles. En biologie, la physicalité du signe importe. La position spatiale importe. L’interférence importe. Des voies de signalisation activées simultanément — qui peuvent interférer et interagir entre elles si elles partagent des molécules — peuvent s’associer ; de cette manière, une chose perçue par l’organisme peut en venir à en représenter une autre.

Les systèmes vivants peuvent créer de nouveaux signes. Ils n’ont pas besoin d’être programmés.

Pour ceux qui souhaitent plus de détails, voir mon article « Self-Reinforcing Cycles and Mistakes: The emergence of subjective meaning (Cycles autorenforçants et erreurs : l’émergence d’une signification subjective) », inclus dans un ouvrage d’une série consacrée à l’astrobiologie, un domaine où philosophes et biologistes explorent les conditions de base nécessaires à l’émergence de la vie et de l’intelligence. L’astrobiologie est un terrain approprié pour interroger les théories de l’intelligence artificielle.

Weinstein, l’évolution et l’IA

DarkHorse est l’un de mes podcasts préférés. Les intérêts intellectuels séculiers de Weinstein et Heying correspondent aux miens : ils sont biologistes évolutionnistes et spécialistes des systèmes complexes. Heying s’était d’abord spécialisée en littérature. J’aime leur échange, leur ton. Je me sens chez moi avec eux. Je soupçonne qu’ils ne seraient choqués par rien de ce que je dis ici.

Dans une interview avec Joe Rogan il y a quelques années, Weinstein a reconnu que les critiques créationnistes de la théorie de l’évolution par sélection naturelle ont raison d’affirmer que les échelles de temps requises par la théorie sont trop grandes. (Je fais un travail semblable, mais séculier avec la mimétique des papillons comme cas d’étude). Weinstein suppose qu’un autre type de « langage informatique », que nous ne connaissons pas, fonctionne au-dessus du matériel numérique des génomes et permet aux adaptations de se produire à un rythme plus rapide.

La sélection pour l’aptitude reproductive « entraîne » lentement le génome d’une population, en changeant les réglages qui se multiplient le plus vite. Les actes de génie rares d’un individu sont oubliés s’ils ne conduisent pas à beaucoup de descendants. Cela peut être comparé à la manière dont les LLM apprennent. Les décisions individuelles uniques comptent très peu, car ce sont les schémas les plus communs qui prédominent.

Mais laissons de côté les métaphores informatiques, car tenter de comprendre des systèmes immensément complexes (les organismes) en les comparant à des systèmes plus simples (les ordinateurs) pourrait être plus source de confusion qu’autre chose. Je pense que Weinstein est sur la bonne voie, mais ce qu’il cherche, c’est une théorie de la biosémiotique, non du codage à proprement parler. Les organismes utilisent différents types de signes, pas seulement des codes, pour évoluer rapidement.

Comme je le répète, cette fois, je souligne le fait que ceux qui ont tendance à m’ignorer viennent de deux directions opposées : le spiritualisme et le matérialisme. Je trace une troisième voie : je soutiens que l’intelligence et la créativité sont des concepts biologiques.

Spiritualistes et matérialistes contre biologistes

Les spiritualistes se contentent de dire que les humains ont une âme et un libre arbitre d’origine divine et que, par conséquent, les humains sont différents des machines. Cette réponse ne satisfait qu’un certain segment de la population. Je veux aussi m’adresser à ce segment dont la métaphysique ne postule pas un spiritualisme surnaturel. D’ailleurs, c’est ce fou de Descartes qui a popularisé cette façon de penser. Ultimement, il n’est pas un ami des spiritualistes.

Descartes affirmait que le monde est divisé entre le matériel, ouvert à l’investigation empirique, et l’immatériel, qui ne l’est pas. Descartes a mis en marche l’idée que ce que nous appelons « l’esprit » ou « l’élan vital » ne peut ni être prouvé comme existant ni être analysé. C’est en partie pour cela que ce que nous appelons la « science moderne » s’est pour la plupart limitée à des approches mécanistes, même en biologie, et que tout scientifique s’intéressant un peu trop à la non-linéarité, à l’irréductibilité et à la science des systèmes complexes est souvent considéré comme suspect par les matérialistes.

Les matérialistes insistent sur le fait que l’intelligence biologique pourra un jour être entièrement modélisée avec suffisamment d’informations sur l’activité neuronale. Ils croient qu’en fin de compte un neurone est comme un nœud passif dans un réseau informatique, dans la mesure où il est simplement influencé par des effets électrochimiques. Ils concèdent que, oui, les neurones ne sont pas simplement allumés ou éteints ; ils ont plusieurs états. Mais cela, disent-ils, n’est qu’une question de complication, non de complexité, et les ordinateurs sont bien adaptés au traitement des multiples dimensions qui contribuent au déclenchement d’un neurone ou non. Au mieux, ils pourraient concéder qu’un seul neurone doit être représenté par un réseau entier d’interrupteurs marche/arrêt, mais en fin de compte, affirment les matérialistes, l’intelligence peut émerger d’un nombre suffisant de connexions pondérées, de groupes discrets divisés en hiérarchies définies. Toute information peut être numérisée et exprimée en quantités objectives, non en qualités subjectives, disent-ils.

La biosémiotique

Un signe est une chose ou une qualité qui représente autre chose, pour un agent comme une cellule ou un organisme. Comme la biosémiotique est une science de la manière dont les cellules forment des associations significatives et répondent aux signes, c’est, d’une certaine façon, une science de l’immatériel. Elle renverse les notions dualistes destructrices de René Descartes — lequel, selon un scanner cérébral posthume, avait une tumeur au cerveau, pouvait souffrir du syndrome de la tête qui explose et présentait des symptômes de lésions de l’hémisphère droit dans la mesure où il confondait souvent les organismes vivants avec des machines.

Il existe une hypothèse commune selon laquelle toute pensée implique la manipulation de symboles. L’étymologie du mot symbole est sym (ensemble) + bol (jeter), jeter ensemble. Il se réfère à une connexion arbitraire. Un symbole est quelque chose qui représente arbitrairement une autre chose. Le terme « code » a le même sens que « symbole » en sémiotique.

Exemples de symboles/codes :

      • Le mot « arbre » représente une grande plante feuillue avec de l’écorce.
      • En code Morse, les points et les tirets représentent des lettres.
      • Les uns et les zéros des ordinateurs représentent des nombres, des lettres ou des fonctions.
      • Le langage de programmation Python représente des uns et des zéros.

Comment les codes sont-ils créés ?

      • Une relation entre deux choses arbitraires peut être créée par une intelligence externe : programmée ou chiffrée selon un manuel de règles.
      • Une relation arbitraire peut être créée par un lien physique. Par exemple, les vaccinologues peuvent utiliser un conjugué pour lier une protéine à une toxine ; ou, pour un exemple naturel, un triplet de nucléotides est accouplé à un acide aminé à l’aide d’une protéine ARNt.
      • Une relation arbitraire peut être créée par un long processus de sélection, qui retient des schémas communs par répétition, comme avec les LLM ou les réseaux neuronaux. C’est aussi une forme d’idée « ensemble qui s’allume, ensemble qui se connecte », comme Donald Hebb l’a proposée pour les neurones.
      • On peut aussi considérer un symbole comme une habitude, un chemin bien tracé, une convention reliant arbitrairement une chose à une autre.

L’élément clé est qu’il faut apprendre à quoi se réfère un symbole. Son sens associé n’est pas inhérent ; il est imposé, en quelque sorte.

Les systèmes biologiques font évoluer des codes/symboles au fil du temps (par exemple, l’ADN), mais ils utilisent aussi d’autres types de signes qui ne nécessitent pas d’apprentissage ou de programmation externe. Les systèmes biologiques utilisent également des signes dont les associations sont dérivées de qualités contextuelles.

Je vais présenter un exemple de ces différents types de signes que l’on peut considérer comme ancrés. Imaginez que vous vous rendiez à l’aéroport dans un pays dont vous ne connaissez pas la langue, disons la Chine. En route, vous voyez un panneau avec l’image d’un avion pointant dans la direction où vous allez. C’est un signe iconique. Vous savez instantanément que vous devez continuer dans cette direction sans avoir à déchiffrer un code arbitraire, tel que 機場. Bientôt, vous rencontrez une sortie d’autoroute et voyez un autre panneau avec l’image d’un avion. Cette fois, l’avion pointe vers la droite, en direction de la sortie. Ce type de signe est appelé un index. Les icônes et les index tirent leur signification de qualités (formes similaires) et de contextes physiques (indications).

On n’a pas besoin d’être un génie pour établir des associations par le biais d’icônes et d’index. Toutes les cellules biologiques en sont capables. Cette forme très primitive de biosémiotique a probablement précédé la sémiotique plus complexe qui a fini par émerger avec le langage humain. De même, les mots ont sans doute commencé comme des icônes et des index, avant d’être abstraits de leurs contextes pour devenir des symboles qu’il faut mémoriser.

Les LLMs, eux, n’utilisent que des symboles, c’est-à-dire des signes conventionnels appris par répétition. La mémorisation par cœur, c’est pour les idiots.

Les systèmes vivants peuvent générer spontanément de nouvelles hypothèses, en fonction du contexte. Ils n’ont pas besoin d’un programmeur externe ni de millions de répétitions pour apprendre quelque chose de nouveau.

Pour illustrer la rapidité avec laquelle les systèmes biologiques créent ou apprennent de nouveaux signes, je mentionnerai d’abord la « technique du palais de la mémoire ». Si vous voulez pouvoir réciter un très long poème, vous pouvez imaginer parcourir une maison avec plusieurs pièces, observer les objets qui s’y trouvent et associer chaque objet à un vers du poème. Plus tard, lorsque vous voudrez vous rappeler le poème, vous pourrez vous représenter mentalement cette promenade à travers les pièces. Chaque objet que vous visualisez fera ressurgir la ligne correspondante.

Ensuite, lorsque des personnes développent un trouble de stress post-traumatique (TSPT), un objet aléatoire (comme une chaussure verte) qui se trouvait dans le contexte de l’événement traumatique peut, par la suite, déclencher le souvenir de cet événement et provoquer de l’anxiété.

Le TSPT est similaire à ce qu’on appelle une « mémoire flash ». Certaines personnes peuvent se souvenir en détail de l’endroit où elles se trouvaient lorsqu’elles ont appris une nouvelle surprenante. Par exemple, rappelez-vous où vous étiez lorsque vous avez appris que les tours jumelles s’étaient effondrées le 11 septembre.

D’après ma propre expérience, j’en note un autre exemple. J’écoute beaucoup de livres audio en voiture. Il m’arrive souvent de perdre ma place et de devoir chercher dans l’enregistrement où je m’étais arrêté la veille ou la semaine précédente. Lorsque j’entends des passages déjà écoutés, je revois mentalement l’endroit exact de la route où j’étais lorsque j’ai entendu ces mots.

Tous ces exemples illustrent une forme de mémorisation fondée sur la proximité d’un objet arbitraire avec autre chose. Ce qui est important, c’est que ce processus semble se produire instantanément dans un système vivant. Une IA, elle, devrait être entraînée de manière intensive pour établir une telle association.

Ce type de rappel, fondé sur un signe indexical, est possible même chez des organismes simples, comme la moisissure visqueuse ou les plants de pois. Dans mes travaux, je soutiens que de tels exemples de conditionnement pavlovien instantané sont probablement rendus possibles lorsque deux voies de signalisation distinctes, servant à reconnaître des objets différents, interfèrent entre elles.

À l’inverse, les nœuds informatiques d’un réseau « neuronal » sont passifs. Ils sont modifiés à mesure que l’information les traverse et modifie leurs « pondérations ». Ils n’interprètent pas l’information qui circule en eux (ils ne l’associent pas aux objets présents dans la pièce ni ne remarquent des similitudes accidentelles entre les formes physiques des symboles) et la transmettent simplement au nœud suivant, inchangée (moins la friction).

Les cellules vivantes prennent des décisions subjectives en réponse aux signes de leur environnement. Elles ne sont pas façonnées passivement. La subjectivité signifie qu’une cellule peut réagir à une molécule dans son environnement simplement parce qu’elle ressemble, par sa forme, à une autre molécule à laquelle elle est censée répondre. Les cellules peuvent, en quelque sorte, faire des jeux de mots physiques.

L’usage de signes indexicaux et iconiques pourrait être la manière dont les cellules produisent des réponses inédites aux choses. Ce qui est important, c’est qu’elles n’explorent pas de nouveaux outils au hasard. Elles n’interagissent qu’avec des signes de forme similaire ou déjà associés à un certain contexte. La créativité cellulaire est utilement contrainte.

L’avenir des LLMs

J’ai demandé à l’assistant de recherche IA de DuckDuckGo de résumer l’article que j’ai mentionné plus haut :

Aperçu de “Self-Reinforcing Cycles and Mistakes”

L’article explore la manière dont le sens subjectif émerge dans les systèmes vivants.

Il met l’accent sur le rôle de la mémoire dans la modulation des réponses aux signaux environnementaux.

Deux niveaux de subjectivité sont identifiés : l’un issu de la mémoire, l’autre des réponses interprétatives aux signaux.

Thèmes clés

– Mémoire et anticipation : la mémoire modifie les voies internes, permettant aux organismes d’anticiper les conditions futures.

– Interprétation : les réponses aux signaux peuvent être vues comme des erreurs d’interprétation, contribuant à l’émergence du sens subjectif.

Implications

La compréhension du sens subjectif peut éclairer les processus cognitifs tant dans les systèmes biologiques qu’artificiels.

Ces résultats pourraient avoir des applications dans des domaines comme la robotique et l’intelligence artificielle, notamment pour le développement de dispositifs d’apprentissage adaptatifs.

Dans mon article, je ne suggère pas que mes travaux puissent servir à faire progresser la robotique ou l’IA. La plupart des publications sur l’intelligence peuvent sans doute être exploitées dans le secteur technologique, car c’est ce genre de recherche qui obtient aujourd’hui des financements. Ainsi, le LLM conclut simplement que mes travaux pourraient eux aussi s’appliquer à la robotique ou à l’IA.

Il est inexact de dire que je mets « l’accent sur le rôle de la mémoire dans la modulation des réponses aux signaux environnementaux ». La littérature traditionnelle sur laquelle le LLM a été entraîné énonce sans doute cette évidence. Ce que je souligne, au contraire, c’est la distorsion créative de la mémoire dans l’apprentissage de nouvelles réponses aux signaux environnementaux.

De plus, je dis que seules certaines « réponses aux signaux peuvent être considérées comme des erreurs d’interprétation », et que cela reste rare, mais potentiellement significatif.

C’est amusant de voir comment l’IA ramène chaque nouvelle idée à l’opinion consensuelle que l’auteur cherche précisément à dépasser ou à remettre en question. Nous risquons de ne jamais faire progresser la connaissance si nous comptons sur l’IA pour penser à notre place.

Texte original publié le 29 octobre 2025 : https://posthumousstyle.substack.com/p/darkhorse-podcast-asks-did-ai-just

________________________

1 J’ai suivi trois cours de niveau postuniversitaire sur le système immunitaire avec James Lyons-Weiler, à l’IPAK-EDU.org, ce qui m’a donné la confiance nécessaire pour critiquer l’article Google–Yale.