Planète GAÏA -> Sciences -> Mathématiques -> La Formule qui Décrypte le Monde

La Formule qui Décrypte le Monde

Vieille de 300 ans, elle révolutionne toutes les sciences... Une formule magique ! S'appliquant à n'importe quel phénomène, elle produit des resultats, livre des découvertes, établit des verités. Mieux : des neurologues y voient la clé de notre façon de penser ! Pourtant, cette formule est simplissime et connue... depuis trois siècles. Oui, mais ce n'est qu'aujourd'hui qu'elle dévoile son incroyable puissance. Son nom ? La formule de Bayes.

C'est une petite formule mathématique de rien du tout. Une égalité arithmétique tout ce qu'il y a de plus banal. Et pourtant, elle est en train de provoquer un véritable raz de marée à travers tous les domaines de la science. Un rapide survol par mots-clés du panorama mondial des publications scientifiques en témoigne : cette formule apparaît aujourd'hui dans des secteurs aussi disparates que l'informatique, la sismologie ou la climatologie. Mais aussi dans "le diagnostic médical, l'écologie, l'astronomie, la production industrielle, les sciences du comportement"..., ajoute Philippe Leray, directeur du Laboratoire d'informatique de l'Ecole polytechnique de l'université de Nantes. "La physique des particules, la chimie, la bio-informatique, la génétique", complète Jean-Michel Marin, professeur à l'Institut de mathématiques et modélisation de l'université de Montpellier. N'en jetez plus !
Telle une lame de fond, cette formule se retrouve depuis une décennie dans tous les domaines. À la clé ? Une incroyable moisson de découvertes et d'inventions ! Dans les sciences fondamentales, mais aussi au quotidien.

À LA PORTÉE D'UN LYCÉEN

Chaque jour, dans les PC et les Mac du monde entier, elle permet de débusquer les messages publicitaires parmi les flots d'e-mails reçus : on la trouve à la racine de programmes informatiques qui traquent les fraudes bancaires ; et jusque dans les voitures, où elle commande des dispositifs d'aide à la conduite. Comme une consécration, la vénérable Food and Drugs Administration américaine recommande même son utilisation pour évaluer l'efficacité des médicaments ! "Difficile de trouver des domaines où cette formule ne pourrait pas rendre d'énormes services résume Jean-Michel Marin. Certains parlent "d'explosion" d'autres crient à la "révolution". Après des siècles de relative discrétion, cette égalité est en train de devenir la clé de la compréhension du monde. La formule qui décrypte tous les phénomènes de la nature.
Elle n'a pourtant rien de neuf. Esquissée pour la première fois en 1748 par un pasteur presbytérien britannique nommé Thomas Bayes, cette égalité - logiquement baptisée "formule de Bayes" - a trouvé sa forme définitive trente ans plus tard, sous la plume du mathématicien français Pierre-Simon Laplace. Depuis, elle est une formule classique des livres de maths et des formulaires destinés aux étudiants, à côté des produits remarquables, des équations du second degré et des expressions trigonométriques. Cette formule, dont la démonstration tient en quelques lignes à la portée d'un lycéen, appartient au corpus des probabilités, cette théorie mathématique des lois du hasard et de l'incertitude.
Elle s'écrit : P(A/B) = P (B/A) x P(A)/P(B).
Que signifie exactement cette poignée de termes kabbalistiques ? Et d'où tirent-ils le pouvoir de révolutionner tous les domaines des sciences ? La réponse à ces questions dépasse largement la mise au point d'un nouvel outil scientifique, aussi efficace soit-il. Celle qui fut longtemps la belle endormie des livres de probabilités se révèle en effet être le meilleur guide pour celui qui tente, vaille que vaille, d'en apprendre un peu plus sur le monde qui l'entoure en puisant dans ses expériences et ses observations de quoi forger ses repères, ses convictions, voire sa personnalité. Le secret de la formule de Bayes ? C'est la formule de l'apprentissage, la formule de l'attention, de la volonté de comprendre. Bref, la formule de la pensée en marche !
Plus prosaïquement, elle se lit comme suit : la probabilité de A sachant B est égale à la probabilité de B sachant A multipliée par la probabilité de A, le tout divisé par la probabilité de B. En clair, elle permet de calculer la façon dont évolue la probabilité d'un événement A, sachant qu'un autre événement B a eu lieu. Par exemple : quelle est la probabilité qu'il ait plu sachant que le trottoir est mouillé ? Eh bien, le révérend Bayes nous révèle qu'elle est égale à la probabilité que le trottoir soit mouillé sachant qu'il a plu, multipliée par la probabilité qu'il ait plu, divisée par la probabilité que le trottoir soit mouillé. Le calcul est simple. Et d'une efficacité redoutable. L'égalité calcule des probabilités subjectives qui dépendent des informations dont dispose celui qui calcule. En l'occurrence, les chances que j'accordais à la pluie ont augmenté depuis que j'ai constaté que le trottoir est mouillé... et la formule de Bayes calcule avec une précision incomparable de combien exactement.
Cette première lecture de la formule permet déjà de comprendre ce qu'elle peut apporter aux différents domaines scientifiques. Quelle est la probabilité qu'une certaine loi physique, géologique ou biologique soit vraie sachant les résultats de la nouvelle expérience qui vient d'êtne réalisée ? Quelle est la probabilité que tel mécanisme génétique, climatique ou écologique soit la cause de telle maladie, tornade ou extinction ? Ce sont bien à de tels types de question que s'attachent les chercheurs dans tous les domaines. La formule sert ainsi à quantifier la pertinence de ce que l'on croit savoir (A), à l'aune de ce que l'on apprend (B). Posant que la probabilité de A sachant B dépend de la probabilité de B sachant A, elle mime les allers-retours d'une pensée prête à remettre en cause ses fondements. Elle détricote les relations entre les causes et les effets dans la quête d'une vision plus solide.

METTRE LA FORMULE EN RÉSEAU

Voilà, au fond, la source du pouvoir de la formule de Bayes : c'est une machine à comprendre les phénomènes de la nature. Elle mesure, chiffres à l'appui, l'adéquation entre le corpus théorique et les nouvelles expériences et observations réalisées. Elle soupèse la force de chaque hypothèse, prête à remettre en question les a priori ou, au contraire, à les renforcer si les nouvelles informations vont dans leur sens. Elle renforce les liens existant entre les causes et les effets à mesure que les connaissances s'accumulent : elle actualise les savoirs. C'est un outil miraculeux qui automatise le décryptage du monde, formalisant mathématiquement les incessants mouvements de pensée entre les phénomènes observés et le savoir emmagasiné. La transposition, sous une forme mathématique, de la dynamique du progrès scientifique lui-même... À tel point que certains militent pour que toute publication scientifique soit désormais accompagnée d'un coefficient bayésien mesurant sa pertinence et son apport scientifique réel. La formule du révérend comme critère de vérité !
Question : pourquoi cette formule magique, connue depuis plus de deux siècles et apprise dans toutes les écoles, ne se révèle-t-elle que maintenant ? D'abord, parce que les scientifiques ont longtemps considéré qu'ils n'en avaient pas besoin. Ils disposent en effet d'un outil, la statistique, dont les algorithmes sont théoriquement capables de découvrir les causes de tout phénomène, sans modèle préalable ni a priori. La plus importante des lois statistiques affirme en effet qu'en effectuant des mesures suffisamment de fois, les causes cachées derrière les données se dévoilent d'elles-mêmes. "Mais pour cela, il faut disposer d'un très grand nombre d'observations, prévient Jean-Michel Marin. La statistique classique marche très mal quand il y a peu d'informations disponibles". Et échoue donc à décrypter ces phénomènes qui sont l'aboutissement d'un enchaînement de causes enchevêtrées et liées entre elles - des "paramètres corrélés". Prenons l'exemple d'un cas simplissime : un phénomène dépendant de n paramètres cachés ne pouvant prendre que deux valeurs (0 ou 1) demanderait quelque 2xn observations successives pour faire apparaître ses causes. En clair, si 100 gènes jouent un pôle dans le déclenchement d'un certain type de cancer, il faudrait dresser la carte génétique de 2¹⁰⁰ individus atteints de la maladie... c'est-a-dire de quelque mille milliards de milliards de milliards pour connaître l'origine du mal ! Infaisable.
Naissance d'une tornade ; accélération d'un vent stellaire ; origine génétique d'une maladie... pour découvrir les lois qui se cachent derrière ces phénomènes complexes, il faut comprendre le réseau de leurs causes, décrypter la toile complexe des multiples événements enchevêtrés. Face à la démission des statistiques classiques, les chercheurs n'avaient pas le choix : ils étaient obligés de construire des modèles théoriques en accordant leur confiance à certaines lois parmi la multitude de celles possibles. Et pour faire ce choix, pour déterminer parmi toutes les causes imaginables celles qui leur semblaient pertinentes, ils fonctionnaient peu ou prou à l'intuition : ils puisaient dans leurs connaissanses, espérant contrebalancer le déficit en données... Soit très exactement ce que fait la formule de Bayes, mais de manière rigoureuse et mathématique. Au lieu d'être sélectionnées intuitivement, les hypothèses a priori sont injectées dans la formule avec des valeurs de probabilité explicites. Et pour décrypter le réseau des causes des phénomènes, il suffit de mettre la formule elle-même en réseau... "Cette idée de réseau a été longue à émerger, précise Christian Robert, professeur au Centre de recherche en mathématiques de la décision de l'université Paris-Dauphine. C'est dans les années 1980 seulement que le mathématicien américain Judea Pearl a montré qu'en alignant des centaines de formules de Bayes, il devait être possible de rendre compte des multiples causes d'un phénomène complexe". Les ordinateurs capables de faire tourner les lourds programmes informatiques qui codent les réseaux bayésiens se sont multipliés dans la foulée. Le principe est le suivant : quand on ignore les causes d'un phénomène, on construit d'abord un modèle basé sur nos oonnaissances a priori de ce que pourraient être ses causes. Puis, on les relie entre elles, comme les nouds d'un réseau, en assignant à chacun des liens qui les joignent une probabilité a priori basée sur nos estimations ou sur celles d'experts. Autrement dit, chaque noud du réseau est relié à un autre via la formule de Bayes. Il n'y a plus ensuite qu'à alimenter ce modèle a priori, qui est un programme informatique, en données de l'observation pour qu'il recalcule les probabilités en appliquant la formule de Bayes entre les nouds du réseau. Ce processus est itéré pour chaque nouvelle donnée entrée dans le modèle et pour chaque lien entre les nouds, jusqu'à ce que l'ordinateur affiche un graphe du réseau où chaque lien entre deux causes est pondéré d'une valeur de probabilité bien précise. Et le tour est joué !

ADAPTÉE AU TROISIÈME MILLÉNAIRE

Remontant inlassablement des événements jusqu'à leurs causes, le réseau de formules de Bayes construit des modèles de phénomènes complexes, même lorsque les observations sont insuffisantes ou noyées dans du bruit parasite. "Leur grande force, c'est de faire la synthèse entre le dire des experts et les données brutes de l'observation quand celles-ci sont insuffisantes : la connaissance a priori comble la lacune des mesures", résume Pierre Bessière, chercheur au Laboratoire de psychologie de la perception et de l'action au Collège de France. Plus grande est l'ignorance, plus la formule montre de sa puissance... Elle est le moyen de faire de la science moderne quand la statistique classique a déjà répondu aux questions simples. Or, la marche du progrès est ainsi faite que le champ des inconnus ne cesse de s'étendre... Cette formule, qui est l'expression même de l'humilité scientifique, l'essence d'une science qui se reconnaît comme dépassée par son objet, est faite sur mesure puur le troisième millénaire. Qu'il s'agisse de génétique, de climatologie, d'astrophysique ou de biologie cellulaire... tous les problèmes qui occupent actuellement les chercheurs mettent en jeu des paramètres corrélés, des réseaux de causes entremêlés. Voilà pourquoi le raz de marée bayésien déferle aujourd'hui. Voilà pourquoi la formule de Bayes n'a commencé à envahir la science qu'il y a dix ans. Et voilà pourquoi aujourd'hui, elle dévoile les mécanismes qui régissent la naissance des étoiles ; évalue la hausse des températures pour les décennies à venir ; retrouve les causes génétiques des maladies ; retrace l'évolution des espèces....

LA FORMULE QUI DÉCRYPTE...
LES SECRETS DU VIVANT Le problème paraissait insurmontable : "Pour des raisons techniques, en microscopie, dès que l'on veut gagner en détails, on capte moins d'images par minute, explique Tingwei Quan, de l'université chinoise de Wuhan. Or, pour comprendre les mécanismes qui siègent au cour des cellules vivantes, il faut les voir évoluer presque en temps réel". Mais grâce aux réseaux bayésiens, Tingwei Quan a réussi à optimiser le signal perçu par un microscope et à augmenter la précision de son image, sans abaisser la vitesse de prise de vue. "La méthode bayésienne nous permet d'optimiser le signal du microscope car elle le fait ressortir plus efficacement du bruit de fond", précise-t-il. Une performance qui donne l'espoir de voir, enfin, les processus cellulaires à l'ouvre. Les chercheurs sont déjà en train de tester leur méthode sur les mitochondries, ces générateurs d'énergie cellulaires.	LES MYSTÈRES DE L'UNIVERS "Les simulations montraient que plus les grains de poussière interstellaire étaient chauds, plus ils étaient petits... Or, nous venons de prouver que c'est exactement l'inverse", s'exclame Rahul Shetty de l'université d'Heidelberg (Allemagne). En analysant les images du télescope Herschel à l'aide d'un programme bayésien, le chercheur a pu, pour la première fois, étudier la relation entre le rayonnement émis par les nuages de poussières qui peuplent l'espace, la densité des particules qui les composent et leur température. "Seule la statistique bayésienne permet de tenir compte rigoureusement des incertitudes de mesure, explique le chercheur. Et on le voit, cela fait une grande différence !" De quoi obliger les astronomes à revoir leurs modèles de formation stellaire, car ce sont ces nuages justement qui, en s'effondrant sur eux-mêmes, donnent naissance aux étoiles.
L'ÉVOLUTION DES ESPÈCES L'homme serait bel et bien responsable de l'extinction de l'ours des cavernes. "Non parce qu'il l'a trop chassé, précise Michael Knapp, de l'université d'Otago (Nouvelle-Zélande). Mais parce qu'il entrait en compétition avec lui pour l'occupation des grottes !" C'est l'analyse bayésienne de séquences d'ADN prélevées sur des fossiles d'ours, retraçant l'évolution de la population sur les 150.000 dernières années, qui a conduit à cette conclusion... dernier succès d'une méthode devenue un must pour étudier la génétique des populations. "Depuis que l'on peut récolter suffisamment d'ADN sur du matériel ancien, les statistiques bayésiennes ont contribué à démêler de nombreuses questions", confirme Michael Knapp. Et parfois, l'homme en sort blanchi ! Comme dans le cas du bouf musqué, dont le déclin - on vient de le découvrir - serait finalement lié au climat...	L'AVENIR DU CLIMAT Les climatologues ne se privent pas de le rappeler : faites tourner dix simulations numériques basées sur des modèles climatiques légèrement différents, et vous obtiendrez autant de futurs pour notre planète. Alors, lequel croire ? "C'est là que l'analyse bayésienne est essentielle", pointe Noel Cressie. Ce professeur de statistiques à l'université de l'Ohio (États-Unis) vient de développer une méthode qui détermine la probabilité associée à différents résultats de modèles et les combine pour parvenir à une projection qui fasse consensus. "Nous avons pu ainsi démontrer qu'il y a des conclusions partagées par divers scientifiques avec un certain degré de certitude, que nous pouvons quantifier". Appliquée pour l'instant au cas de l'Amérique du Nord, cette méthode a permis d'estimer que la probabilité que le réchauffement y dépasse les deux degrés d'ici à 2070 s'élève à... 97,5 %.
L'ORIGINE GÉNÉTIQUE DES MALADIES L'immense majorité des maladies ayant une composante génétique est due à des centaines de petits changements répartis le long de l'ADN... Mais sachant que d'un individu à l'autre il y a des millions de différences, comment trouver celles qui, ensemble, favorisent l'apparition du diabète par exemple ? Grâce aux statistiques bayésiennes, Robert Plenge, du Brigham Womens Hospital à Boston (États-Unis), a créé un modèle capable d'estimer enfin la part de ces associations dangereuses. "Ce qui est remarquable, s'enthousiasme le chercheur, c'est que notre modèle a pu être appliqué avec succès à quatre maladies communes : diabète, infarctus, maladie coliaque et arthrite rhumatoïde. Il fournit une approche claire pour découvrir les combinaisons susceptibles d'augmenter le risque de développer ces maladies et... beaucoup d'autres !"	LES CATASTROPHES NATURELLES Cartsen Riggelsen vient de gagner une course contre la montre. À l'aide des réseaux bayésiens, ce chercheur de l'université de Potsdam (Allemagne) a mis au point un programme informatique qui prédit l'arrivée et la puissance des tsunamis suffisamment tôt pour que l'on puisse évacuer les populations. "On ne peut pas attendre d'avoir toutes les preuves pour lanor l'alerte, milite-t-il. Les modèles classiques ne peuvent qu'affirmer si oui ou non il y aura un tsunami. Or, pour cela, il leur faut amasser de grandes quantités de données. Seules les statistiques bayésiennes permettent d'évaluer la probabilité de formation d'un tsunami au fur et à mesure que les données sismiques arrivent". Un avantage de taille quand on sait qu'entre les premiers signes de séisme et le déferlement du tsunami, il peut ne s'écouler que... cinq minutes !
LES PROPRIÉTÉS DE LA MATIÈRE "Grâce à la statistique bayésienne, nous explorons le paysage de l'après Higgs", scande Dirk Zerwas, membre de la collaboration Atlas, au Cern. Les physiciens du LHC se sont passés de la statistique bayésienne pour dévoiler la particule qui manquait au modèle standard de la physique des particules, le fameux boson de Higgs... mais ils misent sur cette méthode pour explorer les territoires inconnus qui s'étendent aujourd'hui devant eux. Qu'implique la découverte du Higgs pour les différentes théories de physique des particules ? Ses caractéristiques vont-elles défavoriser ou favoriser tel ou tel paramètre de la supersymétrie ? "La méthode bayésienne permet d'actualiser nos connaissances à la lumière d'une nouvelle observation. Elle est donc idéale pour répondre à ces questions, répond Dirk Zerwas. Certains membres de la collaboration ont déjà obtenu des premiers résultats"...	UN MOYEN EFFICACE DE FAIRE LE TRI DANS LES VÉRITÉS SCIENTIFIQUES Faut-il affubler chaque publication d'un coefficient bayésien qui donnerait la mesure de sa pertinence ? Certains chercheurs commencent à défendre ce point de vue. Aucune évaluation systématique n'a été entreprise, mais la petite formule a déjà commencé à élaguer la forêt des résultats scientifiques. Ainsi, en 2011, le statisticien néerlandais Eric-Jan Wagenmakers mettait à l'épreuve plus de 800 études en psychologie validées par des comités d'experts et publiées par de grands journaux scientifiques. Parmi elles, un rapport publié en mars 2011 par Daryl Bem, professeur de psychologie émérite à l'université Cornell (États-Unis) semblait montrer que l'homme pouvait prédire l'emplacement d'une image avant qu'elle n'apparaisse sur un écran, confirmant l'existence de la prescience ! Verdict du révérend : 70 % des phénomènes présentés comme prouvés sont moins de trois fois plus probables que l'absence de phénomène ! Autrement dit : le niveau de preuve apporté est anecdotique. Pis, il tombe dans ce cas à zéro. Cette bombe bayésienne pourrait bien faire des dégâts dans d'autres disciplines...

UNE RÉVOLUTION CONCEPTUELLE

Au final, ce n'est pas seulement une révolution scientifique qui est en marche : c'est aussi une révolution conceptuelle. Alors que la science a toujours prôné une vision objective du monde, cette formule réintègre une dimension subjective : elle ne nous parle pas du monde, mais de ce que nous en savons. En faisant appel aux connaissances préalables de l'observateur, détachées des faits eux-mêmes et qui ont un aspect... personnel, elle donne une image de la réalité extérieure tout en exprimant également la méconnaissance de l'observateur face à cette réalité. De cette petite formule ré-émerge ainsi une idée philosophique depuis longtemps débattue. "Elle nous oblige à penser que les théories et modèles scientifiques reflètent notre représentation de la réalité plutôt que la néalité elle-même. Cette dernière se chargeant de nous fournir des données qui garantissent que notre représentation n'est pas trop éloignée de la vérité", résume Christian Robert. L'effet est vertigineux : en décryptant le monde, elle nous parle de nous. En remontant à la cause des phénomènes, elle formalise notre pensée. Faut-il alors s'étonner de la voir mimer notre comportement, notre manière d'apprendre, le fonctionnement de nos neurones et même... commander l'acquisition, la représentation et la transmission des informations elles-mêmes, comme des équipes de chercheurs sont en train de l'établir (paragraphe suivant) ? Une chose est sûre : depuis le XXVIIIè siècle, la formule du révérend a fait du chemin... Pour révéler aujourd'hui ce qu'elle est : une formule magique.

M.F. et R.I. - SCIENCE & VIE > Novembre > 2012

Index des SCIENCES -> MATHÉMATIQUES

Elle est Aussi la Clé de la Pensée

Si elle décrypte le monde, la formule de Bayes décrit aussi les mécanismes du cerveau. Au point d'ouvrir sur une théorie de la pensée !

"Nous avons un petit Thomas Bayes dans le cerveau", aime à répéter Stanislas Dehaene. Ce professeur en psychologie expérimentale du Collège de France vient de consacrer un cours entier à "La révolution bayésienne en sciences cognitives". Et le sujet lui apparaît si important qu'il a finalement décidé d'étendre son exposé sur deux ans. Pour défendre son choix, il n'y va pas par quatre chemins : "Je parle de révolution, car il n'est pas courant de voir apparaître aussi soudainement un cadre théorique qui s'infiltre dans tous les plans d'une science, explique-t-il en guise d'introduction à ses étudiants. Nous étions nombreux à penser qu'il ne pouvait y avoir de théorie générale de la cognition, le cerveau étant le résultat du bricolage de l'évolution... mais cette idée est en loin d'être battue en brèche par la statistique bayésienne tant ses applications sont extraordinaires".
Non contente d'être en train de révolutionner les sciences de la nature, la formule de Bayes étendrait donc ses pouvoirs jusqu'au comportement humain et au fonctionnement de notre cerveau. De fait, psychologues et neurologues se rendent compte que le formalisme bayésien est un outil efficace pour décrire leur objet. Mieux, ils commencent à penser qu'il aurait modelé l'architecture même du cerveau à toutes les échelles, jusqu'à son niveau le plus élémentaire, le neurone lui-même. Au final, la petite formule pourrait rassembler les centaines de modèles disparates du fonctionnement cérébral et donner naissance à rien de moins que... la théorie du tout de la pensée. On comprend que le mot révolution vienne aux lèvres.

UN MÉCANISME SI... HUMAIN

Au premier abord, la formule du révérend semble pourtant loin des laboratoires de psychologie... Sauf que, comme le rappelle Stanislas Dehaene à ses étudiants : "La formule de Bayes, c'est des mathématiques, oui, mais des mathématiques qui nous parlent du raisonnement". Sous ses atours abstraits, elle reproduit un mécanisme typiquement humain : la tendance irrépressible à chercher les causes possibles des phénomènes observés, alors qu'il manque des informations ; cet algorithme qui ne cesse d'actualiser tout ce que l'on sait déjà (ou a priori) à la lumière de nouvelles informations est, dans les faits, une véritable machine à penser. De là à imaginer la réciproque, que cet algorithne puisse décrire la pensée, il n'y a qu'un pas que des spécialistes de la cognition sont en train de franchir allègrement.
"Au départ. les psychologues se sont penchés sur les probabilités bayésiennes pour traiter leurs résultats expérimentaux, relate Pierre Bessière, spécialiste de la statistique au Laboratoire de physiologie de la perception et de l'action au Collège de France. Mais rapidement, ils se sont aperçus qu'elle était très efficace pour décrire les phénomènes qu'ils observaient : en envisageant le cerveau comme un réseau bayésien, il semble que l'on puisse rendre compte de tous ses mécanismes". Ils ont donc transformé l'outil de calcul en modèle du comportement humain. Et les résultats n'ont pas tardé à pleuvoir. Qu'il s'agisse des mécanismes cognitifs dédiés à la reconnaissance des formes, au contrôle des mouvements, à la reconnaissance du langage ou à l'apprentissage... des dizaines et des dizaines d'expériences montrent que la pensée prend la forme de calculs statistiques régis par la formule du révérend. "On est en train de prouver que Bayes peut modéliser tous les aspects de la cognition", s'enthousiasme Chloé Farrer, psychologue à l'université de Toulouse. Ainsi, il y a un an, a-t-elle avec son équipe testé la capacité d'un groupe de volontaires à deviner à l'avance les gestes de personnes en train de manipuler une pièce rectangulaire sur une vidéo en fonction de leurs a priori. "Nous avons projeté aux participants beaucoup de films différents mettant majoritairement en scène une action, par exemple le soulèvement d'un objet, raconte la chercheuse. Puis, nous leur avons demandé de prédire la suite d'un film tronqué"... Finalement, Chloé Farrer a constaté que lorsque les données visuelles du film sont insuffisantes, les participants le complètent avec leurs a priori (ils opteront pour le "soulèvement" si la vidéo est trop courte pour trancher et s'ils ont vu beaucoup de films où la pièce était soulevée) ; sauf lorsqu'ils ont assez de données pour raisonner. Bref, les chercheurs ont démontré que notre raisonnement, quand nous manquons d'informations, suit un schéma totalement bayésien : il ne cesse de reconstruire l'image qu'il se fait du monde en fonction des dernières informations qu'il reçoit.
"Cela peut paraître trivial, tellement c'est évident, reconnaît la chercheuse. Mais avant cela, on n'avait jamais pu montrer clairement que le cerveau est capable de modéliser la probabilité d'une action future en confrontant sa mémoire aux informations sensorielles". Et ce don serait affûté dès notre plus jeune âge. Le cerveau serait capable dès 8 mois de construire des réseaux bayésiens, d'y intégrer les observations provenant des sens et de calculer, d'une manière exacte mathématiquement, la probabilité d'une cause. Ainsi, le psychologue Ernö Téglas, du centre de développement cognitif de l'université de Budapest, a montré en 2011 que des enfants d'un an parvenaient à calculer des statistiques et à les réactualiser en permanence afin de prédire la couleur d'une boule qui sortait d'une enceinte. Quant à la psychologue américaine Alison Gopnik, de l'université Berkeley, en Californie, elle a prouvé dès 2004 que les enfants n'usent que de la statistique bayésienne et semblent même incapables d'utiliser une autre méthode pour raisonner !

AU PLUS INTIME DU CERVEAU...

Le test consistait à montrer un singe en peluche à des enfants de 4 ans en leur précisant que certaines fleurs le faisaient éternuer. Dans une première étape, les enfants voyaient le singe éternuer lorsqu'on lui présentait une fleur jaune et une fleur rouge, puis une jaune et une violette ; en revanche, il n'éternuait pas lorsqu'il s'approchait de fleurs rouges et violettes. Interrogés, tous les enfants désignaient correctement la fleur jaune comme responsable de l'éternuement. "Alors que les probabilités classiques leur permettent seulement de dire que le singe éternue tout le temps devant une fleur jaune et la moitié du temps devant une fleur rouge ou violette, précise la chercheuse, seule la statistique bayésienne permet de remonter à la cause du phénomène et de trouver la bonne réponse". Il n'y a donc aucun doute : les statistiques classiques ont beau nous sembler plus "naturelles", les enfants recourent instinctivement aux probabilités bayésiennes. Mais ce n'est pas tout.
La chercheuse a organisé un second test avec d'autres enfants en leur montrant des singes qui éternuent chaque fois devant une fleur jaune et la moitié du temps devant une fleur violette ou rouge. "Si l'on raisonne suivant les lois probabilistes classiques, cette expérience est similaire à la première car les fréquences sont les mêmes : les singes éternuent tout te temps devant une fleur jaune et la moitié du temps devant une rouge ou violette, détaille Alison Gopnik. Par contre, dans ce cas, un raisonnement bayésien ne permet pas de conclure car tous ces événements sont indépendants". Les enfants n'ont donc d'autre choix que d'utiliser la méthode classique. Or... ils s'en sont remis au hasard ! Choisissant indifféremment la fleur jaune, rouge ou violette. "Ils n'ont pu mener de raisonnement pour remonter à une fleur responsable, ce qui prouve qu'ils sont incapables, même lorsque c'est la seule solution, de calculer selon les lois classiques, de type fréquentiste", conclut Alison Gopnik.
Le succès de la formule de Bayes en psychologie est tel que les chercheurs commencent à se demander si le cerveau ne serait pas, organiquement, un réseau bayésien. Si la formule, au lieu d'être un outil rêvé pour étudier le raisonnement humain, ne serait pas en définitive le cour même de sa mécanique. Bref, si la matière grise n'aurait pas tissé à toutes les échelles une toile de formules de Bayes. L'idée est audacieuse, mais recueille de plus en plus de suffrages. Car la formule de Bayes étant LA structure optimisée de raisonnement lorsque l'on dispose d'informations incomplètes ou inexactes, il se pourrait que l'évolution, dans son souci d'efficacité, l'ait justement privilégiée. C'est le principe d'optimalité ajoute Sophie Denève, neurologue à l'École normale supérieure de Paris. Le système nerveux évolue dans un monde complexe, reçoit des signaux brouillés par énormément de bruit, et doit donc approximer pour gérer les incertitudes du mieux qu'il peut. La sélection naturelle fait émerger les architectures biologiques les plus efficaces possibles". Or, le mécanisme de prédiction probabiliste bayésien a de multiples avantages : il permet de distinguer, parmi une foule d'informations sensorielles, celles qui seront pertinentes ; et ses prédictions peuvent suffire à déclencher une réaction sans même qu'une information sensorielle ait encore été captée... "Appliquant ce système prédictif, le cerveau améliore le traitement des messages provenant des sens en sélectionnant les données, ajoute Stanislas Dehaene. En comparant sans cesse les informations sensorielles avec ses a priori, il ne transmet que les informations non anticipées, des sortes de messages d'erreur et non la totalité du flux". Les roboticiens l'ont d'ailleurs compris depuis les années 1980 : le meilleur moyen de concevoir un robot intelligent, capable d'interagir finement avec son environnement, est de donner aux programmes informatiques qui le commandent une architecture bayésienne.

LA ROBOTIQUE SAUVÉE PAR LA FORMULE DU RÉVÉREND
"Les ordinateurs savent battre les humains aux échecs, mais quand il s'agit de bouger les pièces sur l'échiquier, ils ne peuvent rivaliser avec un enfant de 5 ans !" Pierre Bessière, chercheur au Collège de France, rappelle le grand problème des robots : leur difficulté à négocier physiquement avec le monde réel. Grâce à la formule de Bayes, ils sont pourtant en train de vaincre ce blocage, car elle a un avantage de taille : quand les programmes classiques ne peuvent espérer reconnaître un objet que s'ils en reçoivent un signal clair via leurs capteurs - ils ne font que dire si oui, ou non, un signal détecté correspond à un objet répertorié dans leur base de données -, les automates bayésiens, eux, sont capables d'exploiter la moindre bribe d'information envoyée par leurs "sens", de la comparer à tous les éléments de leur base de données et d'affubler chaque association d'une probabilité pour agir en fonction de la plus probable. De quoi éviter des obstacles imprévus, reconnaître des objets lorsque la lumière est faible, ou même sentir des matières dont les caractéristiques n'avaient pas été intégrées dans leur base de données. En exploitant cette architecture, une équipe californienne vient ainsi de mettre au point un doigt tactile plus sensible que celui de l'homme.

L'ESPOIR D'UN CORPUS UNIQUE

De nombreux chercheurs ont donc mencé la traque : à coups de stimulations sensorielles et d'imageries à résonance magnétique (IRM), ils cherchent dans le maelström du cerveau les traces d'interactions de type bayésien. Et commencent à en voir les signes. Ainsi, en 2011, une équipe de la Carnegie Mellon University (États-Unis), a observé que des neurones envoient des décharges avant même la perception, juste parce que le cerveau est en train de prédire qu'il va se passer quelque chose. Ils ont vu, au plus intime du cerveau, des sages nerveux transportant, non pas des informations provenant des sens, mais des calculs de probabilités. Ils ont donc vu, des neurones en train de faire des prédictions suivant les lois de la statistique bayésienne. Et ce n'est pas tout ! Les équipes d'Alexandre Pouget, neurologue à l'université de Rochester, aux États-Unis, de Joshua Tenenbaum, du MIT, et de Karl Friston, de la London's Global University, ont montré que le cortex semblait carrément organisé pour coder des distributions de probabilités : d'après leurs mesures, les assemblées de neurones des couches cérébrales périphériques effectuent des calculs probabilistes à partir des données stockées et des informations provenant de l'extérieur, puis transmettent le résultat aux couches supérieures. Ces chercheurs pensent même avoir identifié l'unité fondamentale de calcul bayésien du cerveau : il s'agirait de ce qu'ils appellent des "circuits canoniques", des micro-architectures de neurones qui se répètent de façon identique dans tout le cortex. De couche en couche, le cerveau serait une sorte de pyramide de réseaux bayésiens dont le sommet serait, la pensée elle-même ! Tout ce que nous touchons, entendons, sentons serait transformé en temps réel par la matière grise en statistiques bayésiennes. Le monde serait une collection de probabilités continuellement mise à jour au fil de nos perceptions, une gigantesque quantité d'informations régies par les lois d'un révérend du XVIIIè siècle !
Cette vision révolutionnaire est même partagée par certains... physiciens ! À force de vouloir caractériser la matière dans sa plus stricte intimité, ils ont eux aussi trouvé sur leur chemin la petite égalité du révérend anglais... Et comme les spécialistes du cerveau, ils se demandent si elle ne serait pas carrément la pièce qui leur manquait pour mettre du sens derrière l'étrange comportement de la matière lorsqu'elle est observée dans ses échelles les plus intimes. Ce ne serait pas là le moindre de ses vertiges : la formule de Bayes régissant toute information, toute connaissance serait la clé pour comprendre la mécanique quantique... et la sortirait même du champ de la physique pour l'intéger au corpus des sciences de la cognition.

LA PHYSIQUE QUANTIQUE REMISE SUR LES BONS RAILS
"La formule de Bayes est la loi qui régit toute connaissance, toute information". Ce n'est pas un neurologue qui scande cette affirmation mais un chercheur du Perimeter Institute for Theorical Physics, au Canada : Christopher Fuchs, spécialiste de mécanique quantique ! La coïncidence est saisissante. Comme leurs confrères des sciences de la cognition, certains physiciens crient à la révolution. Ils pensent avoir trouvé le moyen de remédier à tous les maux de leur discipline en identifiant le même remède : la statistique bayésienne.
Voilà près d'un siècle, à force de s'approcher au plus près de l'essence de la matière, les physiciens ont abouti aux lois de la physique quantique. Et devant leur efficacité, ils ont dû admettre l'inadmissible : la lumière peut prendre à la fois les atours d'une onde et d'une particule ; un électron peut être simultanément à deux endroits ; l'état d'une particule ne peut être décrit que sous la forme de probabilités... Bref, en voulant caractériser exactement le comportement des électrons, des photons et autres particules, la physique a accouché d'un brouillard probabiliste. Et si la majorité des physiciens a pris le parti d'ignorer cette "maladie" fondamentale, certains proposent une solution radicale : considérer que la mécanique quantique ne parle pas de la matière elle-même, mais seulement... de ce que l'on en sait. Selon Christopher Fuchs, mais aussi John Baez de l'université de Californie, ou Carlton Caves de l'université du Nouveau-Mexique, la physique se serait égarée. Elle aurait commencé, sans que personne s'en aperçoive, à décrire rien d'autre que les états d'information - et donc d'ignorance - de l'observateur. Le comportement des particules n'aurait rien d'extravagant, il serait simplement le reflet de notre incapacité à accéder à la totalité des informations (nous disons qu'une particule est ici à 36 % et là-bas à 64 %, simplement parce que nous manquons d'informations sur sa position réelle). Soit du pur bayésianisme !
Et justement, pointant, équation après équation, les ressemblances troublantes entre la mécanique quantique et la statistique bayésienne, Christopher Fuchs est parvenu, pour partie, à démontrer un lien entre les deux théories ! Ainsi, les lois fondamentales de la matière découleraient naturellement de la statistique bayésienne. La petite formule du XVIIIè siècle, via la mécanique quantique, régirait non pas la matière, mais les informations : des sortes de médiateurs entre le matériel et l'abstrait, entre l'objet et l'idée. Tout ce que nous croyons réel ne serait qu'un magma de 0 et de 1 commandés par la statistique de Bayes ! L'idée, qui prend à revers les principes de réalisme et d'objectivité de la physique traditionnelle, donne le vertige. Elle révèle que notre compréhension de la matière qui nous entoure se fonde, in fine, sur du virtuel et du subjectif. La formule magique de Bayes a encore frappé.

Alors que les chercheurs sont seulement en train de réaliser la révolution en cours, la première ébauche de théorie bayésienne de la cognition donne déjà des perspectives d'applications. "On espère en déduire des pistes pour comprendre certaines maladies mentales", révèle Chloé Farrer. Disposer d'une description globale des mécanismes qui régissent le cerveau pour mieux en comprendre ses dysfonctionnements, voilà l'idée. La chercheuse s'est mise au travail. Elle est en train d'étudier le cas de patients atteints de schizophrénie. "Les résultats préliminaires montrent que les personnes atteintes de cette maladie accordent beaucoup d'importance aux informations sensorielles, détaille-t-elle. Les allers-retours entre le savoir acquis et l'expérience ne sont pas suffisants pour remonter aux causes des événements"... Surtout, l'espoir de voir réunis tous les mécanismes du cerveau, tous les phénomènes comportementaux en un corpus unique donne des ailes aux chercheurs. "On envisage enfin de pouvoir répondre aux questions les plus pressantes en sciences cognitives, s'enflamme Stanislas Dehaene. Et en particulier, de comprendre comment le cerveau procède pour élaborer des règles abstraites de très haut niveau qui lui sont propres, comme le langage par exemple". La petite formule de Bayes a fait du chemin depuis le poussiéreux chapitre de statistique où elle avait été reléguée. En dévoilant la clé de voûte du fonctionnement de notre pensée, voilà qu'elle promet rien moins que de révéler le secret qui fonde l'humanité. Une formule décidément magique...

M.F. et R.I. - SCIENCE & VIE > Novembre > 2012

Index des SCIENCES -> MATHÉMATIQUES