Quand l’IA apprend à bluffer : jeux de hasard et intelligence artificielle

⇧ [VIDÉO]   Vous pourriez aussi aimer ce contenu partenaire

Les jeux de hasard ont longtemps été le terrain de l’intuition, du flair, et du bluff humain. Mais aujourd’hui, une nouvelle joueuse entre en scène. Elle n’a pas de visage, pas d’émotion… et pourtant, elle sait mentir. Mieux encore, elle sait bluffer. Depuis quelques années, l’intelligence artificielle s’aventure dans l’univers d’incertitude et de stratégie masquée et elle s’en sort étonnamment bien.

Aujourd’hui, dans les cercles du poker, certains joueurs ne craignent plus seulement leurs adversaires mais les algorithmes qui les observent.

Jouer à cache-cache avec l’incertitude

Tout a changé en 2017, lorsque une IA canadienne DeepStack, a battu plusieurs joueurs professionnels de poker en tête-à-tête. Une première. Jusque-là, les intelligences artificielles brillaient surtout dans les jeux dits déterministes (comme les échecs ) où toute l’information est visible. Mais le poker est tout l’inverse : cartes cachées, intentions secrètes, décisions prises dans l’incertitude totale.

Et c’est justement là que réside le défi. Pour rivaliser, DeepStack a dû apprendre à raisonner sans tout savoir, à évaluer des probabilités, à anticiper les réactions et à mentir sans sourciller.

« L’incertitude est au cœur du poker, explique Michael Bowling, chercheur à l’Université de l’Alberta et co-créateur de DeepStack. Il fallait que l’IA sache improviser, simuler des scénarios futurs, et parfois bluffer pour désorienter l’adversaire. »

Pluribus, l’IA qui bluffe mieux que les pros

En 2019, une autre IA Pluribus est allée encore plus loin. Développée par Facebook AI et Carnegie Mellon, elle a affronté plusieurs joueurs professionnels en même temps à une table de poker à six. C’était une performance si bluffante (c’est le cas de le dire) que les champions eux-mêmes ont reconnu leur impuissance.

Mais ce qui a le plus surpris, c’est son style de jeu imprévisible : mises agressives à contretemps, décisions parfois illogiques mais redoutablement efficaces.

En fait, cette IA a été entraînée à ne pas être lisible. Elle mélange des stratégies optimales (le fameux Game Theory Optimal) avec des comportements aléatoires, pour que ses adversaires ne puissent jamais deviner ses intentions. Et ça fonctionne.

Bluff algorithmique

Ce qu’il faut comprendre, c’est que le bluff, n’est pas une ruse pour une IA. C’est une stratégie codée. Ces systèmes apprennent par essais-erreurs (reinforcement learning) et affinent leurs choix en simulant des milliers (voire des millions) de parties. Peu à peu, ils construisent un « cerveau du jeu » capable d’agir avec précision.

Et cela va bien au-delà du poker. Ces techniques sont aujourd’hui testées dans des domaines aussi variés que la cybersécurité, la finance, ou encore la négociation automatisée. Partout où il faut prendre une décision sans tout savoir, ces IA trouvent leur place.

L’intuition, ce n’est plus que pour les humains ?

Alors, faut-il s’inquiéter ? Pas forcément. Car même si les machines savent désormais tromper, elles ne ressentent rien. Elles n’ont ni peur, ni envie de gagner, ni satisfaction à bluffer. Elles appliquent des modèles. Et c’est justement cette froideur qui les rend efficaces mais aussi prévisibles à long terme, disent certains experts.

Dans les jeux de hasard, l’IA ne se contente plus de jouer. Elle observe, apprend, et parfois, elle devance l’humain. Le bluff n’est plus un art réservé aux joueurs charismatiques. C’est aussi un algorithme, bien rangé dans une ligne de code.

l’IA bluffe, mais ce n’est pas du cinéma

Des IA comme DeepStack et Pluribus ont montré que l’on peut enseigner à une machine à naviguer dans l’incertitude, à mentir stratégiquement, et à battre les meilleurs joueurs du monde. Non pas en trichant, mais en comprenant les mécanismes du hasard et de la prise de risque.

Et si elles bluffent si bien, c’est peut-être parce qu’elles n’ont pas besoin d’y croire.

Laisser un commentaire