La course à l’intelligence artificielle s’intensifie, opposant les États-Unis et la Chine, tandis que l’Union européenne tente de se faire une place avec son ambitieux projet OpenEuroLLM. Alors qu’OpenAI accélère son développement sous la pression de la Chine, cette dernière riposte avec force. Après le lancement remarqué de DeepSeek-R1, Alibaba présente une intelligence artificielle d’un genre nouveau, capable d’interpréter les émotions humaines. Plutôt que de se limiter aux prouesses textuelles, de vision simple ou de programmation, le géant chinois a relevé un défi d’une autre nature : doter l’IA d’une intelligence émotionnelle avancée. C’est ainsi qu’a été dévoilé R1-Omni, version optimisée d’HumanOmni, un modèle open source conçu par son laboratoire Tongyi. Son atout principal : une capacité inédite à analyser les émotions humaines à partir de données vidéo.

Les premiers mois de l’année ont marqué une montée en puissance de la Chine dans le domaine de l’intelligence artificielle. Après le succès de DeepSeek et l’annonce de Qwen 2.5 – un modèle de langage multimodal décliné en plusieurs versions, Alibaba revendique désormais des technologies capables de rivaliser avec les références du secteur, telles que GPT-4o d’OpenAI et Claude 3.7 d’Anthropic. Cependant, avec R1-Omni, l’entreprise ne se contente plus de rivaliser ; elle cherche à fortement améliorer l’interaction personne-machine.

Là où les générations précédentes d’intelligence artificielle se limitaient à la reconnaissance faciale ou à l’identification d’objets, R1-Omni adopte une approche bien plus approfondie. Son analyse vidéo ne repose pas uniquement sur les expressions du visage, mais intègre aussi une multitude d’indices : le langage corporel, l’environnement immédiat et même la tenue vestimentaire d’un individu. Cela lui permet d’affiner son interprétation des émotions.

Des démonstrations réalisées par les chercheurs du Tongyi Lab ont mis en avant cette avancée technologique. « R1-Omni déduit l’état émotionnel d’une personne tout en offrant des descriptions détaillées de ses vêtements et de son environnement », rapporte le média Fortune.

Si l’intelligence émotionnelle artificielle est déjà utilisée dans certains secteurs – notamment pour aider les chatbots à détecter la frustration des utilisateurs –, elle reste largement perfectible. Alibaba entend combler ces lacunes et offrir une finesse d’analyse inédite avec R1-Omni.

Un positionnement stratégique face à OpenAI

L’annonce du lancement de R1-Omni intervient alors qu’OpenAI vient de lancer GPT-4.5, un modèle aux capacités accrues en matière de compréhension du langage naturel. Cependant, sa limite d’utilisation relativement basse, même pour les utilisateurs possédant l’abonnement de base, pourrait limiter son adoption à court terme.

Alibaba fait un pari différent. R1-Omni est non seulement un modèle open source, mais il est aussi entièrement gratuit (du moins pour le moment). Une stratégie qui vise à encourager l’innovation collaborative et à asseoir rapidement sa présence sur le marché.

Eddie Wu, directeur général d’Alibaba, a affirmé en février que l’intelligence artificielle générale était désormais la priorité du groupe. Pour lui, l’intelligence émotionnelle constitue une étape clé vers cet objectif. Si R1-Omni parvient à s’imposer, il pourrait définitivement changer la manière dont les humains interagissent avec les machines, estompant encore un peu la barrière émotionnelle entre l’homme et la machine.