DeepSeek dévoile son IA génératrice d’images open source surpassant DALL-E-3 d’OpenAI

Tout cela pour une fraction des coûts de développement des modèles concurrents.

deepseek ia generatrice images janus pro couv
| DeepSeek/Trust My Science (Edit)
⇧ [VIDÉO]   Vous pourriez aussi aimer ce contenu partenaire

La start-up chinoise DeepSeek dévoile sa nouvelle IA génératrice d’images Janus-Pro, dont les performances surpasseraient celles des meilleurs modèles concurrents, tels que DALL-E-3 d’OpenAI. Entièrement open source, le modèle impressionne par ses performances, obtenues qui plus est pour une fraction des coûts de développement des grands modèles américains, tout en étant moins énergivore. L’entreprise pourrait potentiellement renverser le monopole de l’industrie de l’IA après seulement deux ans d’activité.

Créé en 2023 par une unité de recherche en IA d’un fonds spéculatif chinois, DeepSeek développe de grands modèles de langage dans le but d’atteindre l’IA générale (IAG). La semaine dernière, la start-up a fait parler d’elle avec le lancement de son modèle ultra-performant R1 et de son chatbot. D’après les utilisateurs, les performances et la capacité de raisonnement du modèle sont comparables à ceux de o1, le dernier modèle public d’OpenAI.

Les performances de DeepSeek-R1 ont même été saluées par Sam Altman, le PDG d’OpenAI. « R1 de DeepSeek est un modèle impressionnant, notamment par rapport à ce qu’ils sont capables de fournir pour le prix », a-t-il écrit sur X. « Nous allons évidemment proposer des modèles bien meilleurs et c’est vraiment revigorant d’avoir un nouveau concurrent ! Nous allons sortir quelques nouveautés… J’ai hâte de vous présenter l’IAG et d’aller au-delà ».

Entièrement open source ou sous licence MIT (accordant un droit illimité d’utilisation et de modification), le chatbot de DeepSeek (incorporant notamment R1 et la recherche web) est devenu l’application gratuite la plus téléchargée dans l’App Store peu après sa sortie, surpassant de loin ChatGPT. Toutefois, l’entreprise a annoncé peu de temps après qu’elle limitait les inscriptions en raison d’une cyberattaque à grande échelle. Néanmoins, les utilisateurs déjà inscrits pouvaient toujours se connecter.

Cet engouement a provoqué l’effondrement des actions des acteurs américains de l’industrie technologique, les investisseurs craignant que les modèles low-cost et open source de DeepSeek puissent renverser leur monopole. Nvidia, le principal fournisseur de processeurs d’IA, a par exemple perdu 589 milliards de dollars de valeur boursière en seulement une journée, soit la plus grande perte de valeur en une journée aux États-Unis (l’entreprise reste toutefois valorisée à plusieurs milliers de milliards de dollars).

Quelques jours seulement après le lancement de R1, DeepSeek dévoile son nouveau modèle de génération d’images, Janus-Po, dont les performances surpasseraient celles de DALL-E 3 d’OpenAI. À l’instar de R1, Janus-Pro est également gratuit et sous licence MIT. Il est disponible via des plateformes de développement comme GitHub et Hugging Face.

« Sa combinaison de capacités avancées, d’accessibilité open source et de performances impressionnantes la positionne comme un acteur important dans l’évolution de la technologie de l’intelligence artificielle », a écrit l’entreprise sur Hugging Face.

Des performances impressionnantes à moindre coût

Les modèles de DeepSeek entrent en grande pompe dans l’écosystème de l’IA alors que les États-Unis ont limité le nombre de puces d’IA que la Chine peut importer. Pour contourner cet obstacle, les ingénieurs de l’entreprise ont développé des algorithmes plus performants et beaucoup moins gourmands en énergie que ceux de ses concurrents. Autrement dit, ils utilisent moins de puissance de calcul que les algorithmes classiques, ce qui les rend plus faciles à exécuter.

Le générateur d’images est disponible en plusieurs tailles, allant de 1 à 7 milliards de paramètres. Ces derniers correspondent à la capacité d’un modèle à résoudre des problèmes, ceux disposant de plus de paramètres étant généralement les plus performants. À l’instar de tous les modèles de génération d’images, il génère des réponses aux invites textuelles des utilisateurs.

Cependant, la gamme Janus-Pro a été améliorée à l’aide de nouveaux processus d’entraînement et de données de meilleure qualité. En effet, DeepSeek a entraîné le modèle avec 72 millions d’images de haute qualité, tout en équilibrant l’ensemble avec des données réelles. Cela permettrait de générer des images plus réalistes et visuellement plus abouties que celles des modèles concurrents.

Bien que les utilisateurs n’aient pas accès à ces données d’entraînement, ils peuvent consulter et modifier les algorithmes. « C’est vraiment incroyable… Ce modèle génère des images et surpasse DALL-E 3 d’OpenAI et Stable Diffusion (de Stability AI) sur plusieurs tests de performance », s’est extasié l’entrepreneur technologique Brian Roemmele dans un article de The Independent.

DeepSeek marque également une avancée majeure en matière de compétitivité : ses modèles ont coûté moins de 6 millions de dollars à développer, soit moins de 10 % du coût de Llama de Meta et des autres modèles rivaux. Ces annonces soulèvent des questions quant à la nécessité des cycles de financement astronomiques du secteur et risquent de continuer à décourager les investisseurs.

Laisser un commentaire

Vous voulez éliminer les publicités tout en continuant de nous soutenir ?


Il suffit de s'abonner !


JE M'ABONNE