Si tu pensais que la course à l’IA était uniquement réservée aux géants comme OpenAI, Google ou Meta, détrompe-toi : DeepSeek, un labo chinois encore peu connu du grand public vient de secouer tout ça avec son modèle R1 présenté comme un alternative à o1.
Ils jouent la carte de l’open-source à fond et promettent des performances qui rivalisent avec les plus grands, pour un coût ridicule
Mais, est-ce vraiment le coup de maître qu’ils prétendent, ou juste du bluff ?
DeepSeek-R1 : le challenger qui ose défier OpenAI
DeepSeek fait fort avec son modèle R1. En théorie, c’est impressionnant.
Selon la firme chinoise, le modèle performe remarquablement bien sur les benchmarks de raisonnement comme AIME, GPQA et MATH-500 (si ces noms ne te disent rien, c’est normal, on parle de tests pointus pour évaluer les capacités de raisonnement).
En gros, R1 serait capable de résoudre des problèmes complexes et aurait même des versions allégées comme DeepSeek-R1-Distill-Qwen-32B qui peuvent même être exécutées localement.
Traduction : pas besoin d’un data center pour le faire fonctionner, ton petit serveur suffira. Plutôt cool, non ?
Mais attention, les benchmarks, c’est souvent de la poudre aux yeux. Ils montrent un résultat précis dans des conditions idéales, mais dans la vraie vie, les performances peuvent être… disons, moins impressionnantes.
Open source comme game changing
Là où DeepSeek sort le grand jeu, c’est en jouant la carte 100 % open source
R1 est sous licence MIT, gratuit, accessible à tous, et surtout accompagné d’un « mode d’emploi » qui détaille tout leur processus d’entraînement.
Mais (parce qu’il y a toujours un « mais »), personnellement, je pense que lâcher un modèle aussi avancé en mode permissive, c’est jouer avec le feu.
Pourquoi ? Parce que n’importe qui – y compris des entreprises peu scrupuleuses– peut se l’approprier, le distiller et l’utiliser à des fins pas franchement recommandables. Et là, DeepSeek n’a aucun contrôle.
Une méthode d’entraînement à bas coût (mais efficace)
Au lieu de dépenser des milliards comme OpenAI , Deepseek s’est appuyé sur son modèle de base, DeepSeek-V3, et l’a entraîné avec des techniques de renforcement par apprentissage (RL pour les intimes).
En gros, ils ont appris à leur IA à raisonner plutôt que de lui filer bêtement des tonnes de données annotées. Leur méthode est simple mais efficace, avec un coût d’entraînement maîtrisé (5,6 millions de dollars, soit une broutille comparée aux milliards dépensés par OpenAI).
Et pour le coup, je dois avouer que c’est malin car R1 coûte 96 % moins cher à faire tourner que o1. Oui, tu as bien lu, 96 %.
Et on ne va pas se mentir, c’est une bouffée d’air frais pour les petites entreprises et les développeurs qui ne peuvent pas s’offrir le plan Pro à 200 dollars par mois pour utiliser o1 en illimité, qui soit dit en passant n’est pas rentable selon Sam Altman.
Un pied de nez aux géants de l’IA ?
Ce qui me plaît dans tout ça, c’est que DeepSeek bouscule un peu les règles du jeu. En rendant leur modèle de raisonnement open source, il sème un chaos intéressant dans le paysage de l’IA.
Est-ce que ça suffira pour détrôner OpenAI ou Google avec son Gemini 2.0 Flash Thinking ? Clairement pas.
Mais ils ouvrent une brèche dans laquelle de nombreux acteurs vont s’engouffrer.
- Si tu es développeur ou gère une petite entreprise, tu peux intégrer un modèle de raisonnement sans casser ta tirelire.
- Cela dit, il y a quelques limites qui peuvent freiner son utilisation en entreprise.
- Pour le moment, on ne peut pas s’en servir pour concevoir des agents IA et piloter des applications, interagir sur des scénarios complexes ou générer des JSON sans erreur.
- Sans oublier l’épineuse question des sujets sensibles. Tiananmen ? Taïwan ? DeepSeek R1 te fera un “no comment” direct. Rien de surprenant venant d’un modèle développé sous réglementation chinoise.
Personnellement, je pense qu’on est encore loin d’un modèle parfait. Mais une chose est sûre : ce genre d’initiative est une excellente nouvelle pour l’innovation, et surtout pour nos portefeuilles.
A toi de jouer
Et toi, tu en penses quoi ? Est-ce que DeepSeek-R1 te paraît être une vraie alternative à o1 d’OpenAI, ou juste un feu de paille ? Partage cet article sur tes réseaux sociaux préférés et tague un pote pour débattre.