La technique en question, connue sous le nom de « distillation », est pointée du doigt comme étant au cœur du litige. OpenAI affirme que DeepSeek aurait exploité les résultats générés par ses modèles les plus avancés pour entraîner des modèles plus petits et plus efficaces. Cette pratique, bien qu’elle ne soit pas intrinsèquement illégale, est explicitement interdite dans les conditions d’utilisation d’OpenAI, surtout lorsqu’elle est utilisée pour développer des modèles concurrents. Les preuves présentées par OpenAI incluent des captures d’écran supposées qui indiqueraient des réponses de DeepSeek excessivement similaires à celles de ChatGPT, le modèle linguistique d’OpenAI.
Microsoft, partenaire d’OpenAI et fournisseur d’infrastructure de serveurs, s’est également exprimé, affirmant avoir détecté des mouvements de données suspects en provenance de Chine, avec une extraction massive de l’API d’OpenAI. L’entreprise américaine de technologie soupçonne que ces comptes soient liés à DeepSeek. Curieusement, DeepSeek s’est distinguée en développant des modèles d’IA avec une efficacité remarquablement supérieure, atteignant des performances 10 fois supérieures à celles d’autres systèmes, en partie en évitant l’utilisation de la plateforme CUDA de Nvidia. Au lieu de cela, l’entreprise chinoise aurait utilisé l’exécution parallèle de threads de Nvidia directement, une approche complexe et inhabituelle.
Au milieu de ce tourbillon, un nouvel acteur chinois émerge : Alibaba, qui a lancé le modèle Quen 2.5 Max. Bien qu’il ne s’agisse pas d’un modèle de raisonnement, le Quen 2.5 Max se distingue en surpassant des modèles comme DeepSeek, Claude et GPT-4o sur des benchmarks spécifiques. De plus, un autre modèle chinois, le Kim 1.5, a également été lancé, avec des affirmations selon lesquelles il surpasse le GPT-4o d’OpenAI lui-même sur certains aspects. Ce scénario souligne une compétition acharnée entre la Chine et les États-Unis dans le développement de l’IA, tandis que l’Europe semble se concentrer sur d’autres innovations technologiques.
Malgré les accusations et la controverse, DeepSeek a également lancé des modèles de la série Jan, destinés à la génération d’images par diffusion. Bien que la qualité ne se compare pas encore à celle de modèles comme Stable Diffusion ou Midjourney, l’initiative représente un autre modèle open source disponible pour un usage commercial. Ce mouvement renforce la tendance de croissance et d’importance des modèles d’IA open source, qui offrent des alternatives et démocratisent l’accès à la technologie.