Chatgpt Maker soupçonne que les modèles de l'IA profonde de terre chinoise pas cher ont été construits à l'aide de données Openai - et l'ironie n'est pas perdue sur Internet

Auteur: Patrick Feb 22,2025

Openai soupçonne que Deepseek, un modèle d'IA chinois nettement moins cher que les homologues occidentaux, peut avoir été formé à l'aide des données d'Openai. Cette révélation, associée à la montée rapide de la popularité de Deepseek, a déclenché une forte baisse des cours des actions des grandes sociétés d'IA, notamment NVIDIA, qui a subi sa plus grande perte d'une journée de l'histoire.

Le coût relativement faible du modèle R1 de Deepseek - estimé à 6 millions de dollars - a comparu aux milliards investis par les géants de la technologie américaine, a soulevé des inquiétudes quant à la viabilité de leurs stratégies actuelles de développement d'IA. Deepseek affirme que son modèle exploite l'open source Deepseek-V3, nécessitant moins de pouvoir de calcul que les alternatives occidentales.

OpenAI et Microsoft étudient si Deepseek a violé les conditions d'utilisation d'Openai en utilisant son API ou en utilisant la «distillation» - une technique pour extraire des données de modèles plus grands - pour former le sien. OpenAI a confirmé sa conscience de tels efforts des chinois et d'autres sociétés pour reproduire les principaux modèles d'IA américains et a déclaré son engagement à protéger sa propriété intellectuelle.

David Sacks, le tsar de l'IA du président Trump, a suggéré que des preuves indiquent que Deepseek par les modèles OpenAI par Deepseek par la distillation. Il prévoit que les contre-mesures de la direction des sociétés d'IA pour empêcher cette pratique.

La situation met en évidence une ironie importante: Openai, lui-même accusé d'utiliser le contenu Internet protégé par le droit d'auteur pour former Chatgpt, accuse désormais Deepceek d'une violation similaire. Cette hypocrisie a été largement notée sur les réseaux sociaux. L'affirmation précédente d'Openai selon laquelle la création de modèles d'IA comme Chatgpt sans matériel protégé par le droit d'auteur est "impossible" alimente le débat.

Cette controverse souligne les batailles juridiques en cours entourant l'utilisation du matériel protégé par le droit d'auteur dans la formation des modèles d'IA. Les poursuites judiciaires du New York Times et 17 auteurs, dont George R.R. Martin, contre Openai et Microsoft mettent en évidence la nature controversée des revendications "d'utilisation équitable" dans le domaine rapide de l'IA générative. En outre, un précédent Office des droits d'auteur américain au bureau de droit de droit d'auteur américain que l'art généré par l'AI ne peut pas être protégé par le droit d'auteur ajoute une autre couche de complexité au paysage juridique.

Deepseek est accusé d'utiliser le modèle d'Openai pour former son concurrent en utilisant la distillation. Crédit d'image: Andrey Rudakov/Bloomberg via Getty Images.