El fabricante de chatgpt sospecha que se construyeron los modelos de AI profundos y baratos de China utilizando datos de OpenAI, y la ironía no se pierde en Internet

Autor: Patrick Feb 22,2025

Operai sospecha que Deepseek, un modelo de IA chino significativamente más barato que las contrapartes occidentales, puede haber sido entrenado utilizando los datos de OpenAI. Esta revelación, junto con el rápido aumento de la popularidad de Deepseek, provocó una fuerte disminución en los precios de las acciones de las principales compañías de inteligencia artificial, especialmente Nvidia, que experimentó su mayor pérdida de un día en la historia.

El costo relativamente bajo del modelo R1 de Deepseek, estimado en $ 6 millones, comparado con los miles de millones invertidos por los gigantes tecnológicos estadounidenses, ha generado preocupaciones sobre la viabilidad de sus estrategias de desarrollo de IA actuales. Deepseek afirma que su modelo aprovecha el Deepseek-V3 de código abierto, que requiere menos potencia informática que las alternativas occidentales.

Operai y Microsoft están investigando si Deepseek violó los términos de servicio de OpenAi utilizando su API o empleando "destilación", una técnica para extraer datos de modelos más grandes, para entrenar los suyos. Operai confirmó su conciencia de tales esfuerzos de los chinos y otras compañías para replicar los principales modelos de IA de EE. UU. Y declaró su compromiso de proteger su propiedad intelectual.

David Sacks, el AI Czar del presidente Trump, sugirió evidencia que apunta al uso de Deepseek de modelos Operai a través de la destilación. Anticipa contramedidas de las empresas de IA liderando para evitar esta práctica.

La situación destaca una ironía significativa: OpenAi, acusada de utilizar el contenido de Internet con derechos de autor para entrenar a ChatGPT, ahora está acusando a una violación similar. Esta hipocresía ha sido ampliamente anotada en las redes sociales. La afirmación previa de OpenAI de que crear modelos de IA como ChatGPT sin material con derechos de autor es "imposible" alimenta aún más el debate.

Esta controversia subraya las batallas legales en curso que rodean el uso de material con derechos de autor en la capacitación de modelos de IA. Las demandas del New York Times y 17 autores, incluido George R.R. Martin, contra Operai y Microsoft, destacan la naturaleza polémica de las afirmaciones de "uso justo" en el campo de IA generativo en rápida evolución. Además, una oficina previa de la Oficina de Derechos de Autor de los Estados Unidos de que el arte generado por IA no puede tener derechos de autor agrega otra capa de complejidad al paisaje legal.

Deepseek está acusado de usar el modelo de OpenAI para capacitar a su competidor utilizando la destilación. Crédito de la imagen: Andrey Rudakov/Bloomberg a través de Getty Images.