Hogar Noticias Datos de Openai sospechosos en el modelo de AI Deepseek de China

Datos de Openai sospechosos en el modelo de AI Deepseek de China

Autor : Noah Feb 18,2025

Operai sospecha que Deepseek, un modelo de IA chino significativamente más barato que las contrapartes occidentales, puede haber sido entrenado utilizando los datos de OpenAI, generando controversia y volatilidad del mercado. La aparición de Deepseek, con su modelo R1 como una alternativa de bajo costo entrenada por solo $ 6 millones, causó una caída significativa en los precios de las acciones de las principales empresas relacionadas con la IA. NVIDIA, un jugador clave en tecnología de GPU, crucial para la operación del modelo de IA, experimentó su pérdida de día de un solo día más grande, que arrojó casi $ 600 mil millones en valor de mercado. Otras compañías como Microsoft, Meta, Alphabet y Dell también vieron una disminución sustancial.

Operai y Microsoft están investigando si Deepseek violó los términos de servicio de OpenAi empleando "destilación", una técnica en la que los datos de modelos más grandes se extraen para capacitación. Operai confirmó su conciencia de tales intentos de las compañías chinas y otras compañías para aprovechar la tecnología de IA estadounidense líder. David Sacks, AI Czar del presidente Trump, respalda aún más el reclamo de extracción de datos de los modelos Operai.

Esta situación destaca la ironía de la posición de OpenAi, dadas declaraciones anteriores que reconocen la dependencia del material con derechos de autor para capacitar a ChatGPT y las batallas legales en curso que enfrenta la compañía. La sumisión de Openai en enero de 2024 a la Casa de Lores del Reino Unido enfatizó la imposibilidad de entrenar modelos de IA líderes sin material con derechos de autor. Esta postura se complica aún más por las demandas del New York Times y 17 autores que alegan infracción de derechos de autor. El paisaje legal que rodea los datos de capacitación de IA sigue siendo complejo, particularmente a la luz de una decisión de la Oficina de Derechos de Autor de los Estados Unidos de 2018 que el arte generado por IA no puede tener derechos de autor.

Deepseek está acusado de usar el modelo de OpenAI para capacitar a su competidor utilizando la destilación. Crédito de la imagen: Andrey Rudakov/Bloomberg a través de Getty Images. La controversia subraya el debate en curso sobre las implicaciones éticas y legales de capacitar a los modelos de IA en datos con derechos de autor, un tema crítico a medida que la IA generativa continúa su rápida expansión.

Últimos artículos Más