Maison Nouvelles Openai Données suspectées dans le modèle de l'IA profonde de la Chine

Openai Données suspectées dans le modèle de l'IA profonde de la Chine

Auteur : Noah Feb 18,2025

Openai soupçonne que Deepseek, un modèle d'IA chinois nettement moins cher que les homologues occidentaux, peut avoir été formé à l'aide des données d'Openai, déclenchant la controverse et la volatilité du marché. L'émergence de Deepseek, avec son modèle R1 en tant qu'alternative à faible coût formé pour seulement 6 millions de dollars, a provoqué une baisse significative des cours des actions des principales sociétés liées à l'IA. Nvidia, un acteur clé de la technologie GPU cruciale pour le fonctionnement du modèle d'IA, a connu sa plus grande perte d'une journée, ce qui permettait près de 600 milliards de dollars de valeur marchande. D'autres sociétés comme Microsoft, Meta, Alphabet et Dell ont également connu des baisses substantielles.

Openai et Microsoft examinent si Deepseek a violé les conditions d'utilisation d'Openai en utilisant la «distillation», une technique où les données de modèles plus importantes sont extraites pour la formation. OpenAI a confirmé sa conscience de telles tentatives de chinois et d'autres sociétés de tirer parti de la technologie de l'IA en tête. David Sacks, le tsar de l'IA du président Trump, soutient en outre la revendication de l'extraction des données des modèles OpenAI.

Cette situation met en évidence l'ironie de la position d'Openai, compte tenu des déclarations précédentes reconnaissant la dépendance au matériel protégé par le droit d'auteur pour la formation de Chatgpt et les batailles juridiques en cours auxquelles l'entreprise est confrontée à l'entreprise. La soumission d'Openai en janvier 2024 à la Chambre des Lords du Royaume-Uni a souligné l'impossibilité de former des modèles d'IA en tête sans matériel protégé par le droit d'auteur. Cette position est encore compliquée par les poursuites du New York Times et 17 auteurs alléguant une violation du droit d'auteur. Le paysage juridique entourant les données de formation de l'IA reste complexe, en particulier à la lumière d'un bureau de droit d'auteur américain de 2018, la décision de l'art généré par l'IA ne peut pas être protégé par le droit d'auteur.

Deepseek est accusé d'utiliser le modèle d'Openai pour former son concurrent en utilisant la distillation. Crédit d'image: Andrey Rudakov/Bloomberg via Getty Images.
La controverse souligne le débat en cours sur les implications éthiques et juridiques de la formation des modèles d'IA sur les données protégées par le droit d'auteur, une question critique alors que l'IA générative continue son expansion rapide.

Derniers articles Plus