Casa Notizia Dati aperti sospettati nel modello di AI DeepSeek della Cina

Dati aperti sospettati nel modello di AI DeepSeek della Cina

Autore : Noah Feb 18,2025

Openai sospetta che Deepseek, un modello di AI cinese significativamente più economico delle controparti occidentali, potrebbe essere stato addestrato utilizzando i dati di Openi, suscitando polemiche e volatilità del mercato. L'emergere di DeepSeek, che vanta il suo modello R1 come alternativa a basso costo addestrato per soli 6 milioni di dollari, ha causato un calo significativo dei prezzi delle azioni delle principali società legate all'intelligenza artificiale. NVIDIA, un attore chiave nella tecnologia GPU cruciale per il funzionamento del modello di intelligenza artificiale, ha registrato la sua perdita di un giorno più grande di sempre, perdendo un valore di mercato di quasi $ 600 miliardi. Anche altre aziende come Microsoft, Meta, Alphabet e Dell hanno visto sostanziali cali.

Openai e Microsoft stanno studiando se DeepSeek abbia violato i termini di servizio di Openi impiegando "distillazione", una tecnica in cui vengono estratti i dati provenienti da modelli più grandi per la formazione. Openai ha confermato la sua consapevolezza di tali tentativi da parte delle società cinesi e di altre società di sfruttare la tecnologia AI statunitense. David Sacks, lo zar AI del presidente Trump, supporta ulteriormente la pretesa di estrazione dei dati dai modelli OpenAI.

Questa situazione evidenzia l'ironia della posizione di Openi, date le precedenti dichiarazioni che riconoscono la dipendenza dal materiale protetto da copyright per la formazione di CHATGPT e le battaglie legali in corso che affrontano la società. La sottomissione di Openai al gennaio 2024 alla House of Lords del Regno Unito ha sottolineato l'impossibilità di addestrare i principali modelli di intelligenza artificiale senza materiale protetto da copyright. Questa posizione è ulteriormente complicata dalle azioni legali del New York Times e di 17 autori che sostengono violazione del copyright. Il panorama legale che circonda i dati di addestramento dell'IA rimane complesso, in particolare alla luce di una sentenza dell'ufficio del copyright degli Stati Uniti del 2018 che l'arte generata dall'IA non può essere protetto da copyright.

DeepSeek è accusato di usare il modello di Openi per addestrare il proprio concorrente usando la distillazione. Credito di immagine: Andrey Rudakov/Bloomberg tramite Getty Images.
La controversia sottolinea il dibattito in corso sulle implicazioni etiche e legali della formazione di AI modelli sui dati protetti da copyright, una questione critica mentre l'intelligenza artificiale generativa continua la sua rapida espansione.

Ultimi articoli Di più