Openai nghi ngờ rằng Deepseek, một mô hình AI của Trung Quốc rẻ hơn đáng kể so với các đối tác phương Tây, có thể đã được đào tạo bằng cách sử dụng dữ liệu của Openai, gây tranh cãi và biến động thị trường. Sự xuất hiện của Deepseek, tự hào với mô hình R1 của mình như một sự thay thế chi phí thấp được đào tạo với giá chỉ 6 triệu đô la, gây ra sự sụt giảm đáng kể về giá cổ phiếu của các công ty lớn liên quan đến AI. NVIDIA, một người chơi chính trong công nghệ GPU quan trọng cho hoạt động mô hình AI, đã trải qua tổn thất lớn nhất từ trước đến nay, giảm gần 600 tỷ đô la giá trị thị trường. Các công ty khác như Microsoft, Meta, Alphabet và Dell cũng chứng kiến sự suy giảm đáng kể.
Openai và Microsoft đang điều tra xem liệu Deepseek có vi phạm các điều khoản dịch vụ của Openai hay không bằng cách sử dụng "chưng cất", một kỹ thuật trong đó dữ liệu từ các mô hình lớn hơn được trích xuất để đào tạo. Openai đã xác nhận nhận thức về những nỗ lực như vậy của Trung Quốc và các công ty khác để tận dụng công nghệ AI dẫn đầu của chúng tôi. David Sacks, AI của Tổng thống Trump, hỗ trợ thêm cho tuyên bố trích xuất dữ liệu từ các mô hình Openai.
Tình huống này nhấn mạnh sự trớ trêu của vị trí của Openai, được đưa ra những tuyên bố trước đây thừa nhận sự phụ thuộc vào tài liệu có bản quyền để đào tạo Chatgpt và các trận chiến pháp lý đang diễn ra đối mặt với công ty. Sự đệ trình tháng 1 năm 2024 của Openai lên House of Lords của Vương quốc Anh nhấn mạnh sự bất khả thi của đào tạo các mô hình AI dẫn đầu mà không cần tài liệu có bản quyền. Lập trường này còn phức tạp hơn bởi các vụ kiện từ Thời báo New York và 17 tác giả cáo buộc vi phạm bản quyền. Phong cảnh pháp lý xung quanh dữ liệu đào tạo AI vẫn còn phức tạp, đặc biệt là trong một văn phòng bản quyền năm 2018 của Hoa Kỳ phán quyết rằng nghệ thuật do AI tạo ra không thể có bản quyền.