Model AI yang sangat murah, DeepSeek V3, telah mengguncang pasaran AI, menyebabkan penurunan harga saham Nvidia yang ketara. Walaupun Deepseek mendakwa hanya kos latihan $ 6 juta, penampilan yang lebih dekat menunjukkan pelaburan yang jauh lebih besar.
imej: ensigame.com
Senibina inovatif DeepSeek V3 adalah kunci kepada prestasinya. Ia menggunakan:
- Ramalan Multi-Token (MTP): Meramalkan pelbagai perkataan secara serentak untuk meningkatkan ketepatan dan kecekapan.
- Campuran Pakar (MOE): Menggunakan 256 rangkaian saraf, mengaktifkan lapan untuk setiap token, mempercepatkan latihan dan meningkatkan prestasi.
- Perhatian Laten Multi-Head (MLA): Berulang kali mengekstrak butiran utama untuk meminimumkan kehilangan maklumat dan menangkap nuansa penting.
imej: ensigame.com
Walau bagaimanapun, semianalisis mendedahkan infrastruktur sebenar DeepSeek: kira -kira 50,000 NVIDIA Hopper GPU, termasuk 10,000 H800, 10,000 H100, dan GPU tambahan H20, tersebar di pelbagai pusat data. Ini mewakili pelaburan pelayan ~ $ 1.6 bilion dan ~ $ 944 juta dalam kos operasi. Angka $ 6 juta hanya mencerminkan penggunaan GPU pra-latihan, tidak termasuk penyelidikan, penghalusan, pemprosesan data, dan infrastruktur.
DeepSeek, anak syarikat High-Flyer, dana lindung nilai Cina, memiliki pusat datanya, menyediakan kawalan dan inovasi yang lebih cepat. Sifat yang dibiayai sendiri meningkatkan ketangkasan. Gaji tinggi (lebih daripada $ 1.3 juta setiap tahun untuk sesetengah penyelidik) menarik bakat Cina teratas, walaupun syarikat itu tidak menyewa pakar asing.
imej: ensigame.com
Jumlah pelaburan DeepSeek dalam pembangunan AI melebihi $ 500 juta. Struktur rampingnya membolehkan inovasi yang cekap berbanding dengan syarikat birokrasi yang lebih besar dan lebih besar.
imej: ensigame.com
Kejayaan DeepSeek menyoroti potensi kompetitif syarikat AI yang dibiayai dengan baik. Walaupun tuntutan "mesra bajet" itu mengelirukan, kosnya masih jauh lebih rendah daripada pesaing. Sebagai contoh, model R1 DeepSeek berharga $ 5 juta, berbanding $ 100 juta ChatGPT4. Realitinya adalah gabungan pelaburan yang besar, terobosan teknologi, dan pasukan yang sangat mahir.