Deepseeks überraschend kostengünstiges KI -Modell, Deepseek V3, hat den KI -Markt erschüttert und zu einem erheblichen Rückgang des Aktienkurs von Nvidia verursacht. Während Deepseek nur 6 -Millionen -Dollar -Schulungskosten beansprucht, zeigt ein genauerer Blick eine weitaus umfassendere Investition.
Bild: Ensigame.com
Die innovative Architektur von Deepseek V3 ist der Schlüssel zu ihrer Leistung. Es verwendet:
- Mehrfache Vorhersage (MTP): mehrere Wörter gleichzeitig für eine erhöhte Genauigkeit und Effizienz vorhersagen.
- Mischung von Experten (MOE): Mit 256 neuronalen Netzwerken, acht für jedes Token aktiviert, das Training beschleunigt und die Leistung verbessert. .
Bild: Ensigame.com
Die semianalyse ergab jedoch die tatsächliche Infrastruktur von Deepseek: ungefähr 50.000 NVIDIA Hopper -GPUs, einschließlich 10.000 H800, 10.000 H100 und zusätzlicher H20 -GPUs, verteilt auf mehrere Rechenzentren. Dies entspricht einer Serverinvestition von ~ 1,6 Milliarden US -Dollar und den Betriebskosten von ~ 944 Mio. USD. Die 6-Millionen-Dollar-Zahl spiegelt nur die Nutzung der GPU vor dem Training wider, ohne Forschung, Verfeinerung, Datenverarbeitung und Infrastruktur.
Deepseek, eine Tochtergesellschaft von High-Flyer, einem chinesischen Hedgefonds, besitzt seine Rechenzentren und bietet Kontrolle und schnellere Innovation. Seine selbstfinanzierte Natur verbessert die Beweglichkeit. Hohe Gehälter (über 1,3 Millionen US -Dollar pro Jahr für einige Forscher) ziehen erstklassige chinesische Talente an, obwohl das Unternehmen keine ausländischen Spezialisten einstellt.
Bild: Ensigame.com
Die Gesamtinvestition von Deepseek in die KI -Entwicklung übersteigt 500 Millionen US -Dollar. Die magere Struktur ermöglicht effiziente Innovationen im Vergleich zu größeren, bürokratischeren Unternehmen.
Bild: Ensigame.com
Der Erfolg von Deepseek unterstreicht das Wettbewerbspotential gut finanzierter unabhängiger KI-Unternehmen. Während seine "budgetfreundliche" Behauptung irreführend ist, bleibt die Kosten erheblich niedriger als die Wettbewerber. Zum Beispiel kostete das R1 -Modell von Deepseek 5 Millionen US -Dollar im Vergleich zu den 100 Millionen US -Dollar von Chatgpt4. Die Realität ist eine Kombination aus erheblichen Investitionen, technologischen Durchbrüchen und einem hochqualifizierten Team.