दीपसेक के आश्चर्यजनक रूप से सस्ती एआई मॉडल, डीपसेक वी 3 ने एआई बाजार को हिला दिया है, जिससे एनवीडिया के स्टॉक मूल्य में एक महत्वपूर्ण गिरावट आई है। जबकि डीपसेक केवल $ 6 मिलियन प्रशिक्षण लागत का दावा करता है, एक नज़दीकी नज़र से कहीं अधिक पर्याप्त निवेश का पता चलता है।
छवि: ensigame.com
दीपसेक वी 3 की अभिनव वास्तुकला इसके प्रदर्शन के लिए महत्वपूर्ण है। यह उपयोग करता है:
- मल्टी-टोकन भविष्यवाणी (एमटीपी): सटीकता और दक्षता में वृद्धि के लिए एक साथ कई शब्दों की भविष्यवाणी करना।
- विशेषज्ञों का मिश्रण (एमओई): 256 तंत्रिका नेटवर्क को नियोजित करना, प्रत्येक टोकन के लिए आठ को सक्रिय करना, प्रशिक्षण में तेजी और प्रदर्शन में सुधार करना।
- मल्टी-हेड लेटेंट ध्यान (एमएलए): सूचना हानि को कम करने और महत्वपूर्ण बारीकियों को पकड़ने के लिए बार-बार महत्वपूर्ण विवरण निकालने।
छवि: ensigame.com
हालांकि, सेमियालिसिस ने डीपसेक के वास्तविक बुनियादी ढांचे का खुलासा किया: लगभग 50,000 एनवीडिया हॉपर जीपीयू, जिसमें 10,000 एच 800, 10,000 एच 100 और अतिरिक्त एच 20 जीपीयू शामिल हैं, जो कई डेटा केंद्रों में फैले हुए हैं। यह परिचालन लागत में ~ $ 1.6 बिलियन सर्वर निवेश और ~ $ 944 मिलियन का प्रतिनिधित्व करता है। $ 6 मिलियन का आंकड़ा केवल पूर्व-प्रशिक्षण GPU उपयोग को दर्शाता है, अनुसंधान, शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे को छोड़कर।
एक चीनी हेज फंड, हाई-फ्लायर की सहायक कंपनी दीपसेक अपने डेटा केंद्रों का मालिक है, जो नियंत्रण और तेजी से नवाचार प्रदान करती है। इसकी स्व-वित्त पोषित प्रकृति चपलता को बढ़ाती है। उच्च वेतन (कुछ शोधकर्ताओं के लिए सालाना 1.3 मिलियन डॉलर से अधिक) शीर्ष चीनी प्रतिभा को आकर्षित करते हैं, हालांकि कंपनी विदेशी विशेषज्ञों को नियुक्त नहीं करती है।
छवि: ensigame.com
एआई विकास में दीपसेक का कुल निवेश $ 500 मिलियन से अधिक है। इसकी दुबला संरचना बड़ी, अधिक नौकरशाही कंपनियों की तुलना में कुशल नवाचार के लिए अनुमति देती है।
छवि: ensigame.com
दीपसेक की सफलता अच्छी तरह से वित्त पोषित स्वतंत्र एआई कंपनियों की प्रतिस्पर्धी क्षमता पर प्रकाश डालती है। जबकि इसका "बजट-अनुकूल" दावा भ्रामक है, इसकी लागत प्रतियोगियों की तुलना में काफी कम है। उदाहरण के लिए, Chatgpt4 के $ 100 मिलियन की तुलना में दीपसेक के R1 मॉडल की लागत $ 5 मिलियन है। वास्तविकता पर्याप्त निवेश, तकनीकी सफलताओं और एक उच्च कुशल टीम का एक संयोजन है।