DeepSeek ၏အံ့သွစရာကောင်းလောက်အောင်စျေးသိပ်မကြီးသည့် AI မော်ဒယ်လ်သည် DeepSeek V3 သည် AI စျေးကွက်ကိုလှုပ်ခါပြီး Nvidia ၏စတော့ရှယ်ယာဈေးနှုန်းတွင်သိသိသာသာကျဆင်းစေသည်။ Breakseek ကဒေါ်လာ 6 သန်းဖြင့်လေ့ကျင့်မှုကုန်ကျစရိတ်မျှသာတောင်းဆိုသည်။
ပုံ: ensigame.com
Daysseek V3 ၏တီထွင်ဆန်းသစ်သောဗိသုကာသည်၎င်း၏စွမ်းဆောင်ရည်အတွက်သော့ချက်ဖြစ်သည်။ အဲဒါကိုသုံးတယ်
- multi-token prediction (MTP): တိကျမှုနှင့်ထိရောက်မှုအတွက်စကားလုံးများစွာကိုတစ်ပြိုင်တည်းခန့်မှန်းခြင်း။
- ကျွမ်းကျင်သူများအရောအနှော - nernure neurnethings 26 ခုကို အသုံးပြု. Token တစ်ခုစီအတွက်ရှစ်ဆယ်တင်ခြင်း,
- Multi-Head linent အာရုံစူးစိုက်မှု (MLA): သတင်းအချက်အလက်ဆုံးရှုံးမှုကိုလျှော့ချရန်နှင့်အရေးကြီးသောအရာများကိုလျှော့ချရန်အဓိကအသေးစိတ်အချက်အလက်များကိုထပ်ခါတလဲလဲထုတ်ယူခြင်း။
ပုံ: ensigame.com
သို့ရာတွင် Semianalysek ၏အမှန်တကယ်အခြေခံအဆောက်အအုံ - ခန့်မှန်းခြေအားဖြင့်အခြေခံအဆောက်အအုံ - ခန့်မှန်းခြေအားဖြင့် 60000 H800, 10,000 H100 နှင့် H20 GPU များအပါအ 0 င် Semidia Hopper GPU များနှင့်နောက်ထပ် H20 GPU များနှင့်နောက်ထပ် H20 GPU များအပါအ 0 င် Semidia Hopper GPU များ, ၎င်းသည် ~ ဒေါ်လာ 1.6 ဘီလီယံဆာဗာရင်းနှီးမြှုပ်နှံမှုနှင့်လုပ်ငန်းလည်ပတ်မှုကုန်ကျစရိတ်အတွက်ဒေါ်လာ 944 သန်းဖြစ်သည်။ ဒေါ်လာ 6 သန်းတန်ကိန်းဂဏန်းသည်သုတေသန, သန့်စင်ခြင်း, အချက်အလက်ပြုပြင်ခြင်းနှင့်အခြေခံအဆောက်အအုံများကိုဖယ်ထုတ်ခြင်း,
High-Flyer ၏လက်အောက်ခံဖြစ်သော DeepSeek သည်တရုတ်ခြံရိုးခြံရန်ပုံငွေများကိုပိုင်ဆိုင်သည်, ထိန်းချုပ်မှုနှင့်ပိုမိုမြန်ဆန်သောဆန်းသစ်တီထွင်မှုကိုထောက်ပံ့ပေးသည်။ ၎င်း၏ကိုယ်ပိုင်ရန်ပုံငွေရရှိသောသဘာဝသည်သွက်လက်မှုကိုပိုမိုကောင်းမွန်စေသည်။ လစာမြင့်မားသောလစာ (အချို့သောသုတေသီများအတွက်ဒေါ်လာ 1.3 သန်းကျော်) သည်ထိပ်တန်းတရုတ်စွမ်းရည်ကိုဆွဲဆောင်သည်။ သို့သော်ကုမ္ပဏီသည်နိုင်ငံခြားကျွမ်းကျင်သူများကိုငှားရမ်းခြင်းမပြုပါ။
ပုံ: ensigame.com
AI Development တွင် Bodseek ၏စုစုပေါင်းရင်းနှီးမြှုပ်နှံမှုသည်ဒေါ်လာသန်း 500 ထက်ကျော်လွန်သည်။ ၎င်း၏ပိန်သောဖွဲ့စည်းပုံသည်ပိုမိုကြီးမားသောဗျူရိုကရေစီယန္တရားကုမ္ပဏီများနှင့်ထိရောက်သောဆန်းသစ်တီထွင်မှုကိုခွင့်ပြုသည်။
ပုံ: ensigame.com
DeepSeek ၏အောင်မြင်မှုသည်ရန်ပုံငွေထောက်ပံ့ထားသောလွတ်လပ်သော AI ကုမ္ပဏီများ၏ယှဉ်ပြိုင်မှုအလားအလာကိုမီးမောင်းထိုးပြသည်။ ၎င်း၏ "ဘတ်ဂျက်နှင့်ရင်းနှီးသော" ပြောဆိုချက်ကိုလွဲမှားစွာပြောဆိုခြင်းသည်ပြိုင်ဘက်များထက်သိသိသာသာကျဆင်းနေဆဲဖြစ်သည်။ ဥပမာအားဖြင့် BLELSEEK ၏ R1 Model သည် ChatGPT4 ၏ဒေါ်လာသန်း 100 နှင့်နှိုင်းယှဉ်လျှင်ဒေါ်လာ 5 သန်းကုန်ကျသည်။ အဖြစ်မှန်သည်ရင်းနှီးမြှုပ်နှံမှု, နည်းပညာဆိုင်ရာအောင်မြင်မှုများနှင့်အထူးကျွမ်းကျင်သောအဖွဲ့တစ်ဖွဲ့နှင့်ပေါင်းစပ်ထားသည်။