Boldseak မှ chatbot မှ "မင်္ဂလာပါ, ငါဖန်တီးနိုင်အောင်သင်တစ်ခုခုကိုသင်ဖန်တီးနိုင်ပြီးသင်အံ့အားသင့်စရာကောင်းလောက်အောင်အဖြေရနိုင်သည်" ဟုရဲရင့်စွာဖော်ပြခဲ့သည်။ ဤနိဒါန်းသည်ရှာဖွေမှုကိုသာအာရုံစိုက်ရုံသာမက Nvidia ၏အကြီးမားဆုံးစတော့ရှယ်ယာဈေးနှုန်းကျဆင်းမှုများထဲမှတစ်ခုသို့လည်းအထောက်အကူပြုခဲ့သည်။
image: ensigame.com
DeepSeek ၏ AI မော်ဒယ်သည်၎င်း၏ဆန်းသစ်တီထွင်ဖန်တီးမှုနှင့်လေ့ကျင့်ရေးနည်းလမ်းများကြောင့်ထင်ရှားသည်။ အဲဒါကိုခွဲထားတဲ့အဓိကနည်းပညာတွေထဲကို 0 င်ကြည့်ရအောင်။
Multi-token ခန့်မှန်းချက် (MTP) - ဤနည်းလမ်းသည်ဝါကျ၏ကွဲပြားခြားနားသောအစိတ်အပိုင်းများကိုခွဲခြမ်းစိတ်ဖြာခြင်းအားဖြင့်ဤနည်းလမ်းသည်စကားလုံးများစွာကိုစကားလုံးများစွာကိုကြိုတင်ခန့်မှန်းရန်ခွင့်ပြုသည်။ ၎င်းသည်တိကျမှန်ကန်မှုကိုမြှင့်တင်ရုံသာမကပုံစံ၏ထိရောက်မှုကိုလည်းမြှင့်တင်ရန်,
ကျွမ်းကျင်သူများ (MoE) အရောအနှော - DaySeek V3 သည် Seeken အပြောင်းအလဲအတွက်ရှစ်ရာနှုန်းအတွက်ရှစ်ခုကိုသက်ဝင်စေခြင်းနှင့်အတူရှုပ်ထွေးသောဗိသုကာကိုအသုံးပြုသည်။ ဤချဉ်းကပ်မှုသည် AI လေ့ကျင့်မှုများကိုအမြန်ဆုံးမြန်စေပြီးစွမ်းဆောင်ရည်ကိုမြှင့်တင်ပေးသည်။
Multi-Head ငုပ်လျှိုးနေသည့်အာရုံစူးစိုက်မှု (MLA) - ဤယန္တရားသည်ဝါကျ၏အရေးအကြီးဆုံးအစိတ်အပိုင်းများကိုအာရုံစိုက်ပြီးအဓိကအကြောင်းအရာများကိုထပ်ခါတလဲလဲထုတ်ယူသည်။ ထိုသို့ပြုလုပ်ခြင်းဖြင့် MLL သည်အရေးပါသောသတင်းအချက်အလက်များကိုပျောက်ဆုံးနေသောအရေးကြီးသောသတင်းအချက်အလက်များကိုလျော့နည်းစေသည်, AI ကို input data များကိုထိထိရောက်ရောက်အသေးစိတ်ဖော်ပြရန်ခွင့်ပြုသည်။
နက်ရှိုင်းသောတရုတ် startup တစ်ခုဖြစ်သောနက်ရှိုင်းမှုသည်ဤယှဉ်ပြိုင်မှုရှိသော AI မော်ဒယ်လ်ကိုကုန်ကျစရိတ်သက်သာစွာဖြင့်တီထွင်ခဲ့သည်ဟုဆိုကြသည်။ သူတို့ကအားကောင်းတဲ့ DeepSeek V3 The Nernure ကွန်ယက်ကဒေါ်လာ 6 သန်းသာကုန်ကျပြီး 2048 ဂရပ်ဖစ်ပရိုဆက်ဆာတွေကသာသူတို့ကိုဒေါ်လာ 6 သန်းသာကုန်ကျတယ်လို့အခိုင်အမာဆိုကြသည်။
image: ensigame.com
သို့ရာတွင် Semianalisys မှလေ့လာသုံးသပ်သူများက Bodseek ၏လုပ်ဆောင်မှုများသည်ပိုမိုကြီးမားသောကွန်ပျူတာအခြေခံအဆောက်အအုံများပါ 0 င်ကြောင်းတွေ့ရှိရသည်။ သူတို့ကခန့်မှန်းတွက်ချက်မှုသည် DaySeek သည် 60000 H800 H800 H100s နှင့် H20 H100s နှင့် H20 GPU များနှင့်နောက်ထပ် H20 GPU များနှင့်နောက်ထပ် H20 GPU များအပါအ 0 င် Data Centers တို့တွင်ပိုမိုအသုံးပြုသည်။ ဤအရင်းအမြစ်များကို AI သင်တန်း, သုတေသနနှင့်ဘဏ် financial ာရေးပုံစံများအတွက်ကုမ္ပဏီ၏စုစုပေါင်းရင်းနှီးမြှုပ်နှံမှုအတွက်ဒေါ်လာ 1.6 ဘီလီယံနှင့်လုပ်ငန်းလည်ပတ်အသုံးစရိတ်များအတွက်ဒေါ်လာ 944 သန်းဖြင့်ရောက်ရှိခြင်းဖြင့်အသုံးပြုသည်။
DeepSeek သည် 2023 တွင်သီးခြား AI-finced disced တစ်ခုအဖြစ်သတ်မှတ်ထားသည့်တရုတ်စောင်ရန်းစောင်ရွန်ခြံများအမြင့်ဆုံးအနေဖြင့်တည်ထောင်ခဲ့သည်။ Cloud Computing အပေါ်မှီခိုနေရသော startups များနှင့်မတူဘဲ Bodsee သည်၎င်း၏အချက်အလက်စင်တာများကိုပိုင်ဆိုင်ပြီးပိုမိုမြန်ဆန်သောဆန်းသစ်တီထွင်မှုဖြန့်ကျက်မှုများကိုထိန်းချုပ်ခြင်းနှင့်ပိုမိုမြန်ဆန်သောဆန်းသစ်တီထွင်မှုများနှင့်ပိုမိုမြန်ဆန်သောထိန်းချုပ်မှုကိုအပြည့်အဝထိန်းချုပ်ထားသည်။ ကုမ္ပဏီ၏ကိုယ်ပိုင်ရန်ပုံငွေထောက်ပံ့ထားသော status သည်၎င်း၏သွက်လက်ခြင်းနှင့်ဆုံးဖြတ်ချက်ချနှုန်းကိုတိုးတက်စေသည်။
image: ensigame.com
ထို့အပြင်နက်ရှိုင်းသောနက်ကဲလ်သည်တရုတ်တက္ကသိုလ်များမှထိပ်တန်းအရည်အချင်းများကိုဆွဲဆောင်ကာနှစ်စဉ်ဒေါ်လာ 1.3 သန်းကျော်ရရှိသည်။ ဤသိသာထင်ရှားသည့်ရင်းနှီးမြှုပ်နှံမှုများရှိနေသော်လည်းကုမ္ပဏီ၏နောက်ဆုံးပေါ်မော်ဒယ်ကိုဒေါ်လာ 6 သန်းမျှသာလေ့ကျင့်သင်ကြားမှုဟုဆိုကာလက်တွေ့မကျပုံရသည့်အတွက်ဤကိန်းဂဏန်းသည် GPU အသုံးပြုမှုအတွက်သာဖြစ်သည်။ သုတေသန, စံပြသန့်စင်ခြင်း,
ဘလူးစ်သည်တည်ထောင်ပြီးကတည်းက AI ဖွံ့ဖြိုးတိုးတက်မှုတွင်ဒေါ်လာသန်း 500 ကျော်ရင်းနှီးမြှုပ်နှံခဲ့သည်။ ၎င်း၏ Compact ဖွဲ့စည်းပုံသည်၎င်းကိုပိုမိုကြီးမားသောဗျူရိုကရေစီယန္တရားကုမ္ပဏီများနှင့်မတူဘဲ AI ဆန်းသစ်တီထွင်မှုများကိုလျင်မြန်စွာအကောင်အထည်ဖော်ရန်ခွင့်ပြုသည်။
image: ensigame.com
နက်ရှိုင်းသောပုံသက်သေကငွေကြေးထောက်ပံ့သောလွတ်လပ်သော AI ကုမ္ပဏီများသည်စက်မှုလုပ်ငန်းကုမ္ပဏီကြီးများနှင့်ယှဉ်ပြိုင်နိုင်ကြောင်းနက်ရှိုင်းသောပုံသက်သေကဖော်ပြသည်။ ကုမ္ပဏီ၏အောင်မြင်မှုကိုသိသိသာသာရင်းနှီးမြှုပ်နှံမှုများ, နည်းပညာဆိုင်ရာအောင်မြင်မှုများကြောင့်မောင်းနှင်နိုင်သော်လည်း AI Model Development အတွက် "တော်လှန်ရေးဘတ်ဂျက်ကိုရရှိသောဘတ်ဂျက်၏အယူအဆများမှမောင်းနှင်နေစဉ်မောင်းနှင်နိုင်သည်။ မည်သို့ပင်ဆိုစေကာမူ Blowseek ၏ကုန်ကျစရိတ်များသည်ပြိုင်ဘက်များထက်ဒေါ်လာသန်း 100 အထိအပြတ်အသတ်များနှင့်နှိုင်းယှဉ်လျှင် CHAPSEEK ၏ဒေါ်လာ 5 သန်းနှင့်နှိုင်းယှဉ်လျှင်ဒေါ်လာသန်း 100 သုံးစွဲသည်။
သို့သော်၎င်းသည်၎င်း၏ပြိုင်ဘက်များထက်စျေးသက်သာနေဆဲဖြစ်သည်။