दीपसेक के नए चैटबोट, जिसमें साहसपूर्वक कहा गया था, "हाय, मैं बनाया गया था ताकि आप कुछ भी पूछ सकें और एक उत्तर प्राप्त कर सकें जो आपको आश्चर्यचकित भी कर सकता है," एआई उद्योग में महत्वपूर्ण तरंगें बनाई हैं। इस परिचय ने न केवल ध्यान आकर्षित किया है, बल्कि एनवीडिया के सबसे बड़े स्टॉक मूल्य ड्रॉप्स में से एक में भी योगदान दिया है, जो बाजार पर दीपसेक के प्रभाव को दर्शाता है।
चित्र: ensigame.com
दीपसेक का एआई मॉडल अपने अभिनव वास्तुकला और प्रशिक्षण विधियों के कारण बाहर खड़ा है। आइए इसे अलग करने वाली प्रमुख प्रौद्योगिकियों में तल्लीन करें:
मल्टी-टोकन भविष्यवाणी (एमटीपी) : यह विधि मॉडल को एक वाक्य के विभिन्न खंडों का विश्लेषण करके एक साथ कई शब्दों की भविष्यवाणी करने की अनुमति देती है। यह न केवल सटीकता को बढ़ावा देता है, बल्कि मॉडल की दक्षता भी बढ़ाता है, जिससे यह पाठ को समझने और उत्पन्न करने के लिए एक शक्तिशाली उपकरण बन जाता है।
विशेषज्ञों का मिश्रण (एमओई) : डीपसेक वी 3 256 तंत्रिका नेटवर्क के साथ एक परिष्कृत वास्तुकला का उपयोग करता है, प्रत्येक टोकन प्रसंस्करण कार्य के लिए आठ को सक्रिय करता है। यह दृष्टिकोण एआई प्रशिक्षण को काफी गति देता है और समग्र प्रदर्शन को बढ़ाता है, जिससे यह उनकी तकनीक का एक स्टैंडआउट विशेषता है।
मल्टी-हेड लेटेंट ध्यान (एमएलए) : यह तंत्र एक वाक्य के सबसे महत्वपूर्ण भागों पर केंद्रित है, जो बार-बार महत्वपूर्ण विवरण निकालता है। ऐसा करने से, MLA महत्वपूर्ण जानकारी के लापता होने के जोखिम को कम कर देता है, जिससे AI को इनपुट डेटा में बारीक विवरण को प्रभावी ढंग से कैप्चर करने की अनुमति मिलती है।
दीपसेक, एक प्रमुख चीनी स्टार्टअप, इस प्रतिस्पर्धी एआई मॉडल को अपेक्षाकृत कम लागत पर विकसित करने का दावा करता है। वे दावा करते हैं कि शक्तिशाली दीपसेक वी 3 न्यूरल नेटवर्क को प्रशिक्षित करना उन्हें केवल $ 6 मिलियन खर्च करता है और सिर्फ 2048 ग्राफिक्स प्रोसेसर का उपयोग करता है।
चित्र: ensigame.com
हालांकि, सेमियालिसिस के विश्लेषकों ने खुलासा किया है कि दीपसेक के संचालन में बहुत बड़ा कम्प्यूटेशनल बुनियादी ढांचा शामिल है। वे अनुमान लगाते हैं कि डीपसेक लगभग 50,000 एनवीडिया हॉपर जीपीयू का उपयोग करता है, जिसमें 10,000 एच 800 यूनिट, 10,000 एच 100 और अतिरिक्त एच 20 जीपीयू शामिल हैं, जो कई डेटा केंद्रों में फैले हुए हैं। इन संसाधनों का उपयोग एआई प्रशिक्षण, अनुसंधान और वित्तीय मॉडलिंग के लिए किया जाता है, कंपनी के कुल निवेश के साथ सर्वर में लगभग 1.6 बिलियन डॉलर और परिचालन व्यय $ 944 मिलियन तक पहुंचते हैं।
दीपसेक चीनी हेज फंड हाई-फ्लायर की एक सहायक कंपनी है, जिसने इसे 2023 में एक अलग एआई-केंद्रित डिवीजन के रूप में स्थापित किया था। क्लाउड कंप्यूटिंग पर भरोसा करने वाले कई स्टार्टअप्स के विपरीत, डीपसेक अपने डेटा केंद्रों का मालिक है, यह एआई मॉडल अनुकूलन और तेजी से नवाचार तैनाती पर पूर्ण नियंत्रण देता है। कंपनी की स्व-वित्त पोषित स्थिति इसकी चपलता और निर्णय लेने की गति को बढ़ाती है।
चित्र: ensigame.com
इसके अलावा, दीपसेक प्रमुख चीनी विश्वविद्यालयों से शीर्ष प्रतिभा को आकर्षित करता है, कुछ शोधकर्ताओं ने सालाना 1.3 मिलियन डॉलर से अधिक की कमाई की। इन महत्वपूर्ण निवेशों के बावजूद, कंपनी के अपने नवीनतम मॉडल को केवल $ 6 मिलियन के प्रशिक्षण का दावा अवास्तविक लगता है, क्योंकि यह आंकड़ा केवल पूर्व-प्रशिक्षण के दौरान GPU उपयोग के लिए जिम्मेदार है और अन्य पर्याप्त लागतों जैसे कि अनुसंधान, मॉडल शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे को बाहर करता है।
इसकी स्थापना के बाद से, डीपसेक ने एआई विकास में $ 500 मिलियन से अधिक का निवेश किया है। इसकी कॉम्पैक्ट संरचना इसे बड़ी, अधिक नौकरशाही कंपनियों के विपरीत, एआई नवाचारों को जल्दी और प्रभावी ढंग से लागू करने की अनुमति देती है।
चित्र: ensigame.com
दीपसेक का उदाहरण बताता है कि एक अच्छी तरह से वित्त पोषित, स्वतंत्र एआई कंपनी उद्योग दिग्गजों के साथ प्रतिस्पर्धा कर सकती है। जबकि कंपनी की सफलता पर्याप्त निवेश, तकनीकी सफलताओं और एक मजबूत टीम द्वारा संचालित होती है, एआई मॉडल के विकास के लिए "क्रांतिकारी बजट" की धारणा को कम किया जा सकता है। बहरहाल, डीपसेक की लागत इसके प्रतिद्वंद्वियों की तुलना में काफी कम है, जैसे कि आर 1 के लिए डीपसेक के 5 मिलियन डॉलर की तुलना में चैटगेट 4 ओ पर खर्च किए गए $ 100 मिलियन।
हालांकि, यह अभी भी अपने प्रतिद्वंद्वियों की तुलना में सस्ता है।