ডিপসেকের নতুন চ্যাটবট, যা সাহসের সাথে বলেছিল, "হাই, আমাকে তৈরি করা হয়েছিল যাতে আপনি কিছু জিজ্ঞাসা করতে পারেন এবং এমন একটি উত্তর পেতে পারেন যা আপনাকে অবাক করে দিতে পারে," এআই শিল্পে উল্লেখযোগ্য তরঙ্গ তৈরি করেছে। এই ভূমিকাটি কেবল মনোযোগ আকর্ষণ করেছে না তবে এনভিডিয়ার বৃহত্তম স্টক প্রাইস ড্রপগুলির মধ্যে একটিতে অবদান রেখেছে, যা বাজারে ডিপসিকের প্রভাব প্রদর্শন করে।
চিত্র: ensigame.com
ডিপসেকের এআই মডেলটি এর উদ্ভাবনী স্থাপত্য এবং প্রশিক্ষণের পদ্ধতির কারণে দাঁড়িয়ে আছে। আসুন কী প্রযুক্তিগুলি এটি আলাদা করে রেখেছে:
মাল্টি-টোকেন পূর্বাভাস (এমটিপি) : এই পদ্ধতিটি একটি বাক্যটির বিভিন্ন বিভাগ বিশ্লেষণ করে মডেলটিকে একবারে একাধিক শব্দের পূর্বাভাস দেওয়ার অনুমতি দেয়। এটি কেবল নির্ভুলতাটিকেই নয়, মডেলটির দক্ষতাও বাড়িয়ে তোলে, এটি পাঠ্য বোঝার এবং উত্পন্ন করার জন্য একটি শক্তিশালী সরঞ্জাম হিসাবে তৈরি করে।
বিশেষজ্ঞদের মিশ্রণ (এমওই) : ডিপসেক ভি 3 প্রতিটি টোকেন প্রসেসিং টাস্কের জন্য আটটি সক্রিয় করে 256 নিউরাল নেটওয়ার্কগুলির সাথে একটি পরিশীলিত আর্কিটেকচার ব্যবহার করে। এই পদ্ধতির উল্লেখযোগ্যভাবে এআই প্রশিক্ষণকে গতি বাড়ায় এবং সামগ্রিক কর্মক্ষমতা বাড়ায়, এটি তাদের প্রযুক্তির একটি স্ট্যান্ডআউট বৈশিষ্ট্য হিসাবে তৈরি করে।
মাল্টি-হেডের সুপ্ত মনোযোগ (এমএলএ) : এই প্রক্রিয়াটি একটি বাক্যটির সবচেয়ে গুরুত্বপূর্ণ অংশগুলিতে ফোকাস করে, বারবার কী বিশদটি বের করে। এটি করার মাধ্যমে, এমএলএ গুরুত্বপূর্ণ তথ্য অনুপস্থিত হওয়ার ঝুঁকি হ্রাস করে, এআইকে কার্যকরভাবে ইনপুট ডেটাতে সংক্ষিপ্ত বিবরণ ক্যাপচার করতে দেয়।
ডিপসেক, একটি বিশিষ্ট চীনা স্টার্টআপ, দাবি করেছেন যে এই প্রতিযোগিতামূলক এআই মডেল তুলনামূলকভাবে কম ব্যয়ে বিকাশ করেছেন। তারা দৃ sert ়ভাবে বলেছে যে শক্তিশালী ডিপসেক ভি 3 নিউরাল নেটওয়ার্ককে প্রশিক্ষণ দেওয়া তাদের জন্য কেবল 6 মিলিয়ন ডলার ব্যয় করে এবং কেবল 2048 গ্রাফিক্স প্রসেসর ব্যবহার করে।
চিত্র: ensigame.com
তবে, সেমিয়ানালাইসিসের বিশ্লেষকরা আবিষ্কার করেছেন যে ডিপসিকের অপারেশনগুলিতে অনেক বড় গণ্য অবকাঠামো জড়িত। তারা অনুমান করে যে ডিপসেক প্রায় 50,000 এনভিডিয়া হপার জিপিইউ ব্যবহার করে, 10,000 এইচ 800 ইউনিট, 10,000 এইচ 100 এবং অতিরিক্ত এইচ 20 জিপিইউ সহ বেশ কয়েকটি ডেটা সেন্টারে ছড়িয়ে পড়ে। এই সংস্থানগুলি এআই প্রশিক্ষণ, গবেষণা এবং আর্থিক মডেলিংয়ের জন্য ব্যবহৃত হয়, সার্ভারগুলিতে কোম্পানির মোট বিনিয়োগ প্রায় 1.6 বিলিয়ন ডলার এবং অপারেশনাল ব্যয় $ 944 মিলিয়ন ডলারে পৌঁছেছে।
ডিপসেক চীনা হেজ ফান্ড হাই-ফ্লায়ারের একটি সহায়ক সংস্থা, যা এটি ২০২৩ সালে একটি পৃথক এআই-কেন্দ্রিক বিভাগ হিসাবে প্রতিষ্ঠিত করেছে। ক্লাউড কম্পিউটিংয়ের উপর নির্ভর করে এমন অনেক স্টার্টআপের বিপরীতে, ডিপসেক তার ডেটা সেন্টারগুলির মালিক, এটি এআই মডেল অপ্টিমাইজেশন এবং দ্রুত উদ্ভাবন স্থাপনার উপর সম্পূর্ণ নিয়ন্ত্রণ দেয়। সংস্থার স্ব-অর্থায়িত স্থিতি তার তত্পরতা এবং সিদ্ধান্ত গ্রহণের গতি বাড়ায়।
চিত্র: ensigame.com
তদুপরি, ডিপসেক শীর্ষস্থানীয় চীনা বিশ্ববিদ্যালয়গুলি থেকে শীর্ষ প্রতিভা আকর্ষণ করে, কিছু গবেষক বার্ষিক ১.৩ মিলিয়ন ডলারের বেশি আয় করেন। এই উল্লেখযোগ্য বিনিয়োগ সত্ত্বেও, সংস্থাটির সর্বশেষতম মডেলটিকে মাত্র million মিলিয়ন ডলারে প্রশিক্ষণের দাবিটি অবাস্তব বলে মনে হচ্ছে, কারণ এই চিত্রটি কেবল প্রাক-প্রশিক্ষণের সময় জিপিইউ ব্যবহারের জন্য দায়ী এবং গবেষণা, মডেল পরিশোধন, ডেটা প্রসেসিং এবং অবকাঠামো হিসাবে অন্যান্য যথেষ্ট ব্যয়কে বাদ দেয়।
প্রতিষ্ঠার পর থেকে ডিপসেক এআই বিকাশে 500 মিলিয়ন ডলারেরও বেশি বিনিয়োগ করেছে। এর কমপ্যাক্ট কাঠামো এটিকে বৃহত্তর, আরও আমলাতান্ত্রিক সংস্থার বিপরীতে দ্রুত এবং কার্যকরভাবে এআই উদ্ভাবনগুলি বাস্তবায়নের অনুমতি দেয়।
চিত্র: ensigame.com
ডিপসেকের উদাহরণ চিত্রিত করে যে একটি সু-অর্থায়িত, স্বতন্ত্র এআই সংস্থা শিল্প জায়ান্টদের সাথে প্রতিযোগিতা করতে পারে। যদিও সংস্থার সাফল্য যথেষ্ট পরিমাণে বিনিয়োগ, প্রযুক্তিগত অগ্রগতি এবং একটি শক্তিশালী দল দ্বারা পরিচালিত হয়, তবে এআই মডেল বিকাশের জন্য একটি "বিপ্লবী বাজেট" ধারণাটি বাড়িয়ে দেওয়া যেতে পারে। তবুও, ডিপসিকের ব্যয়গুলি তার প্রতিযোগীদের তুলনায় উল্লেখযোগ্যভাবে কম রয়েছে, যেমন ডিপসেকের আর 1 এর জন্য 5 মিলিয়ন ডলার তুলনায় চ্যাটজিপিটি 4 ও প্রশিক্ষণে ব্যয় করা 100 মিলিয়ন ডলার।
তবে এটি এখনও এর প্রতিযোগীদের তুলনায় সস্তা।