আলোড়ন সৃষ্টিকারী কৃত্তিম বুদ্ধিমত্তা মডেল DeepSeek
DeepSeek কি?
DeepSeek চীন দেশের একটি কৃত্তিম বুদ্ধিমত্তা প্রতিষ্ঠান। এর সদর দপ্তর দক্ষিণ পূর্ব চীনের হাংঝু শহরে। এটি ২০২৩ সালের জুলাইয়ে প্রতিষ্ঠিত হয়। DeepSeek R1 অ্যাপ টি যুক্তরাষ্ট্রে ২০ জানুয়ারি মুক্তি পায়। এর শক্তিশালী এ আই অ্যাসিস্ট্যান্ট চ্যাট জিপিটির মতই কাজ করে। এটি বিভিন্ন প্রশ্নের উত্তর দিতে বিশেষ পারদর্শী। মডেলটি গণিত, কোডিং এবং সাধারণ জ্ঞান এর বিভিন্ন কাজে পারদর্শী।
DeepSeek এর প্রতিষ্ঠাতা কে?
Liang Wenfeng, Co founder of Highflyer, CEO of Deep seek.
কেন আলোচনার শীর্ষে?
২৭ জানুয়ারি ২০২৫ সালে অ্যাপল এর অ্যাপস্টোরে ডাউনলোড এর তালিকায় শীর্ষে চলে আসে DeepSeek অ্যাপ।
উল্লেখযোগ্য বৈশিষ্ট্য সমূহ কি কি?
DeepSeek এর উল্লেখযোগ্য বৈশিষ্ট্যসমূহ নিম্নরুপঃ
• DeepSeek এ ব্যবহৃত কোডগুলো ওপেন সোর্স করে রাখা অর্থাৎ যে কেউ কোডগুলো ব্যবহার করতে পারে।
• বিনামূল্যে ব্যবহারের সুযোগ। ডাটা ব্যবহারের জন্য কোন মূল্য পরিশোধ করতে হয় না।
• মডেলটির অনন্য দক্ষতা বিশেষ করে গণিত, কোডিং, সাধারণ জ্ঞানের ক্ষেত্রে অন্যান্য মডেলের চেয়ে অনেক অগ্রগামী।
কিভাবে পাওয়া যাবে?
অ্যাপল এর অ্যাপ স্টোর ও DeepSeek এর ওয়েবসাইটে (www.deepseek.com) অ্যাপটি পাওয়া যাচ্ছে সম্পূর্ণ বিনামূল্যে।
তৈরি খরচ কেমন?
DeepSeek ৬০ লাখ ডলার ২০০ জনেরও কম সদস্যের টিম এটি তৈরি করেছে। অন্যান্য একই ধরণের মডেলের চেয়ে ৯৭% মূল্য সাশ্রয়ী।
অনন্য গুণাবলীঃ
DeepSeek ১৪.৮ ট্রিলিয়ন টোকেন কে প্রশিক্ষিত করে ফেলেছে ইতোমধ্যে যা সত্যিই অকল্পনীয়। যেখানে চ্যাটজিপিটি করেছে ২ ট্রিলিয়ন এবং জেমিনি ১ ট্রিলিয়নের কাছাকাছি। পুরো আমেরিকায় যতগুলো জিপিটি মডেল রয়েছে DeepSeek এর অর্ধেক পরিমাণ ও প্রশিক্ষিত করতে পারে নাই। মূলত Deep Learning নিয়ে বেশি কাজ করার কারণেই DeepSeek এত বেশি শক্তিশালী। তারা হার্ডওয়্যার এর চেয়ে সফটওয়্যার কে বেশি প্রাধান্য দিয়েছে।
DeepSeek প্রতিটি জিনিস গ্রাউন্ড ওয়ার্ক এর মাধ্যমে শুরু করে। এর কিছু বিশেষ গুণাবলী নিম্নে উল্লেখ করা হলোঃ
১। Decimal Place গতানুগতিক এ আই মডেল প্রতিটি সংখ্যা ৩২ টি Decimal Place এ লিখে। কিন্তু DeepSeek ৮ টি Decimal Place লিখে। এতে করেও দেখা যায় যে ফলাফল যথেষ্ট সঠিক হয় এবং ৭৫ ভাগ কম মেমোরি খরচ হয়।
২। Multi Token System: গতানুগতিক এআই শব্দ কে ছোট ছোট টোকেন বা অংশে বিভক্ত করে পড়ে তারপর সিদ্ধান্ত দেয়। কিন্তু DeepSeek একটি বাক্য বা বাক্যাংশকে একসাথে পড়ে তারপর সিদ্ধান্ত দেয়। এজন্য সে কম সময়ে বেশি করে পড়ে সিদ্ধান্ত দিতে পারে। যেমন একজন ভাল ছাত্র যেভাবে একসাথে দ্রুত পড়ে পড়া মুখস্থ করতে পারে বিষয়টি অনেকটা সেরকম। এ পদ্ধতি দ্বিগুণ গতিতে কাজটি সম্পন্ন করতে পারে এবং শতকরা ৯০ ভাগ সঠিক ফলাফল দেয়। যখন এ পদ্ধতি বিলিয়ন বিলিয়ন শব্দের উপর প্রয়োগ করা হয় তখন তা DeepSeek R1 কে অনেক গতি এনে দেয়।
৩। Parameter: গতানুগতিক এ আই মডেল সব সময় মিলে ১.৮ ট্রিলিয়ন Parameter ব্যবহার করে। Parameter হচ্ছে একটি এ আই মডেলের বিল্ডিং ব্লক। এটি এমন একটি সেটিং যা নির্ধারণ করে কিভাবে ট্রান্সফর্মার কাজ করবে। DeepSeek এ ৬৭১ বিলিয়ন প্যারামিটার রয়েছে যার মধ্যে একসাথে ৩৭ বিলিয়ন সক্রিয় থাকে। এতে অনেক সময় ও শক্তি সাশ্রয় হয়।