সারাক্ষণ ডেস্ক
সারাংশ
১. ডিপসিক জনপ্রিয় হয়েছে এর শক্তিশালী এআই অ্যাসিস্ট্যান্ট টুলের জন্য। এটির কার্যক্রম চ্যাটজিপিটির মতই।
২. ডিপসিকের অ্যাপ তৈরিতে খরচ কম।
ডিপসিক নিয়ে উত্তেজনা, যার চ্যাটবট মার্কিন যুক্তরাষ্ট্রে আইফোনের ফ্রি অ্যাপ চার্টের শীর্ষে রয়েছে, নিউ ইয়র্কে চিপ ডেভেলপার এনভিডিয়ার বাজার মূলধন থেকে প্রায় ৬০০ বিলিয়ন ডলার মুছে ফেলতে সহায়তা করেছে, যা মার্কিন স্টক মার্কেটের ইতিহাসে একক দিনে সবচেয়ে বড় পতন, এআই-সম্পর্কিত হার্ডওয়্যারে ব্যাপক ব্যয়ের দিনগুলি শেষ হতে পারে এমন আশঙ্কার মধ্যে।
অ্যাপটি চীনে অপরিচিত ছিল না, যেখানে এর কম মূল্যের কারণে এটি “এআই-এর পিনডুওডুও” নামে পরিচিতি পেয়েছে, যা সস্তা ই-কমার্স প্ল্যাটফর্মের প্রতি ইঙ্গিত করে। গত সপ্তাহে, বিশ্বজুড়ে ব্যবহারকারীদের ব্যাপক বৃদ্ধির ফলে ডিপসিকের একাধিক সার্ভার বিভ্রাট ঘটেছে, তবে এটি কোম্পানিকে সোমবার গভীর রাতে তাদের নতুন, ওপেন-সোর্স মডেল জানুস-প্রো প্রকাশ করা থেকে বিরত করেনি। সর্বশেষ মডেলটি পূর্ববর্তী সংস্করণের তুলনায় উভয় মাল্টিমোডাল বোঝাপড়া এবং ভিজ্যুয়াল জেনারেশনে উল্লেখযোগ্য উন্নতির দাবি করে।
এখানে ডিপসিক সম্পর্কে চারটি বিষয় জানার মতো, যা রাতারাতি বিশ্বব্যাপী খ্যাতি অর্জন করেছে।
ডিপসিক কেন এত আলোড়ন সৃষ্টি করেছে?
সর্বোচ্চ ক্ষমতাসম্পন্ন, অত্যন্ত ব্যয়বহুল হার্ডওয়্যারের চাহিদা গত দুই বছরে এআই বুম এবং সম্পর্কিত স্টক মার্কেট র্যালির বেশিরভাগ অংশ চালিত করেছে। কম শক্তিশালী হার্ডওয়্যারের সাথে অনুরূপ কম্পিউটিং ফলাফল অর্জন করা গেলে, এটি বিনিয়োগকারীদের এনভিডিয়া এবং অন্যান্য চিপ নির্মাতাদের শেয়ারে বিনিয়োগের ভিত্তিকে দুর্বল করবে।
এবং এটাই ডিপসিক আর১ সম্পর্কে সিলিকন ভ্যালি এবং ওয়াল স্ট্রিটকে সবচেয়ে বেশি বিস্মিত করেছে, যা কোম্পানিটি গত সপ্তাহে প্রকাশ করেছে। চীনা কোম্পানিটি বলছে যে তারা একটি কম খরচের এআই পদ্ধতির অগ্রদূত, যা তাদের ইনফারেন্স পরিষেবাগুলিকে তাদের উচ্চক্ষমতাসম্পন্ন মার্কিন প্রতিদ্বন্দ্বীদের তুলনায় অনেক কম মূল্যে প্রদান করতে সক্ষম করে।
ইনফারেন্স বলতে এআই মডেল যখন ইনপুট প্রক্রিয়া করে এবং প্রতিক্রিয়া তৈরি করে, সেই পর্যায়কে বোঝায়, প্রাথমিক প্রশিক্ষণ পর্যায়ের বিপরীতে। আর১ প্রতি মিলিয়ন আউটপুট টোকেনের জন্য $২.১৯ খরচ করে, যা ওপেনএআই-এর ও১-এর তুলনায় প্রায় ৯৬% সস্তা, যা প্রতি মিলিয়ন আউটপুট টোকেনের জন্য $৬০ মূল্যে নির্ধারিত। টোকেন হল প্রাকৃতিক ভাষা প্রক্রিয়াকরণে ব্যবহৃত শব্দ বা শব্দের অংশ। একটি টোকেন প্রায় চারটি অক্ষর, বা ইংরেজিতে ০.৭৫ শব্দের সমান।
এনভিডিয়া ডিপসিকের অর্জনকে “একটি চমৎকার এআই অগ্রগতি এবং টেস্ট টাইম স্কেলিং (টিটিএস)-এর একটি নিখুঁত উদাহরণ” হিসাবে প্রশংসা করেছে, যা ধাপে ধাপে কঠিন সমস্যাগুলোর সমাধান করে ইনফারেন্স কর্মক্ষমতা উন্নত করে। এটি এআই কর্মক্ষমতা বৃদ্ধির প্রচলিত পদ্ধতির বিপরীতে, যা মডেলগুলিকে বড় করা বা দীর্ঘ সময়ের জন্য প্রশিক্ষণ দেওয়ার মাধ্যমে হয়।
ডিপসিকের প্রতিষ্ঠাতা লিয়াং ওয়েনফেং তার কোম্পানিকে অনেক অন্যান্য চীনা স্টার্টআপের তুলনায় আরও উদ্ভাবনী এবং উচ্চাভিলাষী হিসাবে প্রচার করেছেন।
যখন গত বছরের মে মাসে তাদের দ্বিতীয় প্রজন্মের ভি২ মডেলের প্রকাশ সিলিকন ভ্যালিতে আলোড়ন সৃষ্টি করেছিল, লিয়াং চীনা মিডিয়াকে বলেছিলেন যে “তারা বিস্মিত হয়েছিল কারণ এটি একটি চীনা কোম্পানি যা একটি উদ্ভাবনী অবদানকারী হিসাবে খেলায় প্রবেশ করছে।
তিনি আরও বলেছেন যে তার লক্ষ্য হল কৃত্রিম সাধারণ বুদ্ধিমত্তা (এজিআই) অর্জন করা, যা সীমিত সম্পদের সাথে কর্মক্ষমতা সর্বাধিক করতে নতুন মডেল আর্কিটেকচার উদ্ভাবনের প্রয়োজন হবে।
এর কম খরচের পদ্ধতি কী এবং এটি আসলে কতটা সস্তা তা নিয়ে কোনো সন্দেহ আছে কি?
ডিপসিকের মডেলগুলির মোট প্রশিক্ষণ খরচ কী তা স্পষ্ট নয়, তবে কোম্পানির দ্বারা প্রকাশিত ডিসেম্বরের একটি পেপারে বলা হয়েছে যে তাদের ভি৩ মডেলের জন্য এই সংখ্যা ছিল $৫.৬ মিলিয়ন। এটি উল্লেখযোগ্য যে এটি পূর্ববর্তী গবেষণা এবং পরীক্ষার সাথে সম্পর্কিত খরচগুলি অন্তর্ভুক্ত করে না।
তুলনার জন্য, ওপেনএআই-এর জিপিটি-৪-এর প্রশিক্ষণ খরচ $১০০ মিলিয়নের বেশি বলে অনুমান করা হয়।
ডিপসিকের সংখ্যা ২.৮ মিলিয়ন এইচ৮০০ জিপিইউ ঘণ্টার মোট ব্যবহার ভিত্তিক, প্রতি ঘণ্টায় $২ ভাড়ার হারে, পেপার অনুযায়ী, যা যোগ করেছে যে ফলাফলটি “অ্যালগরিদম, ফ্রেমওয়ার্ক এবং হার্ডওয়্যারের একটি অপ্টিমাইজড কো-ডিজাইন” এর মাধ্যমে অর্জিত হয়েছে।
কোম্পানিটি আরও বলেছে যে তারা গ্রুপ রিলেটিভ পলিসি অপটিমাইজেশন (জিআরপিও) নামে একটি কৌশল ব্যবহার করে রিইনফোর্সমেন্ট লার্নিং (আরএল) এর প্রশিক্ষণ খরচ কমিয়েছে। প্রচলিত আরএল পদ্ধতিগুলির জন্য একটি পলিসি মডেল, যা ক্রিয়াকলাপের সিদ্ধান্ত নেয়।