উন্নত চিপ ছাড়াই এআইকে ৮৫ শতাংশ দ্রুত করার দাবি ডিপসিকের

· Prothom Alo

কৃত্রিম বুদ্ধিমত্তা (এআই) প্রযুক্তির দ্রুত বিস্তারের সঙ্গে পাল্লা দিয়ে বাড়ছে কম্পিউটারের সক্ষমতার চাহিদা। লার্জ ল্যাঙ্গুয়েজভিত্তিক এআই মডেল চালাতে ডেটা সেন্টারগুলোকে ব্যবহার করতে হচ্ছে হাজার হাজার অত্যাধুনিক গ্রাফিকস প্রসেসিং ইউনিট (জিপিইউ)। তবে যুক্তরাষ্ট্রের রপ্তানি নিষেধাজ্ঞার কারণে এনভিডিয়ার উন্নত এআই চিপের নাগাল পাচ্ছে না চীনের অনেক প্রযুক্তিপ্রতিষ্ঠান। এই পরিস্থিতিতে চীনা এআই স্টার্টআপ ডিপসিক দাবি করেছে, তারা এমন একটি প্রযুক্তি তৈরি করেছে, যা অত্যাধুনিক চিপ ছাড়াই এআই মডেলের গতি উল্লেখযোগ্যভাবে বাড়াতে পারে।

Visit biznow.biz for more information.

সম্প্রতি নিজেদের ভি৪ মডেল পরিবারের জন্য ‘ডিএসপার্ক’ নামের একটি নতুন ফ্রেমওয়ার্ক উন্মুক্ত করেছে ডিপসিক। প্রতিষ্ঠানটির দাবি, এই প্রযুক্তির মাধ্যমে এআই মডেলের প্রতিক্রিয়ার গতি সর্বোচ্চ ৮৫ শতাংশ পর্যন্ত বাড়ানো সম্ভব। অর্থাৎ আগে একটি জিপিইউ যদি ১০০ ব্যবহারকারীর প্রশ্নের উত্তর দিতে পারত, এখন একই হার্ডওয়্যার প্রায় ১৮৫টি প্রশ্নের উত্তর দিতে পারবে। ডিপসিকের তথ্য অনুযায়ী, ডিএসপার্ক মূলত এআই ইনফারেন্সের গতি বাড়ানোর জন্য তৈরি করা হয়েছে। ব্যবহারকারীর প্রশ্নের উত্তর তৈরি করতে এআই মডেলের যে সময় লাগে, সেটিই ইনফারেন্স নামে পরিচিত। বর্তমানে বৃহৎ পরিসরে এআই সেবা পরিচালনার ক্ষেত্রে এই ধাপ অন্যতম বড় চ্যালেঞ্জ। সাধারণত এআই মডেলগুলো একবারে একটি টোকেন তৈরি করে। দীর্ঘ উত্তর তৈরির ক্ষেত্রে এ প্রক্রিয়া ধীর হয়ে পড়ে এবং জিপিইউর ওপর বাড়তি চাপ সৃষ্টি করে। টোকেন হলো এআই মডেলের তথ্য প্রক্রিয়াকরণের মৌলিক একক। একটি মডেল যত বেশি তথ্য তৈরি বা বিশ্লেষণ করবে, তত বেশি টোকেন ব্যবহার হবে। এই সীমাবদ্ধতা কাটিয়ে উঠতে ডিএসপার্কে ব্যবহার করা হয়েছে ‘স্পেকুলেটিভ ডিকোডিং’ পদ্ধতি। এতে একটি ছোট ও তুলনামূলক হালকা মডেল প্রথমে সম্ভাব্য উত্তর দ্রুত তৈরি করে। এরপর মূল বা বড় মডেল সেই উত্তরগুলো একসঙ্গে যাচাই করে। অর্থাৎ উত্তর তৈরির প্রাথমিক কাজটি করে ছোট মডেল, আর বড় মডেল নিশ্চিত করে উত্তরটি সঠিক কি না।

ছোট মডেলের তৈরি করা উত্তর সঠিক হলে সিস্টেম সরাসরি পরবর্তী ধাপে চলে যায়। আর ভুল হলে প্রচলিত পদ্ধতিতে ফিরে গিয়ে নতুন করে উত্তর তৈরি করা হয়। ডিপসিকের দাবি, অধিকাংশ টোকেনই তুলনামূলক সহজে অনুমান করা যায়। ফলে অনেক ক্ষেত্রেই পুরো উত্তর নতুন করে তৈরি করতে হয় না, আর তাতেই উল্লেখযোগ্যভাবে কমে আসে প্রতিক্রিয়া তৈরির সময়।

পুরো প্রক্রিয়াটি জিপিইউতেই সম্পন্ন হয়, কোনো কাজ সিপিইউয়ে স্থানান্তর করা হয় না। এ ছাড়া ডিএসপার্কে ‘সেমি–অটোরিগ্রেসিভ জেনারেশন’ প্রযুক্তিও ব্যবহার করা হয়েছে। এতে একবারে একটি টোকেনের পরিবর্তে একসঙ্গে কয়েকটি টোকেন তৈরি করা যায়, ফলে উত্তর তৈরির গতি আরও বাড়ে।

ডিপসিক ও পিকিং বিশ্ববিদ্যালয়ের যৌথ উদ্যোগে পরিচালিত এ গবেষণার ফলাফল উন্মুক্ত করা হয়েছে। প্রতিষ্ঠানটি গিটহাব ও হাগিং ফেসে ডিএসপার্কের গবেষণাপত্র ও প্রযুক্তিগত তথ্য প্রকাশ করেছে। তবে ডিপসিকের মতে, ডিএসপার্ক কোনো এআই মডেলের মৌলিক সক্ষমতা বাড়ায় না। অতিরিক্ত কম্পিউটিং অবকাঠামোয় বড় বিনিয়োগ ছাড়াই বিদ্যমান হার্ডওয়্যার থেকে আরও ভালো কর্মক্ষমতা পাওয়ার সুযোগ তৈরি করতে পারে। প্রতিষ্ঠানটি গুগল ডিপমাইন্ডের জেমা ও আলিবাবার কিউওয়েনসহ কয়েকটি উন্মুক্ত এআই মডেলে এ প্রযুক্তি পরীক্ষা করেছে। ফলে প্রযুক্তিটির সুবিধা শুধু ডিপসিকের মডেলেই সীমাবদ্ধ থাকবে না, অন্যান্য এআই মডেলেও এটি ব্যবহার করা যেতে পারে বলে ধারণা করা হচ্ছে।

এমন সময়ে ডিপসিকের এ ঘোষণা এল, যখন বিশ্বের বড় প্রযুক্তিপ্রতিষ্ঠানগুলো ডেটা সেন্টারের কম্পিউটিং সক্ষমতা বাড়াতে বিলিয়ন বিলিয়ন ডলার বিনিয়োগ করছে। অন্যদিকে ব্যয় নিয়ন্ত্রণে রাখতে উবার ও ওয়ালমার্টের মতো কিছু প্রতিষ্ঠান কর্মীদের এআই টোকেন ব্যবহারের ওপর সীমাবদ্ধতাও আরোপ করেছে।

চলতি বছরের এপ্রিলে ডিপসিক ‘ভি৪ প্রিভিউ’ উন্মুক্ত করে। এক মিলিয়ন কনটেক্সট ইনপুট ব্যবস্থাপনায় মডেলটিকে তুলনামূলক সাশ্রয়ী বিকল্প হিসেবে উপস্থাপন করা হয়। প্রতিষ্ঠানটির তথ্যমতে, ভি৪–প্রো সংস্করণটি বেশি কর্মক্ষমতার জন্য তৈরি করা হয়েছে, আর ভি৪–ফ্ল্যাশ সংস্করণটি দ্রুত ও কম খরচে ব্যবহারের উপযোগী করে তৈরি করা হয়েছে।

অবশ্য এআইয়ের প্রতিক্রিয়ার গতি বাড়ানোর প্রতিযোগিতায় ডিপসিক একা নয়। চলতি মাসের শুরুতে শাওমির এআই দল জানিয়েছে, তাদের মিমো–ভি২.৫–প্রো–আলট্রাস্পিড মডেলের আউটপুট গতি প্রতি সেকেন্ডে এক হাজারের বেশি টোকেনে উন্নীত করা হয়েছে, যা বর্তমানে এআই–শিল্পের দ্রুততম গতিগুলোর একটি।

সূত্র: ইন্ডিয়া টুডে

Read full story at source