ডিজিটাল যুগে বিলীন হওয়ার পথে ক্ষুদ্র ভাষাগুলো
ক্রিট্রিম বুদ্ধিমত্তা বা এআই বিলুপ্তপ্রায় ভাষা রক্ষায় নতুন সম্ভাবনা তৈরি করলেও বাস্তবে চ্যালেঞ্জ কম নয়। স্থানীয় মানুষের সক্রিয় অংশগ্রহণ না থাকলে আদিবাসী ও আঞ্চলিক ভাষা ডিজিটাল জগৎ থেকে হারিয়ে যাওয়ার ঝুঁকিতে পড়ছে। জাতিসংঘ বলছে, বিশ্বের প্রায় চল্লিশ শতাংশ ভাষা বিলুপ্তির মুখে। এই প্রেক্ষাপটে প্রশ্ন উঠছে—এআই কি সত্যিই এই ধারা থামাতে পারবে?
ইংরেজিভিত্তিক ডেটা পুরো প্রক্রিয়াকে একপেশে করছে
সবচেয়ে বড় বাধা হলো মানসম্মত ডেটার অভাব। বড় আকারের লার্জ ল্যাঙ্গুয়েজ মডেল প্রশিক্ষণে বিপুল পরিমাণ উপকরণ প্রয়োজন হয়, যার অধিকাংশই ইংরেজি ভাষায়। ফলে কম-সম্পদ ভিত্তিক ভাষা, বিশেষত আঞ্চলিক উপভাষা বা আদিবাসী ভাষা গুলো, এআই সিস্টেমে সমানভাবে স্থান পাচ্ছে না। স্ট্যানফোর্ডের মানবকেন্দ্রিক এআই ইনস্টিটিউটের গবেষণায় দেখা গেছে, বেশির ভাগ বড় মডেল অ-ইংরেজি ভাষা বোঝার ক্ষেত্রে দুর্বল পারফর্ম করে।
প্রযুক্তিগত সমতা না থাকলে বাড়ে নিরাপত্তা ঝুঁকি
শুধু সাংস্কৃতিক ক্ষতি নয়, ভাষাগত বৈষম্য এআই নিরাপত্তার জন্যও হুমকি তৈরি করছে। এক গবেষণায় দেখা যায়, কিছু বিপজ্জনক প্রশ্ন ইংরেজি বা চাইনিজ ভাষায় করতেই সতর্ক সংকেত দেয় এআই। কিন্তু একই প্রশ্ন থাই বা সুয়াহিলি ভাষায় করলে নিরাপত্তা ব্যবস্থা ঠিকমতো কাজ করে না। গবেষকরা বলেছেন, কম পরিচিত ভাষায় অনুবাদ করে ক্ষতিকর নির্দেশ অ্যালগরিদমের ভেতর ঢুকিয়ে দেওয়া সহজ হয়ে যায়। বড় কোম্পানিগুলো নিরাপত্তা জোরদারে কাজ করলেও ভাষাগত শূন্যতা এখনো বড় দুর্বলতা।
এশিয়ায় ভাষাভিত্তিক নিজস্ব এআই মডেল তৈরির তাগিদ
এশিয়ার বহুভাষিক দেশগুলো নিজেদের ভাষাগত পরিচয় বজায় রাখতে সার্বভৌম এআই নির্মাণে এগিয়ে আসছে। সিঙ্গাপুরের রাষ্ট্র-সমর্থিত এসইএ-লাইওন মডেল এখন ডজনের বেশি স্থানীয় ভাষা সমর্থন করছে। মালয়েশিয়ার ইউনিভার্সিটি অব মালয়া ‘ইলমু’ নামে বহুমাধ্যম বোঝার ক্ষমতা সম্পন্ন একটি মডেল চালু করেছে, যা স্থানীয় ছবি, শব্দ ও আঞ্চলিক সংকেত অনেক ভালোভাবে শনাক্ত করতে পারে। এসব প্রচেষ্টায় প্রমাণ হয়েছে, একটি ভাষা বা জনগোষ্ঠীকে সঠিকভাবে উপস্থাপন করতে প্রশিক্ষণ উপকরণের সূক্ষ্মতম বিষয়ও গুরুত্বপূর্ণ।

ডেটার পরিমাণ নয়, মানই সবচেয়ে বড় চ্যালেঞ্জ
বিশ্বের সাত হাজার ভাষার মধ্যে মাত্র পাঁচ শতাংশ ভাষারই অর্থবহ ডিজিটাল উপস্থিতি রয়েছে। বহু ভাষায় অনলাইনে পাওয়া তথ্য সীমাবদ্ধ ধর্মীয় গ্রন্থ বা ভুল অনুবাদের উইকিপিডিয়া পাতায়। ভুল ডেটা দিয়ে মডেল তৈরি হলে ভুল ফলাফল জন্ম নেবে। ইন্দোনেশিয়ার ওরাং রিম্বা সম্প্রদায়ের ভাষা রক্ষায় মেটার স্পিচ রিকগনিশন মডেল ব্যবহার করা হলেও সীমিত ডেটাসেট বড় বাধা হয়ে দাঁড়িয়েছে। গবেষকরা বলছেন, এই সীমাবদ্ধতা দূর করতে স্থানীয় জনগোষ্ঠীর অংশগ্রহণ ছাড়া উপায় নেই।
নিউজিল্যান্ড দেখিয়েছে টেকসই পথ
মাওরি ভাষা সংরক্ষণে নিউজিল্যান্ডের টে হিকু মিডিয়া দীর্ঘদিন ধরে কমিউনিটির প্রবীণ, স্থানীয় বক্তা ও শিক্ষার্থীদের সঙ্গে কাজ করে বিশাল ডেটা সংগ্রহ করেছে। পাশাপাশি তারা এমন লাইসেন্সিং কাঠামো তৈরি করেছে যাতে ভাষার মালিকানা সম্প্রদায়ের হাতেই থাকে—বড় প্রযুক্তি প্রতিষ্ঠানের নয়। এই মডেল দেখায়, ভাষা সংরক্ষণে প্রযুক্তি যেমন জরুরি, তেমনি মানুষের নেতৃত্ব আরও জরুরি।
কমিউনিটির নেতৃত্ব ছাড়া এআই ভাষা রক্ষায় ব্যর্থই হবে
বিশ্বের ক্ষুদ্র ও বিলুপ্তপ্রায় ভাষা সংরক্ষণে প্রযুক্তিগত সমাধান যথেষ্ট নয়। ডেটা সংগ্রহ, যাচাই, সঠিক প্রয়োগ—সবকিছুতেই কমিউনিটির নেতৃত্ব প্রয়োজন। নইলে এআই কোম্পানিগুলো অনিচ্ছাকৃত ভাবেই এই ভাষাগুলোর বিলুপ্তি আরও ত্বরান্বিত করে ফেলতে পারে।
#এআই #বিলুপ্তপ্রায়_ভাষা #ডিজিটাল_ভাষা_সংরক্ষণ #কমিউনিটি_ডেটা #ভাষা_সংকট #এশিয়া_টেক #এলএলএম #এআই_নিরাপত্তা #মাওরি_ভাষা #ডেটা_মান #সার্বভৌম_এআই
সারাক্ষণ রিপোর্ট 



















