বিনিয়োগ ও নতুন অধিগ্রহণ
ভয়েস‑রেকগনিশন স্টার্ট‑আপ ডিপগ্রাম ১৩০ মিলিয়ন ডলারের সিরিজ সি বিনিয়োগ পেয়েছে এবং এর মূল্যায়ন দাঁড়িয়েছে ১.৩ বিলিয়ন ডলার। এই অর্থায়ন নেতৃত্ব দিয়েছে অ্যালুমনি ভেঞ্চারসের অংশীদার এভিপি; আগের বিনিয়োগকারীরা যেমন আলকিয়ন, ইন‑কিউ‑টেল, মাদ্রোনা, টাইগার, উইং ও ওয়াই কম্বিনেটরও যোগ দিয়েছে। নতুন অংশীদার হিসেবে কলম্বিয়া ইউনিভার্সিটি ও প্রিন্সভিল ক্যাপিটালসহ কয়েকটি প্রতিষ্ঠান এসেছে। বিনিয়োগকারীরা জানান, বিক্রয় ও গ্রাহকসেবায় স্বয়ংক্রিয় ভয়েস প্রযুক্তির চাহিদা দ্রুত বাড়ছে এবং বহু জনপ্রিয় অ্যাপ্লিকেশন ইতিমধ্যে ডিপগ্রামের সফটওয়্যার ব্যবহার করছে। মোট অর্থায়ন ২১৫ মিলিয়ন ডলারের বেশি হওয়ায় প্রতিষ্ঠানটি নিজেদেরকে বিশ্বব্যাপী নেতা হিসেবে প্রতিষ্ঠিত করতে চায়।
এই বিনিয়োগ তরঙ্গ দেখায়, ভয়েস প্রযুক্তি কত দ্রুত দৈনন্দিন জীবনে প্রবেশ করছে। প্রাকৃতিক ভাষা প্রক্রিয়াকরণ ও মেশিন লার্নিংয়ের অগ্রগতির ফলে সফটওয়্যার এখন উচ্চারণ বৈচিত্র্য ও বিশেষ শব্দভাণ্ডার বুঝতে পারে এবং বাস্তবসম্মত অডিও তৈরি করতে পারে। বিশ্লেষকেরা অনুমান করছেন যে ২০৩০ সালের মধ্যে ভয়েস এআই বাজারের আকার ১৪ বিলিয়ন থেকে ২০ বিলিয়ন ডলারে পৌঁছাতে পারে; ব্যবসা প্রতিষ্ঠানগুলো কল সেন্টার, বিক্রয় ও বিপণন স্বয়ংক্রিয় করতে এমন প্রযুক্তির ওপর নির্ভর করছে। সিসেমির ২৫০ মিলিয়ন ডলার ও ইলেভেনল্যাবসের ১৮০ মিলিয়ন ডলারের সাম্প্রতিক বিনিয়োগও এই উৎসাহের প্রমাণ। বিনিয়োগকারীরা মনে করছেন, জেনারেটিভ এআই মানুষের মতো কথোপকথন তৈরি করতে পারলে ভাষা‑ভিত্তিক ইন্টারফেস আগামী দিনের মুখ্য মাধ্যম হবে।
সেবা সম্প্রসারণ ও রেস্তোরাঁ খাতে নজর
ডিপগ্রাম শুরুতে দ্রুতগতির স্বয়ংক্রিয় স্পিচ‑টু‑টেক্সট সিস্টেম তৈরি করেছিল, যা স্বল্প বিলম্বে কথোপকথন লিপিবদ্ধ করতে পারে। এখন এটি স্পিচ‑টু‑টেক্সট ও টেক্সট‑টু‑স্পিচ উভয় মডেলই এপিআইয়ের মাধ্যমে সরবরাহ করে এবং টুইলিওসহ ১,৩০০‑এর বেশি গ্রাহক তাদের ব্যবহারে আছেন। প্রধান নির্বাহী স্কট স্টিফেনসন জানান, কোম্পানি ইতিমধ্যেই লাভজনক; নতুন অর্থায়নের লক্ষ্য বিশ্বের বিভিন্ন অঞ্চলে দ্রুত বিস্তার ও আরো ভাষার সমর্থন যোগ করা। সে লক্ষ্যে তারা ওয়াই কম্বিনেটর‑সমর্থিত অফওয়ান নামে একটি স্টার্ট‑আপ অধিগ্রহণ করেছে, যেটি দ্রুত খাবারের রেস্তোরাঁতে ৯৩ শতাংশ অর্ডার নির্ভুলতার দাবি করে। স্টিফেনসনের মতে, খাবার অর্ডার করার অভিজ্ঞতা ভয়েস এআইয়ের ক্ষেত্রে বেশিরভাগ মানুষের প্রথম ইতিবাচক ব্যবহার হতে পারে; এতে স্মার্টফোন বা স্ক্রিন ছাড়াই সহজে অর্ডার দেওয়া যায়।
নতুন পুঁজির সাহায্যে কোম্পানি আরও গবেষণা ও উন্নয়নে বিনিয়োগ করবে। স্টিফেনসন বলেন, ডিপগ্রামের মডেলগুলো সত্যিকারের কথোপকথনের জন্য ডিজাইন করা; শুধু ডিকটেশন নয়। তারা কল সেন্টার, পডকাস্ট ও অন্যান্য শোরগোলপূর্ণ পরিবেশের অডিও ব্যবহার করে নিউরাল নেটওয়ার্ক প্রশিক্ষণ দেয়, ফলে একাধিক বক্তা ও পেছনের শব্দ থাকার পরও কথোপকথন সঠিকভাবে লেখা ও অনুবাদ করা যায়। কোম্পানি টেক্সট‑টু‑স্পিচ সেবা দিয়েও অ্যাপ ডেভেলপারদের কথাও বলার সুযোগ করে দেয় – যা ভয়েস চ্যাটবট, বীমা দাবি নিবন্ধকরণ ও অনলাইন শপিং সহ নানা কাজে ব্যবহার হচ্ছে। স্বাস্থ্যসেবা ও আইনি খাতের জন্য বিশেষ শব্দভাণ্ডার বোঝার ক্ষমতাসম্পন্ন মডেল তাদের প্রতিদ্বন্দ্বীদের চেয়ে এগিয়ে রেখেছে।

রেস্তোরাঁ শিল্পে প্রবেশের অর্থ ভয়েস এআই এখন কেবল পেছনের দপ্তর নয়, সরাসরি গ্রাহকের সামনে আসছে। দ্রুত খাবারের দোকানগুলো কর্মী সংকটে ভুগছে; তাই স্বয়ংক্রিয় ভয়েস কিয়স্ক তাদের জন্য আকর্ষণীয় হয়ে উঠেছে। অফওয়ানের প্রযুক্তির মাধ্যমে ক্রেতারা পর্দায় স্পর্শ না করে শুধু মুখে বলে অর্ডার দিতে পারেন, যা সময় বাঁচায় ও বিক্রয় বাড়াতে পারে। তবে এখানেও চ্যালেঞ্জ আছে: খাদ্য তালিকার বৈচিত্র্য, শব্দের উচ্চারণ ও ব্যস্ত রেস্তোরাঁর আওয়াজ ব্যবস্থাপনায় সমস্যা সৃষ্টি করতে পারে। স্টিফেনসন বলেছেন, কিছু প্রাথমিক পরীক্ষায় মজার ভুল হয়েছে – যেমন একটি এআই “nachos” শব্দকে “হাজার কাপ পানি” হিসেবে শুনে অর্ডার নিয়েছিল। কিন্তু তিনি আশ্বস্ত করেন, ডেটা বাড়ার সঙ্গে সঙ্গে নির্ভুলতা উন্নত হবে; ভবিষ্যতে ভয়েস সহকারী পরিচিত ক্রেতাদের পছন্দ মনে রাখতে পারবে এবং কর্মীদের অতিথি সেবায় আরও মনোযোগী হতে সাহায্য করবে।

এই বিনিয়োগ আরেকটি প্রতিযোগিতাপূর্ণ চিত্রও তুলে ধরে। অ্যামাজন ও গুগল বছরের পর বছর ধরে ভোক্তা‑মুখী ভয়েস সেবা প্রদান করছে, কিন্তু তারা মূলত ডিভাইস বিক্রির দিকে নজর দেয়। ডিপগ্রাম ব্যবসায়িক পর্যায়ে কাজ করে, অন্য কোম্পানিগুলোর তৈরি অ্যাপের পেছনে থাকা প্রযুক্তি হিসেবে থাকতে চায়। স্টিফেনসন বলেন, ডেভেলপারদের সঙ্গে কাজ করা তাদেরকে তথ্য গোপনীয়তা নিয়ে কম ঝুঁকিতে রাখে এবং বাজারের পরিবর্তনের সঙ্গে দ্রুত মানিয়ে নেওয়া যায়। এভিপির অংশীদার এলিজাবেথ ডে সাঁ ত‑আইনিয়ান উল্লেখ করেন, ডিপগ্রামের ব্যবসা‑টু‑ব্যবসা মডেল কর্পোরেট গ্রাহকদের নিয়ন্ত্রণের দাবি পূরণ করে। নতুন অর্থায়নের মাধ্যমে তারা আরও প্রকৌশলী নিয়োগ, ইউরোপ ও এশিয়ায় অফিস খোলা ও ইংরেজি ছাড়াও আরও ভাষার জন্য সমর্থন যোগ করার পরিকল্পনা করেছে। ভয়েস এআই যখন বিভিন্ন শিল্পে প্রবেশ করছে, তখন ডিপগ্রাম চায় যে ডেভেলপাররা যেখানেই মেশিনকে শুনতে ও কথা বলতে চাইবে – তারা ডিপগ্রামকে বেছে নেবে।
সারাক্ষণ রিপোর্ট 


















