১১:৪০ অপরাহ্ন, মঙ্গলবার, ১৩ জানুয়ারী ২০২৬
“ভয়েস এআই বাজারে ডিপগ্রামের তেজি অগ্রযাত্রা” দাভোস সম্মেলনে নতুন বিশ্ব শৃঙ্খলা নিয়ে আলোচনা সরকারের অনুমোদন: এক কোটি লিটার সয়াবিন তেল ও ৪০ হাজার মেট্রিক টন সার কেনা ইরানে বিক্ষোভ দমনে সহিংসতা তীব্র, নিহতের সংখ্যা প্রায় দুই হাজারে পৌঁছানোর আশঙ্কা গ্যাস সংকট ও চাঁদাবাজিতে রেস্তোরাঁ ব্যবসা চালানো হয়ে উঠছে অসম্ভব সস্তা চিনিযুক্ত পানীয় ও অ্যালকোহলে বাড়ছে অসংক্রামক ব্যাধির ঝুঁকি রাজধানীতে স্ত্রীকে বেঁধে জামায়াত নেতাকে হত্যা হাসপাতালের অপারেশন থিয়েটারে রান্না রাজশাহী বিশ্ববিদ্যালয়ের সহকারী অধ্যাপকের বিরুদ্ধে ধর্ষণচেষ্টার মামলা টি–টোয়েন্টি বিশ্বকাপে বাংলাদেশের অংশগ্রহণ নিয়ে গভীর অনিশ্চয়তা

“ভয়েস এআই বাজারে ডিপগ্রামের তেজি অগ্রযাত্রা”

বিনিয়োগ ও নতুন অধিগ্রহণ
ভয়েস‑রেকগনিশন স্টার্ট‑আপ ডিপগ্রাম ১৩০ মিলিয়ন ডলারের সিরিজ সি বিনিয়োগ পেয়েছে এবং এর মূল্যায়ন দাঁড়িয়েছে ১.৩ বিলিয়ন ডলার। এই অর্থায়ন নেতৃত্ব দিয়েছে অ্যালুমনি ভেঞ্চারসের অংশীদার এভিপি; আগের বিনিয়োগকারীরা যেমন আলকিয়ন, ইন‑কিউ‑টেল, মাদ্রোনা, টাইগার, উইং ও ওয়াই কম্বিনেটরও যোগ দিয়েছে। নতুন অংশীদার হিসেবে কলম্বিয়া ইউনিভার্সিটি ও প্রিন্সভিল ক্যাপিটালসহ কয়েকটি প্রতিষ্ঠান এসেছে। বিনিয়োগকারীরা জানান, বিক্রয় ও গ্রাহকসেবায় স্বয়ংক্রিয় ভয়েস প্রযুক্তির চাহিদা দ্রুত বাড়ছে এবং বহু জনপ্রিয় অ্যাপ্লিকেশন ইতিমধ্যে ডিপগ্রামের সফটওয়্যার ব্যবহার করছে। মোট অর্থায়ন ২১৫ মিলিয়ন ডলারের বেশি হওয়ায় প্রতিষ্ঠানটি নিজেদেরকে বিশ্বব্যাপী নেতা হিসেবে প্রতিষ্ঠিত করতে চায়।

এই বিনিয়োগ তরঙ্গ দেখায়, ভয়েস প্রযুক্তি কত দ্রুত দৈনন্দিন জীবনে প্রবেশ করছে। প্রাকৃতিক ভাষা প্রক্রিয়াকরণ ও মেশিন লার্নিংয়ের অগ্রগতির ফলে সফটওয়্যার এখন উচ্চারণ বৈচিত্র্য ও বিশেষ শব্দভাণ্ডার বুঝতে পারে এবং বাস্তবসম্মত অডিও তৈরি করতে পারে। বিশ্লেষকেরা অনুমান করছেন যে ২০৩০ সালের মধ্যে ভয়েস এআই বাজারের আকার ১৪ বিলিয়ন থেকে ২০ বিলিয়ন ডলারে পৌঁছাতে পারে; ব্যবসা প্রতিষ্ঠানগুলো কল সেন্টার, বিক্রয় ও বিপণন স্বয়ংক্রিয় করতে এমন প্রযুক্তির ওপর নির্ভর করছে। সিসেমির ২৫০ মিলিয়ন ডলার ও ইলেভেনল্যাবসের ১৮০ মিলিয়ন ডলারের সাম্প্রতিক বিনিয়োগও এই উৎসাহের প্রমাণ। বিনিয়োগকারীরা মনে করছেন, জেনারেটিভ এআই মানুষের মতো কথোপকথন তৈরি করতে পারলে ভাষা‑ভিত্তিক ইন্টারফেস আগামী দিনের মুখ্য মাধ্যম হবে।

Deepgram's Enterprise Voice AI Accelerator Program | Deepgram

সেবা সম্প্রসারণ ও রেস্তোরাঁ খাতে নজর
ডিপগ্রাম শুরুতে দ্রুতগতির স্বয়ংক্রিয় স্পিচ‑টু‑টেক্সট সিস্টেম তৈরি করেছিল, যা স্বল্প বিলম্বে কথোপকথন লিপিবদ্ধ করতে পারে। এখন এটি স্পিচ‑টু‑টেক্সট ও টেক্সট‑টু‑স্পিচ উভয় মডেলই এপিআইয়ের মাধ্যমে সরবরাহ করে এবং টুইলিওসহ ১,৩০০‑এর বেশি গ্রাহক তাদের ব্যবহারে আছেন। প্রধান নির্বাহী স্কট স্টিফেনসন জানান, কোম্পানি ইতিমধ্যেই লাভজনক; নতুন অর্থায়নের লক্ষ্য বিশ্বের বিভিন্ন অঞ্চলে দ্রুত বিস্তার ও আরো ভাষার সমর্থন যোগ করা। সে লক্ষ্যে তারা ওয়াই কম্বিনেটর‑সমর্থিত অফওয়ান নামে একটি স্টার্ট‑আপ অধিগ্রহণ করেছে, যেটি দ্রুত খাবারের রেস্তোরাঁতে ৯৩ শতাংশ অর্ডার নির্ভুলতার দাবি করে। স্টিফেনসনের মতে, খাবার অর্ডার করার অভিজ্ঞতা ভয়েস এআইয়ের ক্ষেত্রে বেশিরভাগ মানুষের প্রথম ইতিবাচক ব্যবহার হতে পারে; এতে স্মার্টফোন বা স্ক্রিন ছাড়াই সহজে অর্ডার দেওয়া যায়।

নতুন পুঁজির সাহায্যে কোম্পানি আরও গবেষণা ও উন্নয়নে বিনিয়োগ করবে। স্টিফেনসন বলেন, ডিপগ্রামের মডেলগুলো সত্যিকারের কথোপকথনের জন্য ডিজাইন করা; শুধু ডিকটেশন নয়। তারা কল সেন্টার, পডকাস্ট ও অন্যান্য শোরগোলপূর্ণ পরিবেশের অডিও ব্যবহার করে নিউরাল নেটওয়ার্ক প্রশিক্ষণ দেয়, ফলে একাধিক বক্তা ও পেছনের শব্দ থাকার পরও কথোপকথন সঠিকভাবে লেখা ও অনুবাদ করা যায়। কোম্পানি টেক্সট‑টু‑স্পিচ সেবা দিয়েও অ্যাপ ডেভেলপারদের কথাও বলার সুযোগ করে দেয় – যা ভয়েস চ্যাটবট, বীমা দাবি নিবন্ধকরণ ও অনলাইন শপিং সহ নানা কাজে ব্যবহার হচ্ছে। স্বাস্থ্যসেবা ও আইনি খাতের জন্য বিশেষ শব্দভাণ্ডার বোঝার ক্ষমতাসম্পন্ন মডেল তাদের প্রতিদ্বন্দ্বীদের চেয়ে এগিয়ে রেখেছে।

Deepgram Accelerates Into 2025, Empowering 200,000+ Developers From  Startups to Global Enterprises to Build Voice AI

রেস্তোরাঁ শিল্পে প্রবেশের অর্থ ভয়েস এআই এখন কেবল পেছনের দপ্তর নয়, সরাসরি গ্রাহকের সামনে আসছে। দ্রুত খাবারের দোকানগুলো কর্মী সংকটে ভুগছে; তাই স্বয়ংক্রিয় ভয়েস কিয়স্ক তাদের জন্য আকর্ষণীয় হয়ে উঠেছে। অফওয়ানের প্রযুক্তির মাধ্যমে ক্রেতারা পর্দায় স্পর্শ না করে শুধু মুখে বলে অর্ডার দিতে পারেন, যা সময় বাঁচায় ও বিক্রয় বাড়াতে পারে। তবে এখানেও চ্যালেঞ্জ আছে: খাদ্য তালিকার বৈচিত্র্য, শব্দের উচ্চারণ ও ব্যস্ত রেস্তোরাঁর আওয়াজ ব্যবস্থাপনায় সমস্যা সৃষ্টি করতে পারে। স্টিফেনসন বলেছেন, কিছু প্রাথমিক পরীক্ষায় মজার ভুল হয়েছে – যেমন একটি এআই “nachos” শব্দকে “হাজার কাপ পানি” হিসেবে শুনে অর্ডার নিয়েছিল। কিন্তু তিনি আশ্বস্ত করেন, ডেটা বাড়ার সঙ্গে সঙ্গে নির্ভুলতা উন্নত হবে; ভবিষ্যতে ভয়েস সহকারী পরিচিত ক্রেতাদের পছন্দ মনে রাখতে পারবে এবং কর্মীদের অতিথি সেবায় আরও মনোযোগী হতে সাহায্য করবে।

Announcing Deepgram Saga: The Voice OS for Developers

এই বিনিয়োগ আরেকটি প্রতিযোগিতাপূর্ণ চিত্রও তুলে ধরে। অ্যামাজন ও গুগল বছরের পর বছর ধরে ভোক্তা‑মুখী ভয়েস সেবা প্রদান করছে, কিন্তু তারা মূলত ডিভাইস বিক্রির দিকে নজর দেয়। ডিপগ্রাম ব্যবসায়িক পর্যায়ে কাজ করে, অন্য কোম্পানিগুলোর তৈরি অ্যাপের পেছনে থাকা প্রযুক্তি হিসেবে থাকতে চায়। স্টিফেনসন বলেন, ডেভেলপারদের সঙ্গে কাজ করা তাদেরকে তথ্য গোপনীয়তা নিয়ে কম ঝুঁকিতে রাখে এবং বাজারের পরিবর্তনের সঙ্গে দ্রুত মানিয়ে নেওয়া যায়। এভিপির অংশীদার এলিজাবেথ ডে সাঁ ত‑আইনিয়ান উল্লেখ করেন, ডিপগ্রামের ব্যবসা‑টু‑ব্যবসা মডেল কর্পোরেট গ্রাহকদের নিয়ন্ত্রণের দাবি পূরণ করে। নতুন অর্থায়নের মাধ্যমে তারা আরও প্রকৌশলী নিয়োগ, ইউরোপ ও এশিয়ায় অফিস খোলা ও ইংরেজি ছাড়াও আরও ভাষার জন্য সমর্থন যোগ করার পরিকল্পনা করেছে। ভয়েস এআই যখন বিভিন্ন শিল্পে প্রবেশ করছে, তখন ডিপগ্রাম চায় যে ডেভেলপাররা যেখানেই মেশিনকে শুনতে ও কথা বলতে চাইবে – তারা ডিপগ্রামকে বেছে নেবে।

জনপ্রিয় সংবাদ

“ভয়েস এআই বাজারে ডিপগ্রামের তেজি অগ্রযাত্রা”

“ভয়েস এআই বাজারে ডিপগ্রামের তেজি অগ্রযাত্রা”

০৯:৪৩:৩৭ অপরাহ্ন, মঙ্গলবার, ১৩ জানুয়ারী ২০২৬

বিনিয়োগ ও নতুন অধিগ্রহণ
ভয়েস‑রেকগনিশন স্টার্ট‑আপ ডিপগ্রাম ১৩০ মিলিয়ন ডলারের সিরিজ সি বিনিয়োগ পেয়েছে এবং এর মূল্যায়ন দাঁড়িয়েছে ১.৩ বিলিয়ন ডলার। এই অর্থায়ন নেতৃত্ব দিয়েছে অ্যালুমনি ভেঞ্চারসের অংশীদার এভিপি; আগের বিনিয়োগকারীরা যেমন আলকিয়ন, ইন‑কিউ‑টেল, মাদ্রোনা, টাইগার, উইং ও ওয়াই কম্বিনেটরও যোগ দিয়েছে। নতুন অংশীদার হিসেবে কলম্বিয়া ইউনিভার্সিটি ও প্রিন্সভিল ক্যাপিটালসহ কয়েকটি প্রতিষ্ঠান এসেছে। বিনিয়োগকারীরা জানান, বিক্রয় ও গ্রাহকসেবায় স্বয়ংক্রিয় ভয়েস প্রযুক্তির চাহিদা দ্রুত বাড়ছে এবং বহু জনপ্রিয় অ্যাপ্লিকেশন ইতিমধ্যে ডিপগ্রামের সফটওয়্যার ব্যবহার করছে। মোট অর্থায়ন ২১৫ মিলিয়ন ডলারের বেশি হওয়ায় প্রতিষ্ঠানটি নিজেদেরকে বিশ্বব্যাপী নেতা হিসেবে প্রতিষ্ঠিত করতে চায়।

এই বিনিয়োগ তরঙ্গ দেখায়, ভয়েস প্রযুক্তি কত দ্রুত দৈনন্দিন জীবনে প্রবেশ করছে। প্রাকৃতিক ভাষা প্রক্রিয়াকরণ ও মেশিন লার্নিংয়ের অগ্রগতির ফলে সফটওয়্যার এখন উচ্চারণ বৈচিত্র্য ও বিশেষ শব্দভাণ্ডার বুঝতে পারে এবং বাস্তবসম্মত অডিও তৈরি করতে পারে। বিশ্লেষকেরা অনুমান করছেন যে ২০৩০ সালের মধ্যে ভয়েস এআই বাজারের আকার ১৪ বিলিয়ন থেকে ২০ বিলিয়ন ডলারে পৌঁছাতে পারে; ব্যবসা প্রতিষ্ঠানগুলো কল সেন্টার, বিক্রয় ও বিপণন স্বয়ংক্রিয় করতে এমন প্রযুক্তির ওপর নির্ভর করছে। সিসেমির ২৫০ মিলিয়ন ডলার ও ইলেভেনল্যাবসের ১৮০ মিলিয়ন ডলারের সাম্প্রতিক বিনিয়োগও এই উৎসাহের প্রমাণ। বিনিয়োগকারীরা মনে করছেন, জেনারেটিভ এআই মানুষের মতো কথোপকথন তৈরি করতে পারলে ভাষা‑ভিত্তিক ইন্টারফেস আগামী দিনের মুখ্য মাধ্যম হবে।

Deepgram's Enterprise Voice AI Accelerator Program | Deepgram

সেবা সম্প্রসারণ ও রেস্তোরাঁ খাতে নজর
ডিপগ্রাম শুরুতে দ্রুতগতির স্বয়ংক্রিয় স্পিচ‑টু‑টেক্সট সিস্টেম তৈরি করেছিল, যা স্বল্প বিলম্বে কথোপকথন লিপিবদ্ধ করতে পারে। এখন এটি স্পিচ‑টু‑টেক্সট ও টেক্সট‑টু‑স্পিচ উভয় মডেলই এপিআইয়ের মাধ্যমে সরবরাহ করে এবং টুইলিওসহ ১,৩০০‑এর বেশি গ্রাহক তাদের ব্যবহারে আছেন। প্রধান নির্বাহী স্কট স্টিফেনসন জানান, কোম্পানি ইতিমধ্যেই লাভজনক; নতুন অর্থায়নের লক্ষ্য বিশ্বের বিভিন্ন অঞ্চলে দ্রুত বিস্তার ও আরো ভাষার সমর্থন যোগ করা। সে লক্ষ্যে তারা ওয়াই কম্বিনেটর‑সমর্থিত অফওয়ান নামে একটি স্টার্ট‑আপ অধিগ্রহণ করেছে, যেটি দ্রুত খাবারের রেস্তোরাঁতে ৯৩ শতাংশ অর্ডার নির্ভুলতার দাবি করে। স্টিফেনসনের মতে, খাবার অর্ডার করার অভিজ্ঞতা ভয়েস এআইয়ের ক্ষেত্রে বেশিরভাগ মানুষের প্রথম ইতিবাচক ব্যবহার হতে পারে; এতে স্মার্টফোন বা স্ক্রিন ছাড়াই সহজে অর্ডার দেওয়া যায়।

নতুন পুঁজির সাহায্যে কোম্পানি আরও গবেষণা ও উন্নয়নে বিনিয়োগ করবে। স্টিফেনসন বলেন, ডিপগ্রামের মডেলগুলো সত্যিকারের কথোপকথনের জন্য ডিজাইন করা; শুধু ডিকটেশন নয়। তারা কল সেন্টার, পডকাস্ট ও অন্যান্য শোরগোলপূর্ণ পরিবেশের অডিও ব্যবহার করে নিউরাল নেটওয়ার্ক প্রশিক্ষণ দেয়, ফলে একাধিক বক্তা ও পেছনের শব্দ থাকার পরও কথোপকথন সঠিকভাবে লেখা ও অনুবাদ করা যায়। কোম্পানি টেক্সট‑টু‑স্পিচ সেবা দিয়েও অ্যাপ ডেভেলপারদের কথাও বলার সুযোগ করে দেয় – যা ভয়েস চ্যাটবট, বীমা দাবি নিবন্ধকরণ ও অনলাইন শপিং সহ নানা কাজে ব্যবহার হচ্ছে। স্বাস্থ্যসেবা ও আইনি খাতের জন্য বিশেষ শব্দভাণ্ডার বোঝার ক্ষমতাসম্পন্ন মডেল তাদের প্রতিদ্বন্দ্বীদের চেয়ে এগিয়ে রেখেছে।

Deepgram Accelerates Into 2025, Empowering 200,000+ Developers From  Startups to Global Enterprises to Build Voice AI

রেস্তোরাঁ শিল্পে প্রবেশের অর্থ ভয়েস এআই এখন কেবল পেছনের দপ্তর নয়, সরাসরি গ্রাহকের সামনে আসছে। দ্রুত খাবারের দোকানগুলো কর্মী সংকটে ভুগছে; তাই স্বয়ংক্রিয় ভয়েস কিয়স্ক তাদের জন্য আকর্ষণীয় হয়ে উঠেছে। অফওয়ানের প্রযুক্তির মাধ্যমে ক্রেতারা পর্দায় স্পর্শ না করে শুধু মুখে বলে অর্ডার দিতে পারেন, যা সময় বাঁচায় ও বিক্রয় বাড়াতে পারে। তবে এখানেও চ্যালেঞ্জ আছে: খাদ্য তালিকার বৈচিত্র্য, শব্দের উচ্চারণ ও ব্যস্ত রেস্তোরাঁর আওয়াজ ব্যবস্থাপনায় সমস্যা সৃষ্টি করতে পারে। স্টিফেনসন বলেছেন, কিছু প্রাথমিক পরীক্ষায় মজার ভুল হয়েছে – যেমন একটি এআই “nachos” শব্দকে “হাজার কাপ পানি” হিসেবে শুনে অর্ডার নিয়েছিল। কিন্তু তিনি আশ্বস্ত করেন, ডেটা বাড়ার সঙ্গে সঙ্গে নির্ভুলতা উন্নত হবে; ভবিষ্যতে ভয়েস সহকারী পরিচিত ক্রেতাদের পছন্দ মনে রাখতে পারবে এবং কর্মীদের অতিথি সেবায় আরও মনোযোগী হতে সাহায্য করবে।

Announcing Deepgram Saga: The Voice OS for Developers

এই বিনিয়োগ আরেকটি প্রতিযোগিতাপূর্ণ চিত্রও তুলে ধরে। অ্যামাজন ও গুগল বছরের পর বছর ধরে ভোক্তা‑মুখী ভয়েস সেবা প্রদান করছে, কিন্তু তারা মূলত ডিভাইস বিক্রির দিকে নজর দেয়। ডিপগ্রাম ব্যবসায়িক পর্যায়ে কাজ করে, অন্য কোম্পানিগুলোর তৈরি অ্যাপের পেছনে থাকা প্রযুক্তি হিসেবে থাকতে চায়। স্টিফেনসন বলেন, ডেভেলপারদের সঙ্গে কাজ করা তাদেরকে তথ্য গোপনীয়তা নিয়ে কম ঝুঁকিতে রাখে এবং বাজারের পরিবর্তনের সঙ্গে দ্রুত মানিয়ে নেওয়া যায়। এভিপির অংশীদার এলিজাবেথ ডে সাঁ ত‑আইনিয়ান উল্লেখ করেন, ডিপগ্রামের ব্যবসা‑টু‑ব্যবসা মডেল কর্পোরেট গ্রাহকদের নিয়ন্ত্রণের দাবি পূরণ করে। নতুন অর্থায়নের মাধ্যমে তারা আরও প্রকৌশলী নিয়োগ, ইউরোপ ও এশিয়ায় অফিস খোলা ও ইংরেজি ছাড়াও আরও ভাষার জন্য সমর্থন যোগ করার পরিকল্পনা করেছে। ভয়েস এআই যখন বিভিন্ন শিল্পে প্রবেশ করছে, তখন ডিপগ্রাম চায় যে ডেভেলপাররা যেখানেই মেশিনকে শুনতে ও কথা বলতে চাইবে – তারা ডিপগ্রামকে বেছে নেবে।