

কৃত্রিম বুদ্ধিমত্তা (এআই) প্রযুক্তিনির্ভর ভয়েস এজেন্টের কার্যকারিতা উন্নত করতে নতুন অডিও মডেল তৈরি করেছে চ্যাটজিপিটির নির্মাতা প্রতিষ্ঠান ওপেনএআই। প্রাথমিকভাবে ডেভেলপারদের জন্য উন্মুক্ত করা মডেলটি কাজে লাগিয়ে এআই ভয়েস এজেন্টগুলোয় বাস্তবসম্মত ও স্বতঃস্ফূর্ত কথোপকথনের সুযোগ পাওয়া যাবে।
প্রযুক্তি–বিশ্লেষকদের মতে, মুখের কথা যোগাযোগের সবচেয়ে স্বাভাবিক মাধ্যম হলেও কৃত্রিম বুদ্ধিমত্তা প্রযুক্তিতে এটি এখনো যথাযথভাবে ব্যবহার করা হচ্ছে না। তবে ওপেনএআইয়ের নতুন উদ্ভাবন এই চিত্র বদলে দিতে পারে। মডেলটিতে থাকা উন্নত স্পিচ-টু-টেক্সট ও টেক্সট-টু-স্পিচ প্রযুক্তির মাধ্যমে কৃত্রিম বুদ্ধিমত্তাভিত্তিক ভয়েস অ্যাসিস্ট্যান্ট আরও স্বতঃস্ফূর্ত ও কার্যকর হবে। গ্রাহকসেবা, ভাষাশিক্ষা এবং বিশেষ চাহিদাসম্পন্ন ব্যক্তিদের সহায়ক প্রযুক্তি হিসেবে মডেলটি নতুন সম্ভাবনার দ্বার উন্মোচন করবে।
ওপেনএআইয়ের নতুন অডিও মডেলটিতে বেশ কয়েকটি গুরুত্বপূর্ণ সুবিধা যুক্ত করা হয়েছে, যার মধ্যে উন্নত স্পিচ-টু-টেক্সট, টেক্সট-টু-স্পিচ মডেলসহ হালানাগাদ এজেন্টস এসডিকে অন্যতম। নতুন স্পিচ-টু-টেক্সট সুবিধা আগের হুইস্পার সংস্করণের তুলনায় আরও নির্ভুল ও দ্রুত কাজ করতে পারে। ফলে বর্তমানের তুলনায় নির্ভুলভাবে মুখের কথাকে লেখায় রূপান্তর করা যাবে। এ ছাড়া এজেন্টস এসডিকের নতুন হালনাগাদের মাধ্যমে ডেভেলপাররা সহজেই লেখাভিত্তিক কৃত্রিম বুদ্ধিমত্তা সহকারীকে কণ্ঠস্বরভিত্তিক ইন্টারঅ্যাকশন সিস্টেমে রূপান্তর করতে পারবেন।
ওপেনএআই দাবি করেছে, নতুন মডেলটি আগের হুইস্পার সংস্করণের তুলনায় আরও নির্ভুল এবং সবচেয়ে কম বিভ্রান্তিকর তথ্য প্রদান করে। এর ফলে গ্রাহকসেবা, ভাষাশিক্ষা এবং বিশেষ চাহিদাসম্পন্ন ব্যবহারকারীদের জন্য সহায়ক প্রযুক্তি হিসেবে মডেলটি নতুন সম্ভাবনার দ্বার উন্মোচন করবে।
সূত্র: ইন্ডিয়ান এক্সপ্রেস