ElevenLabs তাদের নতুন টেক্সট-টু-স্পিচ মডেল Eleven V3 লঞ্চ করেছে, যা এখন ৭০টি ভাষাকে সমর্থন করে, যার মধ্যে অনেক ভারতীয় ভাষাও অন্তর্ভুক্ত। এই মডেলটি আবেগপ্রবণ, প্রাকৃতিক ধ্বনি তৈরি করতে পারে।
আর্টিফিশিয়াল ইন্টেলিজেন্স ভিত্তিক ভয়েস টেকনোলজি-তে অগ্রণী প্রতিষ্ঠান ElevenLabs তাদের নতুন টেক্সট-টু-স্পিচ (TTS) মডেল Eleven V3-এর মাধ্যমে বড় ধরনের অগ্রগতি সাধন করেছে। প্রতিষ্ঠানটি ঘোষণা করেছে যে তাদের নতুন সংস্করণটি এখন ৪১টি নতুন ভাষাকে সমর্থন করে, যার ফলে মোট ভাষার সংখ্যা ৭০-তে পৌঁছেছে। এই আপডেটের পরে এখন এই মডেলটি বিশ্বের প্রায় ৯০% জনসংখ্যাকে ভয়েস টেকনোলজির সাথে সংযুক্ত করার ক্ষমতা রাখে।
ভারতীয় ভাষাগুলিকে ব্যাপক সমর্থন
ElevenLabs কর্তৃক অন্তর্ভুক্ত ৪১টি নতুন ভাষার মধ্যে অনেক ভারতীয় ভাষাও অন্তর্ভুক্ত, যা ভারতীয় ব্যবহারকারীদের জন্য একটি বড় খবর। এই ভাষাগুলির মধ্যে রয়েছে হিন্দি, অসমীয়া, বাংলা, গুজরাটি, মালয়ালম, মারাঠি, নেপালি, তামিল এবং তেলুগু ইত্যাদি। এর ফলে ভারতের মতো বহুভাষিক দেশে এই টেকনোলজির ব্যবহার অনেক বৃদ্ধি পাওয়ার সম্ভাবনা রয়েছে।
সোশ্যাল মিডিয়ায় তথ্য প্রকাশ
ElevenLabs তাদের আনুষ্ঠানিক X (পূর্বে টুইটার) অ্যাকাউন্টে পোস্টের মাধ্যমে জানিয়েছে যে Eleven V3 এখন মোট ৭০টি ভাষায় টেক্সটকে ভয়েসে রূপান্তর করতে পারে। এর অর্থ হল ব্যবহারকারীরা এখন তাদের পছন্দের বা মাতৃভাষায় টেক্সট টাইপ করে তা একটি প্রাকৃতিক এবং আবেগপ্রবণ আওয়াজে শুনতে পারবেন।
Instant Voice Clone (IVC) -এর পরামর্শ
প্রতিষ্ঠানটি ব্যবহারকারীদের পরামর্শ দিয়েছে যে যদি তারা কোনো নতুন ভাষায় কন্টেন্ট তৈরি করতে চায়, তবে তাদের সেই ভাষার জন্য Instant Voice Clone (IVC) ফিচার ব্যবহার করা উচিত। এর মাধ্যমে ব্যবহারকারীরা তাদের বা অন্য কোনও আওয়াজের স্যাম্পল দিয়ে একই ধরণের আউটপুট পেতে পারেন।
এছাড়াও, প্রতিষ্ঠানটি জানিয়েছে যে আগামী কয়েক সপ্তাহের মধ্যে তারা এই নতুন ভাষাগুলির জন্য ভয়েস লাইব্রেরি ভয়েসও যুক্ত করবে যাতে ব্যবহারকারীরা পূর্বনির্ধারিত আওয়াজগুলির বিকল্পও পেতে পারেন।
নতুন টেকনোলজির বৈশিষ্ট্য
Eleven V3 মডেলটি এর পূর্ববর্তী বহুভাষিক মডেল V2 এবং V2.5-এর উন্নত সংস্করণ। এই নতুন মডেলে অনেক বিশেষ ফিচার অন্তর্ভুক্ত করা হয়েছে:
- আবেগপ্রবণ অডিও ট্যাগ: যেমন ফিসফিসানি, আহ, উৎসাহ, হতাশা ইত্যাদি ধ্বনি এখন AI আওয়াজগুলিতে যোগ করা সম্ভব।
- মাল্টি-স্পিকার সমর্থন: এই মডেলটি ওভারল্যাপিং কথোপকথন, প্রাকৃতিক আলাপ এবং বিরতি সহ বাস্তব জীবনের কথোপকথনকে আরও ভালোভাবে উপস্থাপন করে।
- উন্নত প্রাসঙ্গিক বোধ: তীব্রতা, বলা গতি এবং বাক্যের অর্থ সঠিকভাবে বুঝে বলা ক্ষমতা এতে আরও উন্নত হয়েছে।
কোথায় এবং কিভাবে ব্যবহার করতে পারেন?
Eleven V3 বর্তমানে প্রতিষ্ঠানের ওয়েবসাইট এবং মোবাইল অ্যাপের মাধ্যমে উপলব্ধ। ব্যবহারকারীরা এই প্ল্যাটফর্মগুলিতে লগইন করে এই টেকনোলজি ব্যবহার করতে পারেন। তবে, এটি এখনও API (API) হিসেবে উপলব্ধ নয়, অর্থাৎ ডেভেলপার বা প্রতিষ্ঠানগুলিকে এটি সরাসরি তাদের সিস্টেমে যুক্ত করার জন্য কিছুটা অপেক্ষা করতে হবে।
AI এজেন্টদের কথোপকথন: 'Agent Transfer' ফিচার
ElevenLabs নিয়মিত নতুন প্রযুক্তির উপর কাজ করে যাচ্ছে। এপ্রিল মাসে প্রতিষ্ঠানটি একটি নতুন এন্টারপ্রাইজ-ফোকাসড ফিচারও লঞ্চ করেছে, যার নাম Agent Transfer। এটি প্রতিষ্ঠানের কনভারসেশনাল AI সিস্টেমের অংশ, যেখানে দুটি AI এজেন্ট একে অপরের সাথে কথোপকথন করতে এবং ডেটা একে অপরের কাছে স্থানান্তর করতে পারে।
এই ফিচারের মাধ্যমে যদি কোনো এজেন্ট কোনো বিশেষ তথ্য সম্পর্কে সক্ষম না হয়, তবে সে কথোপকথনটিকে এমন এক এজেন্টের কাছে স্থানান্তর করতে পারে যা সেই বিষয়ে আরও দক্ষ।