আপনার কণ্ঠ যাবে গুগলে, বাড়বে বাংলার বিস্তৃতি!

চলছে ভাষার মাস। বাংলা ভাষাকে রক্ষা করতে ঝরেছে তরুণদের তাজা রক্ত। এজন্য আমরা এখন সুমধুর বাংলা ভাষায় আমাদের মনের ভাব প্রকাশ করছি সবার সঙ্গে। দেশ ছেড়ে বিদেশেও জনপ্রিয় হয়েছে এ বাংলা ভাষা। বর্তমান প্রযুক্তির যুগে আধুনিকতার ছোঁয়া লেগেছে প্রায় সবখানেই। কিন্তু সেই আধুনিকতার সংস্পর্শে আমরা নিয়ে আসতে পারিনি আমাদের মাতৃভাষা বাংলাকে।

বাংলা ভাষাকে অনেকেই পৃথিবীর মধুরতম ভাষা হিসেবে উল্লেখ করেছেন। ৫০ কোটি মানুষের কানে-মুখে এ ভাষাটি ঘুরলেও কম্পিউটার প্রযুক্তিতে অত ঘোরে না এ ভাষা। গুগল, অ্যালেক্সা ও সিরিতে বাংলাতে কথা বলতেই সে অনুযায়ী কাজ করবে-এ সাধ জাগে আমাদের অনেকের মনেই। কিন্তু সাধ থাকলেই তো আর হবে না সাধ্যও তো থাকতে হবে।

এবার সেই সাধ্যকে সত্যি করতে কাজ করছে বাংলাদেশের একদল গবেষক ও ছাত্ররা। তারা চাইছেন কম্পিউটারের মতো যন্ত্রকে বাংলা ভাষায় যা বলবেন সেভাবেই কাজ করবে। তবে সমস্যা হচ্ছে কম্পিউটার তো আর আমাদের বাংলা ভাষা বুঝে না। কম্পিউটার বুঝে অ্যালগরিদম, এর মাধ্যমেই কাজ কম্পিউটার তার কাজ সম্পাদন করে।

আর কম্পিউটারকে বাংলা ভাষা শেখাতে বা বুঝাতে হলে প্রয়োজন অনেক অনেক মানুষের কণ্ঠের নমুনা। নানা পরিস্থিতিতে, নানা বয়সের মানুষের কণ্ঠের নমুনা প্রয়োজন। ইংরেজি গবেষকরা এমন কণ্ঠের নমুনা সংগ্রহ করেছে বলেই তারা আজ সিরি, এলেক্সা বা গুগল এসিস্টেন্টের সঙ্গে কথা বলতে পারছেন।

এবার বাংলাকে সেই কাতারে তুলে নিয়ে আসতে কণ্ঠের নমুনা সংগ্রহ করছে মজিলা ফাউন্ডেশন প্ল্যাটফর্মের আয়োজনে বেঙ্গলি.এআই কমিউনিটির পক্ষ থেকে বিভিন্ন স্তরের গবেষক বা ছাত্ররা। তারা বাংলাদেশ ও ভারতের বাংলাভাষী নানা বয়সী ব্যক্তিদের কাছ থেকে বিভিন্ন কণ্ঠে কথা বলার নমুনা সংগ্রহ করছে। এসব ভাষা কম্পিউটারকে অ্যালগরিদমের মাধ্যমে শোনালেই বাংলার জন্য একটি অ্যাসিস্ট্যান্ট তৈরি করা যাবে। যা আমাদের সর্বস্তরের কাজে সাহায্য করবে।

গুগল বাংলা ভাষা নিয়ে কিছু কাজ করলেও তাদের অ্যালগরিদমের অনেক ত্রুটি রয়েছে। কারণ গুগলের কাছে বাংলাভাষীদের সব এলাকার লোকের বাংলা কণ্ঠের নমুনা নেই। তাই এবার এ প্রতিষ্ঠানটি একটি বড় কণ্ঠের নমুনা সংগ্রহ করার কাজে নেমেছে।

এর আগে গুগলের কাছে সর্বোচ্চ ২৫০ ঘণ্টার কণ্ঠের নমুনা সংগ্রহের ডেটাসেট ছিল। কিন্তু প্রোডাকশন লেভেল সফটওয়ারের জন্য দরকার ১০ হাজার ঘণ্টা কণ্ঠ নমুনার ডেটাসেট। সরকার থেকে একটি সফটওয়্যার বানানো হচ্ছে যেখানে সবস্তরের মানুষের কণ্ঠের নমুনা দরকার। সেই নমুনা সংগ্রহ করছে বেঙ্গলি.এআই নামের একটি কমিউনিটি।