অদূর ভবিষ্যতে সব কাজ আর্টিফিশিয়াল ইন্টেলিজেন্স বা এআই দিয়ে পরিচালিত হবে বলে ধারণা করা হচ্ছে। তাই কৃত্রিম বুদ্ধিমত্তা বা আর্টিফিশিয়াল ইন্টেলিজেন্সকে বাংলা ভাষায় সমৃদ্ধ করতে মাঠে নেমেছেন দেশের একদল মেধাবী তরুণ প্রযুক্তিবিদ। গড়ে তুলেছেন বেঙ্গলি এআই নামের একটি প্ল্যাটফর্ম। উদ্দেশ্য, বাংলা ভাষায় দৈনন্দিন ব্যবহৃত শব্দগুলো কৃত্রিম বুদ্ধিমত্তার ভান্ডারে যোগ করা। এসব নিয়ে বেঙ্গলি এআইয়ের কো-অর্ডিনেটর আসিফ সুস্মিতের সঙ্গে কথা বলেছেন অলকানন্দা রায়।
আজকের পত্রিকা: বেঙ্গলি এআই কবে, কোথায়, কোন ভাবনা থেকে শুরু করেছিলেন?
আসিফ সুস্মিত: বেঙ্গলি এআই একটি ননপ্রফিট ওপেন সোর্স উদ্যোগ। বেঙ্গলি এআই কম্পিউটারকে বাংলা ভাষা শেখানোর উদ্যোগ নিয়েছে ২০১৬ সালে। এই ভাবনাটার শুরু হয় কয়েকজন বন্ধু মিলে, মেশিন লার্নিং ভিত্তিক ব্লাইন্ড এইড বিষয়ে কাজ করার সময়। দৃষ্টিপ্রতিবন্ধীরা যেন বই পড়তে পারে অথবা সামনে কিছু থাকলে তার অবস্থান ব্যাখ্যা করতে পারে এই ভাবনা থেকে। কিন্তু কাজটি নিয়ে পরে অগ্রসর হয়ে গেলে দেখা যায় যে উন্মুক্ত তথ্যভান্ডার, বিশেষ করে ডেটা সেট না থাকার কারণে বাংলা ভাষায় গবেষণামূলক কাজ করা যাচ্ছে না। তখন ব্র্যাক, বুয়েট, কুয়েটের কিছু ছাত্র বাংলা ভাষাকে প্রযুক্তিতে প্রয়োগ করার উদ্দেশ্যে এবং প্রযুক্তিকে উন্মুক্ত করতে বেঙ্গলি এআই শুরু করে।
আজকের পত্রিকা: বাংলা ভাষার শব্দগুলোকে কৃত্রিম বুদ্ধিমত্তার ভান্ডারে যোগ করতে কী কী পদক্ষেপ নিয়েছিলেন?
আসিফ সুস্মিত: প্রথমত, আমাদের কাজই হলো বাংলা ভাষায় করপাস তৈরি করা। এর জন্য আমরা অনেক সময় ক্যাম্পেইন নামিয়ে থাকি সব শ্রেণির মানুষের কাছ থেকে ডেটা নিয়ে আসার জন্য। আমরা বেশির ভাগ সময় ফেসবুক ব্যবহার করে মানুষের কাছে খবর পৌঁছে দিই। এরপর তাদের কাছ থেকে নেওয়া ডেটা লিপিবদ্ধ করা হয় এবং যাচাই করা হয়।
আজকের পত্রিকা: এটা করতে গিয়ে কী কী সমস্যায় পড়েছেন এবং উত্তরণ ঘটালেন কীভাবে?
আসিফ সুস্মিত: এটা করতে গিয়ে অনেক ধরনের সমস্যায় পড়েছি। যেমন শুধু সোশ্যাল মিডিয়ায় আমাদের বাবলের মানুষেরাই আমাদের কথা জানছে। কিন্তু আমাদের ভাবনার বাইরেও বাকি ৯০ শতাংশ জনগোষ্ঠী আছে, আমরা তাদের কাছে পৌঁছাতে পারছি না। তখন ডেটা আসে না ক্যাম্পেইন চালানোর পরেও। এই সমস্যা থেকে উত্তরণ পেতে আমরা ঠিক করেছি, বিশ্ববিদ্যালয়ের শিক্ষার্থীদের এ কাজে নিযুক্ত করব স্পিচ ক্যাম্পেইনের জন্য।
আজকের পত্রিকা: এর অর্থায়ন কীভাবে হচ্ছে?
আসিফ সুস্মিত: এসব ক্ষেত্রে আমরা প্রজেক্ট বেসিসে ফান্ড গঠন করি এবং পুরোটাই খরচ হয় ভাষা প্রযুক্তিকে উন্মুক্ত করার পেছনে।
আজকের পত্রিকা: বাংলা ভাষার শব্দ বলতে কি শুধু প্রমিত বাংলা নিয়েই কাজ করছেন?
আসিফ সুস্মিত: আমরা প্রমিত বাংলা ভাষা নিয়ে কাজ করলেও এখন আঞ্চলিক শব্দ এবং কথা সংগ্রহ করার কাজে নেমেছি। আমাদের এখন একটি ক্যাম্পেইন চলবে এ কাজে। বিভিন্ন এলাকা, যেমন—ময়মনসিংহ, রাজশাহী, সিলেট, বগুড়া ইত্যাদি অঞ্চল থেকে বিভিন্ন আঞ্চলিক টানে ডেটা কালেকশন করা হচ্ছে। সোশ্যাল মিডিয়ায়ও একটা ক্যাম্পেইন চালাব এবং সশরীরেও ডেটা কালেকশন চলছে। আমাদের সঙ্গে কর্মরত থিসিস পর্যায়ের শিক্ষার্থীরা ঈদে বাড়ি গিয়ে এই ডেটা কালেক্ট করছেন।
আজকের পত্রিকা: বকবক নামে আপনাদের একটি ক্যাম্পেইন আছে…
আসিফ সুস্মিত: বকবক ক্যাম্পেইন আয়োজন করা হয় মানুষকে যেন বাংলায় ডেটা দিতে উদ্বুদ্ধ করা যায়। এই ক্যাম্পেইন আয়োজন করা হয়েছিল গত বছরের আগস্টে। প্রায় ২০০০ ঘণ্টার ডেটা সংগ্রহ করেছি সাধারণ মানুষের থেকে। এখন পর্যন্ত এ রকম উদ্যোগে সংগৃহীত ডেটা সেটটি বাংলা ভাষার ইতিহাসে সবচেয়ে বড়। এই ক্যাম্পেইনে আমরা এক হাজার বাক্যের জন্য সামান্য কিছু প্রাইজমানি রাখি, যাতে সব সেগমেন্টের মানুষকে ডেটা দিতে আগ্রহী করা যায়।
আজকের পত্রিকা: আপনারা কতজন এই টিমে কাজ করছেন?
আসিফ সুস্মিত: বর্তমানে আমাদের টিমে ছয় হাজারের বেশি গবেষক কাজ করছেন। কিন্তু আমাদের একটি মেইন টিম আছে, যাঁরা সব প্রজেক্ট পরিদর্শন করেন। এই টিমে প্রায় ২০ জন সদস্য আছেন। তাঁরা একেক জন একেক ব্যাকগ্রাউন্ডের মানুষ। এখানে বিজনেস থেকে শুরু করে লিঙ্গুইস্ট সফটওয়্যার ইঞ্জিনিয়ার সবাই সমন্বিতভাবে কাজ করেন।
আজকের পত্রিকা: বেঙ্গলি ডট এআইয়ে ছয় হাজারের বেশি গবেষক কাজ করছেন—এই সমন্বয় কীভাবে সম্ভব হলো?
আসিফ সুস্মিত: অনেকে আছেন যাঁরা আগে অনেকগুলো প্রজেক্টে কাজ করেছেন, ভবিষ্যতেও হয়তোবা আগ্রহী হতে পারেন। এ ছাড়া বাকিরা যাঁরা আছেন, তাঁরা সবাই সংযুক্ত স্লাক নামের একটি অ্যাপের মাধ্যমে। এ ছাড়া ফেসবুক গ্রুপে তাঁরা সবাই বেশ অ্যাকটিভ। তাঁরা প্রত্যেকেই নিজ উদ্যোগে কাজ করেন, তাই সহজে সমন্বয় করা যায়।
আজকের পত্রিকা: বাংলা এআই প্রজেক্টের মাধ্যমে বিজ্ঞান, প্রযুক্তি, অর্থনীতি, ব্যবসাসহ জ্ঞানের বিভিন্ন শাখায় গুরুত্বপূর্ণ বই-জার্নাল-গবেষণাপত্র ইত্যাদি বাংলায় অনুবাদ করা সহজ হবে কি?
আসিফ সুস্মিত: জ্ঞানভান্ডার সমৃদ্ধ করার জন্য অনুবাদ খুবই গুরুত্বপূর্ণ ভূমিকা পালন করে, আমরা জানি সেটা। বেঙ্গলি ডট এআই থেকেও অনুবাদ-সম্পর্কিত কিছু প্রকল্প চালানোর চিন্তাভাবনা আছে। বর্তমানে আমাদের চারটি প্রকল্প চলমান। তাই এটা নিয়ে হয়তোবা বড় পরিসরে ভবিষ্যতে কাজ চালানো যাবে।
আজকের পত্রিকা: বাংলা এআই প্রজেক্ট কি গুগল সার্চ ইঞ্জিনের ভয়েস সার্চ ফিচারের বাংলা ল্যাঙ্গুয়েজ রিকগনিশন মডেলের উন্নত সংস্করণ? নাকি আরও বেশি কিছু?
আসিফ সুস্মিত: অবশ্যই বেশি কিছু। এই স্পিচ ডেটা সেটের কথাই যদি আমরা ধরি, এখানে ভয়েস রিকগনিশন থেকে শুরু করে অনেক কিছু করা প্রয়োজন। বাংলায় আমরা নিজেদের ডিজিটাল অ্যাসিস্ট্যান্টও বানাতে পারব। এই ডেটা সেট দিয়ে স্পিচ টু টেক্সট, টেক্সট টু স্পিচ-সম্পর্কিত সব ধরনের টেকনোলজি চালানো যাবে। এটা বেঙ্গলি এআইর একমাত্র প্রজেক্ট। এ ছাড়া আছে ওসিআর, সাইন টু টেক্সট ল্যাঙ্গুয়েজ, গ্রামার ভুল ধরার জন্য নির্মিত ডেটা সেট। শুধু তা-ই নয়, এনএলপির জন্য বিশ্বের নামকরা কনফারেন্সে এবার আমরা একটি ওয়ার্কশপ আয়োজন করছি। এটাকে আমরা বিএলপি বা বাংলা ল্যাঙ্গুয়েজ প্রসেসিং কনফারেন্স বলে আখ্যায়িত করছি। এই ওয়ার্কশপে বিশ্বের বাংলা ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং নিয়ে কাজ করা সব গবেষক তাঁদের কাজ প্রেজেন্ট করতে পারবেন। এই লক্ষ্য সামনে রেখে আমরা চারটি প্রতিযোগিতার আয়োজন করছি চারটি থিমের ওপর। সেগুলো হলো বাংলা ওসিআর, স্পিচ রিকগনিশন, গ্রামার চেকার, ভায়োলেন্ট টেক্সট ডিটেকশন। এই প্রতিযোগিতাগুলো আন্তর্জাতিকভাবে আয়োজন করা হবে এবং আশা করা যায় প্রতিযোগিতা থেকে উঠে আসবে চমৎকার সব অ্যালগরিদম, যা পরে ইএমএনএলপিতে গবেষণা আকারে প্রকাশ করা হবে।
আজকের পত্রিকা: নামতাডিবি নামে ২০১৮ সালে একটি কাজ শুরু করেছিলেন, এটি আসলে কী? এর সঙ্গে বেঙ্গলি এআইর কাজ শুরু করা বা অন্য কোনো ধরনের যোগ আছে কি?
আসিফ সুস্মিত: নামতাডিবি অনেক পুরোনো প্রকল্প এবং আমাদের আয়োজিত প্রথম ইন্টারন্যাশনাল প্রতিযোগিতা। এটি ২০১৮ সালে কেগেল প্ল্যাটফর্মে তৈরি হয়েছিল। এর আগে আমরা হাতে লেখা একটি নম্বরের ডেটা সেট বানিয়েছিলাম। ডেটা সংগ্রহ করা হয়েছিল বিভিন্ন জায়গা থেকে এবং সংগৃহীত নম্বরের ডেটা সেট ছিল ৮৫ হাজারের বেশি। বাংলা ভাষায় একটি ওসিআর তৈরি করতে নম্বরের ক্ল্যাসিফিকেশন গুরুত্বপূর্ণ অধ্যায়। এ থেকেই শুরু নামতাডিবি নামের কাজটি।
আজকের পত্রিকা: বেঠিক নামেও একটি ওপেন সোর্স তৈরি করেছিলেন, যা কিনা বাংলা বানান পরীক্ষকের কাজ করে থাকে। এ-সম্পর্কে জানতে চাই?
আসিফ সুস্মিত: বেঠিক নামের একটি ওপেন সোর্স তৈরি করা হয়েছে আমরা যে ডেটা সংগ্রহ করেছি তার ওপর ভিত্তি করে। আপনি যদি ইংরেজি গ্রামারলির সঙ্গে পরিচিত থাকেন, তাহলে সহজে বুঝতে পারবেন বিষয়টি। এটি এমন একটি সফটওয়্যারের বেজ, যা বাংলা ভাষায় এরর ডিটেকশন করতে পারবে। প্রথমত, আমরা ডেটা কালেক্ট করেছি। এরপর বুয়েটে ইইই ডে এবং অমর একুশে ফেব্রুয়ারি উপলক্ষে আমরা একটি প্রতিযোগিতার আয়োজন করি, এর নাম ভাষাভ্রম। অংশ নেওয়া শিক্ষার্থীদের বলা হয়, ডেটা সেটটি ব্যবহার করে একটি অ্যালগরিদম ডেভেলপ করতে, যা ভাষার ভুলগুলো চিহ্নিত করতে পারে। এটাও কেগলে অনুষ্ঠিত হয়েছিল এবং এটি পরে শিক্ষার্থীদের উদ্বুদ্ধ করে মেশিন লার্নিং সম্পর্কে আরও ভালোভাবে জানতে।
অদূর ভবিষ্যতে সব কাজ আর্টিফিশিয়াল ইন্টেলিজেন্স বা এআই দিয়ে পরিচালিত হবে বলে ধারণা করা হচ্ছে। তাই কৃত্রিম বুদ্ধিমত্তা বা আর্টিফিশিয়াল ইন্টেলিজেন্সকে বাংলা ভাষায় সমৃদ্ধ করতে মাঠে নেমেছেন দেশের একদল মেধাবী তরুণ প্রযুক্তিবিদ। গড়ে তুলেছেন বেঙ্গলি এআই নামের একটি প্ল্যাটফর্ম। উদ্দেশ্য, বাংলা ভাষায় দৈনন্দিন ব্যবহৃত শব্দগুলো কৃত্রিম বুদ্ধিমত্তার ভান্ডারে যোগ করা। এসব নিয়ে বেঙ্গলি এআইয়ের কো-অর্ডিনেটর আসিফ সুস্মিতের সঙ্গে কথা বলেছেন অলকানন্দা রায়।
আজকের পত্রিকা: বেঙ্গলি এআই কবে, কোথায়, কোন ভাবনা থেকে শুরু করেছিলেন?
আসিফ সুস্মিত: বেঙ্গলি এআই একটি ননপ্রফিট ওপেন সোর্স উদ্যোগ। বেঙ্গলি এআই কম্পিউটারকে বাংলা ভাষা শেখানোর উদ্যোগ নিয়েছে ২০১৬ সালে। এই ভাবনাটার শুরু হয় কয়েকজন বন্ধু মিলে, মেশিন লার্নিং ভিত্তিক ব্লাইন্ড এইড বিষয়ে কাজ করার সময়। দৃষ্টিপ্রতিবন্ধীরা যেন বই পড়তে পারে অথবা সামনে কিছু থাকলে তার অবস্থান ব্যাখ্যা করতে পারে এই ভাবনা থেকে। কিন্তু কাজটি নিয়ে পরে অগ্রসর হয়ে গেলে দেখা যায় যে উন্মুক্ত তথ্যভান্ডার, বিশেষ করে ডেটা সেট না থাকার কারণে বাংলা ভাষায় গবেষণামূলক কাজ করা যাচ্ছে না। তখন ব্র্যাক, বুয়েট, কুয়েটের কিছু ছাত্র বাংলা ভাষাকে প্রযুক্তিতে প্রয়োগ করার উদ্দেশ্যে এবং প্রযুক্তিকে উন্মুক্ত করতে বেঙ্গলি এআই শুরু করে।
আজকের পত্রিকা: বাংলা ভাষার শব্দগুলোকে কৃত্রিম বুদ্ধিমত্তার ভান্ডারে যোগ করতে কী কী পদক্ষেপ নিয়েছিলেন?
আসিফ সুস্মিত: প্রথমত, আমাদের কাজই হলো বাংলা ভাষায় করপাস তৈরি করা। এর জন্য আমরা অনেক সময় ক্যাম্পেইন নামিয়ে থাকি সব শ্রেণির মানুষের কাছ থেকে ডেটা নিয়ে আসার জন্য। আমরা বেশির ভাগ সময় ফেসবুক ব্যবহার করে মানুষের কাছে খবর পৌঁছে দিই। এরপর তাদের কাছ থেকে নেওয়া ডেটা লিপিবদ্ধ করা হয় এবং যাচাই করা হয়।
আজকের পত্রিকা: এটা করতে গিয়ে কী কী সমস্যায় পড়েছেন এবং উত্তরণ ঘটালেন কীভাবে?
আসিফ সুস্মিত: এটা করতে গিয়ে অনেক ধরনের সমস্যায় পড়েছি। যেমন শুধু সোশ্যাল মিডিয়ায় আমাদের বাবলের মানুষেরাই আমাদের কথা জানছে। কিন্তু আমাদের ভাবনার বাইরেও বাকি ৯০ শতাংশ জনগোষ্ঠী আছে, আমরা তাদের কাছে পৌঁছাতে পারছি না। তখন ডেটা আসে না ক্যাম্পেইন চালানোর পরেও। এই সমস্যা থেকে উত্তরণ পেতে আমরা ঠিক করেছি, বিশ্ববিদ্যালয়ের শিক্ষার্থীদের এ কাজে নিযুক্ত করব স্পিচ ক্যাম্পেইনের জন্য।
আজকের পত্রিকা: এর অর্থায়ন কীভাবে হচ্ছে?
আসিফ সুস্মিত: এসব ক্ষেত্রে আমরা প্রজেক্ট বেসিসে ফান্ড গঠন করি এবং পুরোটাই খরচ হয় ভাষা প্রযুক্তিকে উন্মুক্ত করার পেছনে।
আজকের পত্রিকা: বাংলা ভাষার শব্দ বলতে কি শুধু প্রমিত বাংলা নিয়েই কাজ করছেন?
আসিফ সুস্মিত: আমরা প্রমিত বাংলা ভাষা নিয়ে কাজ করলেও এখন আঞ্চলিক শব্দ এবং কথা সংগ্রহ করার কাজে নেমেছি। আমাদের এখন একটি ক্যাম্পেইন চলবে এ কাজে। বিভিন্ন এলাকা, যেমন—ময়মনসিংহ, রাজশাহী, সিলেট, বগুড়া ইত্যাদি অঞ্চল থেকে বিভিন্ন আঞ্চলিক টানে ডেটা কালেকশন করা হচ্ছে। সোশ্যাল মিডিয়ায়ও একটা ক্যাম্পেইন চালাব এবং সশরীরেও ডেটা কালেকশন চলছে। আমাদের সঙ্গে কর্মরত থিসিস পর্যায়ের শিক্ষার্থীরা ঈদে বাড়ি গিয়ে এই ডেটা কালেক্ট করছেন।
আজকের পত্রিকা: বকবক নামে আপনাদের একটি ক্যাম্পেইন আছে…
আসিফ সুস্মিত: বকবক ক্যাম্পেইন আয়োজন করা হয় মানুষকে যেন বাংলায় ডেটা দিতে উদ্বুদ্ধ করা যায়। এই ক্যাম্পেইন আয়োজন করা হয়েছিল গত বছরের আগস্টে। প্রায় ২০০০ ঘণ্টার ডেটা সংগ্রহ করেছি সাধারণ মানুষের থেকে। এখন পর্যন্ত এ রকম উদ্যোগে সংগৃহীত ডেটা সেটটি বাংলা ভাষার ইতিহাসে সবচেয়ে বড়। এই ক্যাম্পেইনে আমরা এক হাজার বাক্যের জন্য সামান্য কিছু প্রাইজমানি রাখি, যাতে সব সেগমেন্টের মানুষকে ডেটা দিতে আগ্রহী করা যায়।
আজকের পত্রিকা: আপনারা কতজন এই টিমে কাজ করছেন?
আসিফ সুস্মিত: বর্তমানে আমাদের টিমে ছয় হাজারের বেশি গবেষক কাজ করছেন। কিন্তু আমাদের একটি মেইন টিম আছে, যাঁরা সব প্রজেক্ট পরিদর্শন করেন। এই টিমে প্রায় ২০ জন সদস্য আছেন। তাঁরা একেক জন একেক ব্যাকগ্রাউন্ডের মানুষ। এখানে বিজনেস থেকে শুরু করে লিঙ্গুইস্ট সফটওয়্যার ইঞ্জিনিয়ার সবাই সমন্বিতভাবে কাজ করেন।
আজকের পত্রিকা: বেঙ্গলি ডট এআইয়ে ছয় হাজারের বেশি গবেষক কাজ করছেন—এই সমন্বয় কীভাবে সম্ভব হলো?
আসিফ সুস্মিত: অনেকে আছেন যাঁরা আগে অনেকগুলো প্রজেক্টে কাজ করেছেন, ভবিষ্যতেও হয়তোবা আগ্রহী হতে পারেন। এ ছাড়া বাকিরা যাঁরা আছেন, তাঁরা সবাই সংযুক্ত স্লাক নামের একটি অ্যাপের মাধ্যমে। এ ছাড়া ফেসবুক গ্রুপে তাঁরা সবাই বেশ অ্যাকটিভ। তাঁরা প্রত্যেকেই নিজ উদ্যোগে কাজ করেন, তাই সহজে সমন্বয় করা যায়।
আজকের পত্রিকা: বাংলা এআই প্রজেক্টের মাধ্যমে বিজ্ঞান, প্রযুক্তি, অর্থনীতি, ব্যবসাসহ জ্ঞানের বিভিন্ন শাখায় গুরুত্বপূর্ণ বই-জার্নাল-গবেষণাপত্র ইত্যাদি বাংলায় অনুবাদ করা সহজ হবে কি?
আসিফ সুস্মিত: জ্ঞানভান্ডার সমৃদ্ধ করার জন্য অনুবাদ খুবই গুরুত্বপূর্ণ ভূমিকা পালন করে, আমরা জানি সেটা। বেঙ্গলি ডট এআই থেকেও অনুবাদ-সম্পর্কিত কিছু প্রকল্প চালানোর চিন্তাভাবনা আছে। বর্তমানে আমাদের চারটি প্রকল্প চলমান। তাই এটা নিয়ে হয়তোবা বড় পরিসরে ভবিষ্যতে কাজ চালানো যাবে।
আজকের পত্রিকা: বাংলা এআই প্রজেক্ট কি গুগল সার্চ ইঞ্জিনের ভয়েস সার্চ ফিচারের বাংলা ল্যাঙ্গুয়েজ রিকগনিশন মডেলের উন্নত সংস্করণ? নাকি আরও বেশি কিছু?
আসিফ সুস্মিত: অবশ্যই বেশি কিছু। এই স্পিচ ডেটা সেটের কথাই যদি আমরা ধরি, এখানে ভয়েস রিকগনিশন থেকে শুরু করে অনেক কিছু করা প্রয়োজন। বাংলায় আমরা নিজেদের ডিজিটাল অ্যাসিস্ট্যান্টও বানাতে পারব। এই ডেটা সেট দিয়ে স্পিচ টু টেক্সট, টেক্সট টু স্পিচ-সম্পর্কিত সব ধরনের টেকনোলজি চালানো যাবে। এটা বেঙ্গলি এআইর একমাত্র প্রজেক্ট। এ ছাড়া আছে ওসিআর, সাইন টু টেক্সট ল্যাঙ্গুয়েজ, গ্রামার ভুল ধরার জন্য নির্মিত ডেটা সেট। শুধু তা-ই নয়, এনএলপির জন্য বিশ্বের নামকরা কনফারেন্সে এবার আমরা একটি ওয়ার্কশপ আয়োজন করছি। এটাকে আমরা বিএলপি বা বাংলা ল্যাঙ্গুয়েজ প্রসেসিং কনফারেন্স বলে আখ্যায়িত করছি। এই ওয়ার্কশপে বিশ্বের বাংলা ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং নিয়ে কাজ করা সব গবেষক তাঁদের কাজ প্রেজেন্ট করতে পারবেন। এই লক্ষ্য সামনে রেখে আমরা চারটি প্রতিযোগিতার আয়োজন করছি চারটি থিমের ওপর। সেগুলো হলো বাংলা ওসিআর, স্পিচ রিকগনিশন, গ্রামার চেকার, ভায়োলেন্ট টেক্সট ডিটেকশন। এই প্রতিযোগিতাগুলো আন্তর্জাতিকভাবে আয়োজন করা হবে এবং আশা করা যায় প্রতিযোগিতা থেকে উঠে আসবে চমৎকার সব অ্যালগরিদম, যা পরে ইএমএনএলপিতে গবেষণা আকারে প্রকাশ করা হবে।
আজকের পত্রিকা: নামতাডিবি নামে ২০১৮ সালে একটি কাজ শুরু করেছিলেন, এটি আসলে কী? এর সঙ্গে বেঙ্গলি এআইর কাজ শুরু করা বা অন্য কোনো ধরনের যোগ আছে কি?
আসিফ সুস্মিত: নামতাডিবি অনেক পুরোনো প্রকল্প এবং আমাদের আয়োজিত প্রথম ইন্টারন্যাশনাল প্রতিযোগিতা। এটি ২০১৮ সালে কেগেল প্ল্যাটফর্মে তৈরি হয়েছিল। এর আগে আমরা হাতে লেখা একটি নম্বরের ডেটা সেট বানিয়েছিলাম। ডেটা সংগ্রহ করা হয়েছিল বিভিন্ন জায়গা থেকে এবং সংগৃহীত নম্বরের ডেটা সেট ছিল ৮৫ হাজারের বেশি। বাংলা ভাষায় একটি ওসিআর তৈরি করতে নম্বরের ক্ল্যাসিফিকেশন গুরুত্বপূর্ণ অধ্যায়। এ থেকেই শুরু নামতাডিবি নামের কাজটি।
আজকের পত্রিকা: বেঠিক নামেও একটি ওপেন সোর্স তৈরি করেছিলেন, যা কিনা বাংলা বানান পরীক্ষকের কাজ করে থাকে। এ-সম্পর্কে জানতে চাই?
আসিফ সুস্মিত: বেঠিক নামের একটি ওপেন সোর্স তৈরি করা হয়েছে আমরা যে ডেটা সংগ্রহ করেছি তার ওপর ভিত্তি করে। আপনি যদি ইংরেজি গ্রামারলির সঙ্গে পরিচিত থাকেন, তাহলে সহজে বুঝতে পারবেন বিষয়টি। এটি এমন একটি সফটওয়্যারের বেজ, যা বাংলা ভাষায় এরর ডিটেকশন করতে পারবে। প্রথমত, আমরা ডেটা কালেক্ট করেছি। এরপর বুয়েটে ইইই ডে এবং অমর একুশে ফেব্রুয়ারি উপলক্ষে আমরা একটি প্রতিযোগিতার আয়োজন করি, এর নাম ভাষাভ্রম। অংশ নেওয়া শিক্ষার্থীদের বলা হয়, ডেটা সেটটি ব্যবহার করে একটি অ্যালগরিদম ডেভেলপ করতে, যা ভাষার ভুলগুলো চিহ্নিত করতে পারে। এটাও কেগলে অনুষ্ঠিত হয়েছিল এবং এটি পরে শিক্ষার্থীদের উদ্বুদ্ধ করে মেশিন লার্নিং সম্পর্কে আরও ভালোভাবে জানতে।
ভিয়েতনামের বাজারে রিয়েলমি সি৭৫ মডেল নিয়ে এল চীনের কোম্পানি রিয়েলমি। এতে চিপসেট হিসেবে রয়েছে মিডিয়াটেক হেলিয়ো জি৯২ ম্যাক্স। স্মার্টফোনটির বিশেষ বৈশিষ্ট্য হলো এতে রিভার্স চার্জিং ফিচার রয়েছে। অর্থাৎ এতে ইউএসবি টাইপ সি যুক্ত করে অন্য স্মার্টফোনে চার্জ দেওয়া যাবে। ফলে ফোনটি একটি পাওয়ার ব্যাংক হিসেবে কাজ
১ ঘণ্টা আগেঅ্যান্ড্রয়েড ডিভাইসগুলোর জন্য নতুন ফিচারের ঘোষণা দিয়েছে গুগল। ফিচারটি মাধ্যমে নতুন ডিভাইস সেট আপ করার প্রক্রিয়া দ্রুত এবং আরও কার্যকরী হবে। এই ফিচারটির নাম ‘রিস্টোর ক্রেডেনশিয়ালস’, যা ডিভাইস পরিবর্তনের পর ব্যবহারকারীদের স্বয়ংক্রিয়ভাবে অ্যাপগুলোতে লগ ইন করতে সাহায্য করবে। এজন্য ফিচারটি একটি ‘রিস্টোর
৩ ঘণ্টা আগেমেমোরি এবং ফাউন্ড্রি চিপ ইউনিটের জন্য নতুন প্রধানদের সরিয়ে দিয়েছে স্যামসাং ইলেকট্রনিকস। বৈশ্বিক কৃত্রিম বুদ্ধিমত্তা বা এআই চিপ বাজারে এসকে হাইনিক্স এবং তাইওয়ানের টিএসএমসি–এর মতো চিপ উৎপাদনকারী প্রতিষ্ঠানদারকারী সঙ্গে তাল মিলিয়ে চলার জন্য চেষ্টা করছে কোম্পানিটি।
৬ ঘণ্টা আগেসোশ্যাল মিডিয়া ইনফ্লুয়েন্সারদের তথ্য যাচাই করার জন্য ‘জরুরিভিত্তিতে’ সহায়তার প্রয়োজন বলে সতর্ক করেছে ইউনেসকো। ফলোয়ারদের কাছে মিথ্যা তথ্য ছড়ানো থেকে বিরত থাকার জন্য ইনফ্লুয়েন্সার ফ্যাক্টচেকিং বা তথ্য যাচাইয়ের প্রশিক্ষণের প্রয়োজন।
৮ ঘণ্টা আগে