Skip to main content

Posts

Showing posts with the label NLP

অসমীয়া সমন্ধবাচক শব্দৰ তালিকা

আইচুদেউ আইতা আইদেউ আই আপাদেউ আমৈ এনাইদেউ ককাইদেউ ককা খুলশালী খুৰাদেউ খুৰীদেউ ঘৈণী জা জীয়ৰী জী জেঠাইদেউ জেঠা জেঠুদেউ জেঠু জেঠেৰী জে - শাহু জোঁৱাই তাৱৈ দদাইদেউ দাদা দেউতা দেওৰ ননদ নবৌ নাতিনী নাতি নিচাদেউ পিতাদেউ পিতৃ পুঠাদেউ পেহাদেউ পেহীদেউ পৈ পতি পত্নী বন্ধু বাইচাদেউ বাইদেউ বান্ধৱী বিয়নী বিয়ৈ বৈনাই বোপাই বোৱাৰী বৌদেউ ভগিনী ভগ্নী ভতিজা ভনী ভাই ভাই - পো ভাই - বোৱাৰী ভাই - শহুৰ ভাগিনী ভাগিন ভাগী মহাদেউ মহা মাতৃ মামা মামীদেউ মামী মাহীদেউ মাহীমা মা মিতিনী মোমাইদেউ শহুৰ শালপতি শাহু সখা সখীয়নী সখী সতিনী স্বামী

Suffix based Noun and Verb Identifier for Assamese

Most frequent Assamese word

অসমীয়া ভাষাত আটাইতকৈ বেছি ব্যৱহৃত শব্দটো কি ?? প্ৰায় ২০৫১৪৩টা অসমীয়া বাক্যক (২.৬ মিলিয়ন শব্দ) লৈ চলোৱা এটা পৰীক্ষাৰ পৰা পোৱা তথ্য অনুসৰি অসমীয়া ভাষাত আটাইতকৈ বেছি ব্যৱহৃত শব্দটো হৈছে "আৰু" (৪৬৫৭৭বাৰ)৷ প্ৰথম একুৰি স্থানপ্ৰাপ্ত শব্দৰ ভিতৰত আছে- ১) আৰু (৪৬৫৭৭ বাৰ) ২) এই (২২৮০৯ বাৰ) ৩) কৰি (১৫৯১৬ বাৰ) ৪) হয় (১৩৬৩৪ বাৰ) ৫) পৰা (১৩৬২৩ বাৰ) ৬) কৰা (১২৯২৬ বাৰ) ৭) এটা (১২৮২৪ বাৰ) ৮) হৈ (১২৪৬৩ বাৰ) ৯) সেই (১০৪৮৬ বাৰ) ১০) কথা (১০১৬৫ বাৰ) ১১) কিন্তু (৯৮০৪ বাৰ) ১২) আছে (৯৬৮৭ বাৰ) ১৩) তাৰ (৯৫৩৩ বাৰ) ১৪) নাই (৯৪৭৬ বাৰ) ১৫) বুলি ( ৯১৯১ বাৰ) ১৬) মই (৯১১৬ বাৰ) ১৭) হ'ল ( ৯০৫৪ বাৰ) ১৮) বা (৮৭৭১ বাৰ) ১৯) যে (

Assamese Stop-word list

যিবোৰ শব্দই natural language processing ত সহায় নকৰে, তেনেকুৱা শব্দৰ এখন তালিকা তলত দিয়া হল। যিসকলে Information Extraction, Text Summarization, Search Engine Optimization আদি ক্ষেত্ৰত কাম কৰি আছে তেওঁলোকৰ বাবে তালিকা খন সহায়ক হব বুলি অাশা কৰিলো। Stop word ৰ বিষয়ে অধিক জানিবৰ বাবে - http://en.wikipedia.org/wiki/Stop_words অতএব অথচ অথবা অধঃ অন্ততঃ অৰ্থাৎ অৰ্থে আও আঃ আচ্ছা আপাততঃ আয়ৈ আৰু আস্‌ আহা আহাহা ইতস্ততঃ ইতি ইত্যাদি ইস্ ইহ উঃ উৱা উস্‌ এতেকে এথোন ঐ ওঁ ওৰফে ঔচ্‌ কি কিম্বা কিন্তু কিয়নো কেলেই কাচিত্‍ চোন ছাৰি ছিকৌ ছেই ঠাহ্ ঢুত্‍ ঢেঁট্‌ তত ততক ততেক তেতেক ততেক তত্ৰাচ তথা তথৈবচ তাতে তেও তো তৌৱা দেই দেহি দ্বাৰা ধৰি ধিক্ নচেত্‍ নতুবা নি নো নৌ পৰা পৰ্যন্ত পশ্চাত্‍ বৰঞ্চ বহিঃ বাবে বাৰু বাহ্‌ বাহিৰে বিনে বে মতে যথা যদি যদ্যপি যে যেনিবা যেনে যোগে লৈ সত্ত্বে সমন্ধি সম্প্ৰতি সহ সু সেইদেখি সৈতে স্বতঃ হঞে হতুৱা হন্তে হবলা হয় হা হুঁ হুই হে হেই হেঃ হেতুকে হেনে হেনো হেৰ হেৰি হৈ হোঁ ইঃ

Display Assamese Unicode character in a Java program

To display Assamese Unicode character in Java program follow the following steps- 1. check your JRE Home 2. change directory to C:\Program Files\Java\jdk1.6.0_10\jre\lib (according to default java directory) generally within each installed JDK version there is a JRE directory. Go to that directory. another JRE directory is generally in C:\Program Files\JRE.. no need to modify this directory 3. wherever the JRE, go to that, which one is within JDK 4. there you find the following files ../JRE/lib/fontconfig.OS.Version.properties ../JRE/lib/fontconfig.OS.Version.bfc ../JRE/lib/fontconfig.OS.properties ../JRE/lib/fontconfig.OS.bfc ../JRE/lib/fontconfig.Version.properties ../JRE/lib/fontconfig.Version.bfc ../JRE/lib/fontconfig.properties ../JRE/lib/fontconfig.bfc There may be some less number of file, no problem, 3 will get minimum 3 files among the above listed files with extension .src 5. copy fontconfig.properties.src and past it in the same directory 6. rename