Skip to main content

সংগণক যন্ত্ৰ় আৰু সাংকেতিকীকৰণ পদ্ধতি


সংগণক যন্ত্ৰ়টোৱে আচলতে একো নাজানে। যন্ত্ৰটোক শিকাব লাগে কি কাম কৰিব লাগে, কেনেকৈ কৰিব লাগে, কেতিয়া কৰিব লাগে ইত্যাদি প্ৰতিটো কথা। এবাৰ শিকাই দিয়াৰ পিচত সংগণক যন্ত্ৰ়ই মানুহতকৈ অধিক ক্ষিপ্ৰতাৰে আৰু মানুহতকৈ অধিক নিয়াৰিকৈ কাম সম্পন্ন কৰিব পাৰে। প্ৰথমতে আমি সংগণক যন্ত্ৰটোক যিটো কাম কৰিবলৈ শিকাম, সেই কামটোৰ প্ৰণালীবদ্ধ সমাধান ছল-সংকেত পদ্ধতিৰ সহায়ত লিখি লওঁ। অধিক জটিল সমস্যা সমাধানৰ বাবে আমি প্ৰায়ে পৰিচলন-চিত্ৰৰ সহায় লওঁ। পৰিচলন-তালিকা বা পৰিচলন-চিত্ৰ বা বোঁৱতী-তালিকা বা বোঁৱতী-চিত্ৰ ছল-সংকেত পদ্ধতিৰ চিত্ৰৰূপ। ছল-সংকেতবোৰ সংগণক যন্ত্ৰক বুজাবৰ বাবে কিছুমান কৃত্ৰিম ভাষাৰ সহায় লোৱা হয়। ক্ৰমাগত ছল-সংকেতবোৰ বৰ্ণনা কৰি সংগণক যন্ত্ৰ়ই (লগতে আমি মানুহেও) বুজিব পৰাকৈ সংগণক ভাষাত (সংগণক যন্ত্ৰ়ৰ ভাষা --> সংগণক ভাষা) লিখা উক্তিৰ সমষ্টিক সংগণক প্ৰ’গ্ৰেম (চুটিকৈ প্ৰ’গ্ৰেম) বোলে। আকৌ এটা বা তাতোকৈ অধিক স্বয়ংসম্পূৰ্ণ সংগণক প্ৰ’গ্ৰেমৰ সমষ্টিক ছফ্টওৱেৰ বুলি কওঁ। সংগণক যন্ত্ৰ়ই বুজিব পৰা এই কৃত্ৰিম ভাষাবোৰক সাধাৰণতে তিনিটা বৰ্গত ভাগ কৰিব পাৰি।

১) উচ্চ বৰ্গ। উদাহৰণ- জাভা, চি, পাৰ্ল, পাইথন ইত্যাদি।

২) মধ্যম বৰ্গ। উদাহৰণ- বেচিক, ফ’ৰট্ৰান ইত্যাদি।

৩) নিম্ন বৰ্গ। উদাহৰণ- এচেমব্লি।

এতিয়া আহোঁ সাংকেতিকীকৰণ পদ্ধতিলৈ। সংগণক যন্ত্ৰ়ই প্ৰধানতঃ সংখ্যাৰ সহায়ত আখৰ বা অন্য চিহ্নসমূহ সাঁচি থয়। অৰ্থাৎ একো একোটা সংখ্যাই একো একোটা আখৰক প্ৰতিনিধিত্ব কৰে। আমোদজনকভাৱে সংগণক যন্ত্ৰ়ই কেৱল শূন্য আৰু এক অংক দুটাহে চিনিব বা বুজিব পাৰে অৰ্থাৎ যন্ত্ৰটোক শিকাবলৈ, বুজাবলৈ বা কিবা কৰিবলৈ আদেশ দিবলৈ হ’লে তাক আমি শূন্য আৰু একৰ কিছুমান ক্ৰমতহে ক’ব লাগিব। অৰ্থাৎ সংগণক যন্ত্ৰ়ই মাজবাটতে আমি বুজি পোৱা আখৰসমূহ সংখ্যালৈ আৰু সংখ্যাসমূহ এক আৰু শূন্যৰ ক্ৰমলৈ সলনি কৰি লয়। উদাহৰণস্বৰূপে ইংৰাজী 'A' আখৰটোৰ সলনি ৬৫ আৰু ৬৫ক ১০০০০০১ লৈ সলনি কৰি লয়। গতিকে আমি 'A' টিপি দিলে ই ১০০০০০১ বুজি পায়। আমাৰ কাৰণে ৬৫ আৰু ১০০০০০১ একে সংখ্যা যদিও সংগণক বিজ্ঞানত এই সংখ্যাবোৰ কিছুমান মাত্ৰাত প্ৰকাশ কৰা হয়। যেনে-

১) দ্বিমূলক সংখ্যা

২) অষ্টমুলক সংখ্যা

৩) দহমুলক সংখ্যা

৪) ষোড়শমুলক সংখ্যা ইত্যাদি।

পোনপ্ৰথমতে সংগণক যন্ত্ৰ়ৰ সকলো কাম ইংৰাজী ভাষাৰ (যিহেতু ইংৰাজী এটা আন্তঃৰাষ্ট্ৰীয় ভাষা) লগত ৰিজাই কৰা হৈছিল। উদাহৰণস্বৰূপে আমি ছবি-ফলিৰ কথাই ক’ব পাৰোঁ। এতিয়া ইংৰাজীৰ বাহিৰেও আন ভাষাসমূহৰ লগতো ৰিজোৱাৰ কাম কৰি আছে সংগণক বিজ্ঞানীসকলে। জনপ্রিয় সাংকেতিকীকৰণ পদ্ধতিসমূহৰ ভিতৰত-

১) এ.এচ.চি.আই.আই. (এমেৰিকান ষ্টেন্ডাৰ্ড কোড ফৰ ইনফৰমেচন ইন্টাৰচেঞ্জৰ সংক্ষিপ্ত ৰূপ বা এচস্কী) হ'ল ইংৰাজী বৰ্ণমালাৰ ক্ৰমত ৰিজাই সজোৱা সাংকেতিকীকৰণ প্ৰক্ৰিয়া। ১৯৬০ চনত প্ৰকাশিত এই সাংকেতিকীকৰণ ক্ৰমটোৰ ভিত্তি আছিল টেলিগ্ৰাফিক সংকেত। এ.এচ.চি.আই.আই.-ৰ দুটা সংস্কৰণ আছে। এ.এচ.চি.আই.আই.-৭ আৰু এ.এচ.চি.আই.আই.-৮। ইয়াৰ প্ৰথম ৩২টা (০-৩১) সংকেট নিয়ন্ত্ৰণৰ বাবে, দ্বিতীয় ৩২টা (৩২-৬৪) সংকেত চিহ্নৰ বাবে, তৃতীয় ৩২টা সংকেত ইংৰাজী বৰফলাৰ বাবে আৰু চতুৰ্থ ৩২টা সংকেত ইংৰাজী সৰুফলা বাবে সংৰক্ষিত। সংগণক বিজ্ঞানীসকলে লিপি নিৰ্মাণৰ সময়ত অসমীয়া লিপিৰ প্ৰতিটো চিহ্ন এ.এচ.চি.আই.আই. সংকেতৰ ৩২-১২৭লৈ যিকোনো এটা সংখ্যা ৰিজাই লয়। এনেদৰে সজোৱা লিপিক এ.এচ.চি.আই.আই. লিপি বোলে।


২)আই.এচ.চি.আই.আই. (ইণ্ডিয়ান ষ্টেন্ডাৰ্ড কোড ফৰ ইনফৰমেচন ইন্টাৰচেঞ্জৰ সংক্ষিপ্ত ৰূপ বা ইচস্কী ) হ'ল সাংকেতিকীকৰণ প্ৰক্ৰিয়াত ভাৰতীয় লিখন প্ৰণালীৰ প্ৰতিনিধি। আন অৰ্থত আই.এচ.চি.আই.আই.ক আমি ব্ৰাহ্মী ভিত্তিক দহটা ভাৰতীয় লিপিৰ বৰ্ণসমূহৰ অধি-সংহতি বুলিও ক’ব পাৰোঁ । এই প্ৰণালীটোৱে সামৰি লোৱা ভাৰতীয় ভাষাৰ বিভিন্ন লিপিসমূহ হ’ল- অসমীয়া, বঙালী, দেৱনাগৰী, গুজৰাটী, গুৰুমূখী, কানাড়া, মালায়ালাম, উড়িয়া, তামিল আৰু তেলুগু।


সকলো ভাৰতীয় ভাষাৰ বৰ্ণক প্ৰতিনিধিত্ব কৰিব পৰাকৈ দহ লিপি মাৰি এক সংগণক লিপি সৃষ্টি কৰা এই উমৈহতীয়া সাংকেতিকীকৰণ প্ৰক্ৰিয়াৰ সুবিধাসমূহৰ ভিতৰত - লিপ্যান্তৰকৰণ, ভাষাৰ প্ৰযুক্তিগত দিশৰ উন্নয়ন... আদিয়েই প্ৰধান। এই সাংকেতিকীকৰণ প্ৰক্ৰিয়াৰ সাধাৰনতে দুটা সংস্কৰণ আছে। আই.এচ.চি.আই.আই.-৭ আৰু আই.এচ.চি.আই.আই.-৮। আই.এচ.চি.আই.আই.-৭ মানে ২^৭ = ১২৮ অৰ্থাৎ ইয়াৰ ০ৰ পৰা ১২৭লৈ মুঠ ১২৮টা বৰ্ণৰূপ থাকে। একেদৰে আই.এচ.চি.আই.আই.-৮ত (২^৮ = ২৫৬) ০ৰ পৰা ২৫৫লৈ মুঠ ২৫৬ টা বৰ্ণৰূপ থাকে। আই.এচ.চি.আই.আই.-৮ত ভাৰতীয় ভাষাৰ বৰ্ণৰূপৰ লগতে ইংৰাজী বৰ্ণৰূপও সন্নিহিত থাকে। ইয়াৰে প্ৰথম ১২৮টা (০ৰ পৰা ১২৭লৈ) বৰ্ণৰূপে ইংৰাজী ভাষাক আৰু দ্বিতীয় ১২৮টা (১২৮ৰ পৰা ২৫৫লৈ) বৰ্ণৰূপে ভাৰতীয় ভাষাৰ লিপিক প্ৰতিনিধিত্ব কৰে। উদাহৰণস্বৰূপে ইংৰাজী 'A' আখৰটো বুজাবৰ বাবে ৬৫ সংখ্যাটো, ইংৰাজী 'B' আখৰটো বুজাবৰ বাবে ৬৬ সংখ্যাটো সংৰক্ষিত থাকে। একেদৰে প্ৰতিটো আখৰ, প্ৰতিটো চিহ্ন বুজাবৰ বাবে একোটাকৈ সংখ্যা সংৰক্ষিত থাকে। একেদৰে ভাৰতীয় লিপিৰ প্ৰতিটো আখৰ, প্ৰতিটো চিহ্ন বুজাবৰ বাবেও একোটাকৈ সংখ্যা সংৰক্ষিত থাকে। (যেনে হিন্দী/অসমীয়া 'অ' বৰ্ণটোৰ বাবে ১৬৭ সংখ্যাটো, 'খ' বৰ্ণটোৰ বাবে ১৬৮ সংখ্যাটো ইত্যাদি)


কিন্তু আটাইতকৈ পৰিতাপৰ কথাটো হ’ল, এচস্কী, ইচস্কী বা আন সাংকেতিকীকৰন পদ্ধতিসমূহৰ ইটোৰ লগত সিটোৰ মিল নাছিল। দুটা পদ্ধতিয়ে একেটা সংখ্যাকে দুটা বেলেগ বেলেগ চিন বুজাবলৈ নাইবা একেটা চিনৰ বাবে দুটা সংখ্যা ব্যৱহাৰ কৰিব পাৰে। গতিকে এটা সংগণক যন্ত্ৰত কোনো তথ্য বেলেগ বেলেগ প্ৰণালীৰ মাজত বিচৰণ কৰোঁতে সি ভুল কৰাৰ আশংকা বেছি থাকে। অৰ্থাৎ পৃথিৱীৰ সকলো লিপি এচস্কী বা ইচস্কীৰে প্ৰকাশ কৰিব নোৱাৰি। গতিকে আমাক এনেকুৱা এটা সাংকেতিকীকৰন পদ্ধতি/মাধ্যমৰ প্ৰয়োজন হ’ল যিয়ে পৃথিৱীৰ সকলো লিপিকে সাংকেতিকভাৱে সংৰক্ষণ আৰু প্ৰকাশ কৰিব পাৰে! ইউনিক’ড হ’ল এনে এক সাংকেতিকীকৰণ মান যিয়ে এই সকলো সমস্যাৰ সমাধান কৰিছে।


৩) ইউনিক’ড: ইউনিক’ড হৈছে একক, সৰলীকৃত আৰু বিশ্বজনীন কাৰিকৰী সাংকেতিকীৰণ মান। জ’ বেকাৰ, লী কলিনচ আৰু মাৰ্ক ডেভিচ নামৰ লোক তিনিজনে ১৯৮৯ চনত একক সাংকেতিকীৰণৰ বিষয়ে কাম কৰিবলৈ আৰম্ভ কৰি ১৯৯১ চনৰ শেষৰফালে সকলো লিপি/ভাষাৰ বাবে এক সৰলীকৃত, বিশ্বজনীন মান প্ৰকাশ কৰে। পিছলৈ এই মান সকলোৱে মানি লয় আৰু তেওঁলোকৰ অপেছাদাৰী সংগঠনটো ইউনিক’ড Consortium নামৰে জনজাত হয়। পিছলৈ এই অপেছাদাৰী সংগঠনটোত বিশ্বৰ প্ৰায়বোৰ দেশৰ প্ৰতিনিধিয়ে যোগদান কৰে। তথ্য মন্ত্ৰালয়, ভাৰত চৰকাৰ হ’ল ইউনিক’ড Consortiumত আমাৰ প্ৰতিনিধি। শেহতীয়াকৈ ইউনিক’ডে বিশ্বৰ ৯৩টা লিপিৰ ১,০৭,০০০টা বৰ্ণ/চিহ্নক সামৰি লৈছে|


আমাৰ 'ক' আখৰটো বুজাবৰ বাবে ইউনিক’ডত 'U+0৯৯৫' মান়টো সংৰক্ষিত আছে। অৱশ্যে আপুনি এই মানটো অসমীয়া 'ক' হিচাপে ইউনিক’ডত বিচাৰি নাপায়। কাৰণ আমাৰ অসমীয়া ভাষাৰ বাবে ইউনিক’ডত সুকীয়াকৈ এটা শ্ৰেণী নাই, বঙালী ভাষাৰ লগতেই আমাক আৰু মনিপুৰী ভাষাক ৰখা হৈছে। 'U+0৯৮0' ৰ পৰা 'U+0FF' লৈ শ্ৰেণীটো বঙালী ভাষাৰ বাবে সংৰক্ষিত। অসমৰ আন এটা স্বীকৃত ভাষা বড়োকো দেৱনাগৰী লিপিৰ ভিতৰত ৰখা হৈছে। বিশ্বৰ প্ৰতিটো বৰ্ণ/চিহ্ন ইউনিক’ডে (U+এটা ষড়মাত্ৰীয় সংখ্যা)ত আৰু প্ৰতিটো লিপি/ভাষাৰ বাবে এটা নিৰ্দিষ্ট শ্ৰেণী বান্ধি দিয়া থাকে। গতিকে যিকোনো এটা ইউনিক’ড মান পালে আমি তৎক্ষনাত ক’ব পাৰো যে মানটোৱে কি বৰ্ণ/চিহ্ন বুজায়, ই কোন ভাষাৰ আৰু ইয়াৰ নাম কি।


বিশ্বজনীন বৰ্ণমালা(UCS: Universal Character Set)ৰ পৰিবৰ্ত্তিত ৰূপ(UTF: UCS Transformation Format)-ৰ আটাইতকৈ জনপ্ৰিয় সংস্কৰণটো হৈছে - ইউ. টি. এফ.-৮। বিশ্বজনীন বৰ্ণমালাৰ পৰিবৰ্ত্তিত ৰূপৰ আন সংস্কৰণবোৰৰ ভিতৰত ১) ইউ. টি. এফ. - ১ (UTF-1: UCS Transformation Format) ২) ইউ. টি. এফ. - ৪ (UTF-4: UCS Transformation Format), ৩) ইউ. টি. এফ. - ১৬ (UTF-16: UCS Transformation Format), ৪) ইউ. টি. এফ. - ৩২, (UTF-32: UCS Transformation Format) আদিয়েই প্ৰধান।

Popular posts from this blog

Word Formation Process of Assamese

Word formation is the process of creating new words. In other words the ways in which new words are made on the basis of other words or morphemes. Most English vocabulary arises by making new lexemes out of old ones--either by adding an affix to previously existing forms, altering their word class, or combining them to produce compounds. These processes of construction are of interest to grammarians [1]. In this report I will try to write something on “Word formation of Assamese (Asomiya)”. The word Assamese is an English one, built on the same principle like Japanese, Chinese etc. The history and philology of the Assamese language was scientifically studied and presented for the first time by Dr. Banikanta Kakati[2]. The first Assamese grammar, “A Grammar of the Assamese Language” by William Robinson was published in 1839. In 1848, Nathan Brown published an Assamese Grammar, and in 1894, Prof. Nicholl published his “Sketch of Assamese Grammar”. After the work of Dr. Banikant Kakati, a

Assamse Loan words : অসমীয়া ধাৰ কৰা শব্দ

Loanwords are words adopted by the speakers of one language ( target language ) from a different language (the source language ). A loanword can also be called a borrowing words . It is a consequence of sociocultural contact between two language communities. Borrowing of words can go in both directions between the two languages in contact, but often there is an asymmetry, such that more words go from one side to the other. In this case the source language community has some advantage of power, prestige and/or wealth that makes the objects and ideas it brings desirable and useful to the borrowing language community. The following are some example of Assamese loan words and source language. TRANSLATED LOAN WORD বাতৰি কাকত bat ɔri kakɔt (news paper) স্বৰ্ণ যুগ sɔbərnɔ zug (golden era) ৰূপালী জয়ন্তী rupali zɔjənti (silver jubilee) কন্দুৱা গেছ kɔndua ges (tear gas) দূৰদৰ্শন durdɔrχɔn (television) MARATHI WORDS তাঙৰণ taŋɔrɔn (edition) বৰঙণি bɔr

Assamese Stop-word list

যিবোৰ শব্দই natural language processing ত সহায় নকৰে, তেনেকুৱা শব্দৰ এখন তালিকা তলত দিয়া হল। যিসকলে Information Extraction, Text Summarization, Search Engine Optimization আদি ক্ষেত্ৰত কাম কৰি আছে তেওঁলোকৰ বাবে তালিকা খন সহায়ক হব বুলি অাশা কৰিলো। Stop word ৰ বিষয়ে অধিক জানিবৰ বাবে - http://en.wikipedia.org/wiki/Stop_words অতএব অথচ অথবা অধঃ অন্ততঃ অৰ্থাৎ অৰ্থে আও আঃ আচ্ছা আপাততঃ আয়ৈ আৰু আস্‌ আহা আহাহা ইতস্ততঃ ইতি ইত্যাদি ইস্ ইহ উঃ উৱা উস্‌ এতেকে এথোন ঐ ওঁ ওৰফে ঔচ্‌ কি কিম্বা কিন্তু কিয়নো কেলেই কাচিত্‍ চোন ছাৰি ছিকৌ ছেই ঠাহ্ ঢুত্‍ ঢেঁট্‌ তত ততক ততেক তেতেক ততেক তত্ৰাচ তথা তথৈবচ তাতে তেও তো তৌৱা দেই দেহি দ্বাৰা ধৰি ধিক্ নচেত্‍ নতুবা নি নো নৌ পৰা পৰ্যন্ত পশ্চাত্‍ বৰঞ্চ বহিঃ বাবে বাৰু বাহ্‌ বাহিৰে বিনে বে মতে যথা যদি যদ্যপি যে যেনিবা যেনে যোগে লৈ সত্ত্বে সমন্ধি সম্প্ৰতি সহ সু সেইদেখি সৈতে স্বতঃ হঞে হতুৱা হন্তে হবলা হয় হা হুঁ হুই হে হেই হেঃ হেতুকে হেনে হেনো হেৰ হেৰি হৈ হোঁ ইঃ