Кодочлол

Badral's personal blog


TOGGLE NAVIGATION

What is encoding?


Published by badaa on 2018/01/22

Цахим тооцоолуурт бид тоглоом тоглох, зураг зурахаас бусад бараг бүх ажлыг бичиж хийдэг. Программ бичих, баримт боловсруулах, хоорондоо э-мэйлээр, чатаар харилцах гээд бүгд орно. Тэгвэл тэмдэгт кодчилол гэдэг нь ердөө л ямар үсгийг хэд гэсэн кодоор тэмдэглэж хадгалахыг заадаг стандарт юм.
Яагаад заавал стандарт гэж?
Бат А үсгийг 12, В үсгийг 65, Цэцэг А-г 65, В-г 12 гэсэн кодоор код оноож хадгалаад байвал хоорондоо яаж ойлголцох вэ? ААВ гэж бичихэд Батын тооцоолуурт 12 12 65, Цэцэгийнхэд 65 65 12 гэж хадгалагдана. Тэгэхээр Батын ААВ гэсэн үгийг Цэцэг ВВА, Цэцгийн ААВ гэсэн үг Батад ВВА болж харагдана гэсэн үг. Тиймээс хоёулаа үсэг бүрээ ижил кодоор тэмдэглэж байж л хоорондоо зөв ойлголцоно гэсэн үг.
Бид нэг тэмдэгт буюу үсгийг 1 байт гэж үзэж тооцоолуурт тэмдэглэдэг тухай дунд сургуульдаа үздэг боловч боловч өдгөө ихэнхдээ 2 ба түүнээс дээш байтаар хадгалж байна.
Яагаад?
Анх компьютер үүссэн цагаас эхлэн ASCII хэмээх стандартаар кодолж байсан бөгөөд нийт 7 битээр тэмдэглэж байв. 1 бит нь 0 эсвэл 1 гэсэн утга авах боломжтой тул 2^7 буюу 128 тэмдэгт л тэмдэглэх боломжтой юм. Тиймээс тэрхүү 128 тэмдэгтэд зөвхөн Англи латин цагаан толгойн үсгүүд болон Араб 10 цифр болон бусад онцгой тэмдэгтүүд л багтжээ.
Гэтэл германы умлауттай (ä,ö,ü), францын диалекттай (á, â,…) гэх мэт үсгүүд багтаж чадаагүй юм. Тиймээс ANSI тэмдэгт кодчилол үүсжээ. Ингээд европын улсууд бичиг үсгээ Latin 1, Latin 2, … Latin 8 гэсэн нэрээр өргөтгөж оруулж ирснээс гадна кирил бичиг ч бас KOI бүл, RUSCII, CP866, CP1251 гэх мэтээр 128-256 дахь байрлалууд дээр үсгээ байрлуулж кодолж эхэлжээ. Гэтэл энэ нь хоорондоо харилцахад олон асуудлыг дагуулж эхэлсэн бөгөөд латин үсгүүд ч хоорондоо хөрвөж чадахгүй байлаа. Жишээлбэл илгээгч Latin1 тэмдэгт кодчиллоор бичээд явуулахад хүлээн авч буй хүн Latin2-р уншихад хэдий ижил латин үсгүүд боловч үг нь утгагүй алдаатай болж харагдах жишээний өмнө дурдсан ASCII кодчиллын асуудлууд гарч байв. Бид ч бас тэр зовлонг дайрсан. Ариал мон фонтын асуудал гэвэл хүн бүр мэднэ дээ. Одоо ч асуудалтай хүмүүс байсаар байдаг.
Ингээд Майкрософт, Адобэ, АйБиЭм гэх мэт мэдээллийн системийн томоохон корпорациуд бүгд нэг ширээний ард сууж тохиролцохоос өөр аргагүй болсон юм. Хорвоо ертөнцийн бүх зүйл шүтэн барилдлагаар оршин тогтнодгийн нэг жишээ энэ юм. Улс бүр өөр өөрийн тогоон дотроо кодчилоод хоорондоо бичиг үсгээр харилцах аргагүй байдалд оржээ гээд ойлгочиход болно. Ийнхүү ЮНИКОД хэмээх байгууллага үүсэж дэлхийн бүх бичгийг нэгтгэсэн тэмдэгт кодчиллын стандарт бий болгохоор ажиллаж эхэлжээ. Нэг тэмдэгтийг хадгалах зайг 2 болгож өргөтгөсөн боловч дэлхий дээр санаанд оромгүй олон бичиг байдаг болж таарснаар цааш нэг тэмдэгтийг 3,4 байтаар тэмдэглэх болсон байна. Түүнийг дагаад өөр техникийн асуудлууд ч урган гарч эхэлжээ. Жишээлбэл нэг бичгийн өөр өөр тэмдэгт зарим нь 2 зарим нь 3 байтаар тэмдэглэгдэж байхад яаж хоорондох зохицлыг нь барих вэ? Олон давхар тэмдэгт кодчилол үүсвэл яах вэ? гэх мэт. Одоогоор Юникод стандартын 10 хувилбар гарсан бөгөөд ISO стандарт шууд авч баталдаг. Өмнөх нийтлэлд дурдаж байсанчлан локаль нь цахим орчинд улс орны тусгаар тогтнолыг илэрхийлж байдаг бол Юникод нь бичиг үсгийн оршин тогтнолыг илэрхийлэх хэмжээнд хүрчээ. Тус байгууллага болоод стандарт ийм хүчирхэг болсон шалтгаан нь ерөөсөө л их гүрэн, жижиг улс эсвэл хүчирхэг том компани гэж тус тусын амбицыг хөөж гүрийж суулгүйгээр нэгдэж чадсан явдал юм. Тиймээс дэлхийн хүн бүр тус стандартыг хүссэн хүсээгүй хэрэглэх болжээ.
Юникод стандартын ачаар бид кирил бичгийн ө,ү үсгийн асуудлаас гарсан юм. Мөн Монгол бичгээ ч эхний хувилбараар оруулж дөнгөсөн боловч асуудлаа бүрэн дүүрэн шийдэлгүй хаяснаас болоод өдгөө олон асуудлыг дагуулж, өдөр тутмын хэрэглээнд нэвтэрч өгөхгүй байгаа нь харамсалтай. Мөн Юникод байгууллагын ч шүдний өвчин болоод байгаа юм.
Яг юу нь асуудал болоод яагаад гэдгийг тусад нь тайлбарлахгүй бол энгийнээр тайлбарлахад нэлээд түвэгтэй. Нэг тэмдэгтийн дүрс буруу эсвэл дутуу л бол тус бичгээр бичих, хэрэглэх ямар ч боломжгүй болчхож байгаа юм. Жишээ нь та х үсэг байхгүйгээр кирилээр бичих гээд оролдоод үзвэл чадах уу? Эсвэл Z үсгийн дээд доод зураас дутуу байсан бол латин бичиг хэрэглэж чадах уу? Эсвэл Z үсгийг 1. дээд хөндлөн зураас, 2. Ташуу зураас, 3. Доод хөндлөн зураас гэж 3 удаа товчлуур дарж байж гаргаж ирж бичдэг бол ямархуу бүтээмжтэй байх сан бол? Эдгээр нь зөвхөн хэрэглээ дагасан өнгөц асуудал бөгөөд нарийвчилбал арай өөр асуудлууд руу ороод явчихна. Жишээлбэл та Attack of the Mongolian Vowel Separator гэж сонссон уу? Үгүй бол Гүүглэдээд үзээрэй. Нэг тэмдэгтийн класс 2 удаа өөрчлөгдөх хооронд хакердуулах хэмжээнд хүрчхэж байгаа юм. За тэгээд гараас хэрхэн хялбар оруулах, хэрхэн эрэмбэлэх, дэлгэцэд хэрхэн үзүүлэх буюу ренжер, фонттойгоо хэрхэн уялдах, хуучин legacy системүүдэд яаж дэмжигдэх зэргийг шийдэх цогц асуудал болдог.

Categories: ЮМ ЮМНААС

Tags: charsetEncodingunicodeтэмдэгт кодчилол

  

Leave a Reply


Name *

Email *

Website

What's on your mind?

Болор толь

Bolor Dictionary

MN<->EN

Болор дуран

http://spell.bolorsoft.com

Хөрвүүлэгч

Бичвэр хөрвүүлэгч http://badaa.mngl.net/convert/con2uni.htm

Ангилал

Aspell


GNOME/ГНОМЕ


Xslides


Англи хэл


Аюулгүй байдал


Болорсофт


Ерөнхий


Компьютерын ухаан


ЛаТекс/Текс


Линүкс


Монгол хэл


Нэт програмчлал


Нээлттэй эх


Опенофис


П.Х. инженерчлэл


Сонирхолтой сэдэв


Сургалт

ПХ архитектур


Хобби

Астрономи


Физик


Юм юмнаас


Блогууд

Баярсайхан


Г. Тэгшбаяр


Галзуу хүмүүс


Д. Өлзий-орших


Д. Сайнбаяр


Д. Цэрэнбат


Дусал


Ж. Тамир


Л. Баянзул


Ууганбаяр


Хүрэлбаатар


Хэлний хэрэгсэл


Эрдэнэбаяр


Эрдэнэчимэг


Шинэхэн бичлэгүүд

What is encoding?


What is locale?


A list of the best free audio books in English


What is energy?


What is color?


Naadam festival


Why are we not flying? No, we are flying!


Biography: Werner Heisenberg


One of the most important physicists of the 20th century


Childhood memories - MSX Basic


Шинэхэн сэтгэгдлүүд

Ган-Од on What is locale?


Ган-Од on What is locale?


Ok1 on Програм хангамжийн инженер болох гэж буй залууст


badaa on What is locale?


Ган-Од on What is locale?


Блогийн зочид

» wp.com stats helper

Архив

January 2018


November 2017


August 2017


July 2017


January 2017


December 2016


March 2016


November 2015


October 2015


September 2015


April 2015


November 2014


July 2014


June 2014


March 2014


February 2014


January 2014


December 2013


November 2013


June 2013


April 2013


March 2013


February 2013


January 2013


December 2012


November 2012


August 2012


May 2012


April 2012


March 2012


February 2012


January 2012


November 2011


May 2011


March 2011


February 2011


January 2011


December 2010


October 2010


August 2010


July 2010


June 2010


May 2010


April 2010


March 2010


February 2010


January 2010


November 2009


August 2009


June 2009


May 2009


January 2009


December 2008


November 2008


October 2008


September 2008


July 2008


June 2008


May 2008


April 2008


March 2008


February 2008


January 2008


December 2007


November 2007


October 2007


September 2007


August 2007


July 2007


June 2007


May 2007


Цаглабар

February 2018MTWTFSS« Jan   12345678910111213141516171819202122232425262728 

Tags

Bayarmagnai BindingManagerBase Bolor dictionary Bolor spell CDSL C Memory overflow copyright C programmingDateTimePicker control debian EF4 bug EF4 designer Entity framework GNU C Segmentation fault Jonathan Schwartz large array problem in CLarge model problem with EF4 Linux kernelMongolian bow and Airbus mongolian keyboard Mongolian Localization Mongolian openoffice mongolian script Mongolian terminology MSL MySQL database migrationoffshoring OpenMN OSS terminology projectoutsourcing Software architecture SSDL SUNubuntu winmail.dat winmail.dat on linuxБОЛОР алдаа шалгуур Баярмагнай БолорБолор спелл Болор тольМатематикч Програм хангамжийн архитектур сүлжээний протоколууд цагаан сар

Удирдлага

Log in


Entries RSS


Comments RSS


WordPress.org


Related Posts


АЮУЛГҮЙ БАЙДАЛ

Naadam festival

Наадам болоход сэтгэл сэргээд сайхан байдаг ч хэцүү санагддаг 2 зүйлийн нэг нь буруу өнгөтэй далбаа, нөгөө нь Монгол цэргийн сүр хүчийг илэрхий дараад зогсохгүй, алиа салбадай мэт харагдуулдаг энэ хувцас билээ. Ямар сайн ерөнхийлөгчRead more…

ЮМ ЮМНААС

Childhood memories – MSX Basic

Өнгөрсөн 11 сард 10 жилийн ангийнхан маань Оюунчимэг багшийнхаа нэрэмжит математикийн олимпиадыг зохион байгуулж, сургууль дээрээ өнжөөд ирэв. Хүүхэд насны дурсамж сэргээд сайхан байлаа. Архангайн математик сэргэж байгааг хараад сэтгэл сэтгэж, урам аваад аян замынRead more…

ЕРӨНХИЙ

Should we translate or transcribe or transliterate?

За нэг жигдэрч өгдөггүй, нийгмээрээ талцаж үзэлцэж үзэлцсээр одоо эх хэлээ эвдэж дуусаж байгаа нэг сэдвийг хөндчихье. Гадаад үг, нэр томьёог хэрхэн орчуулах вэ гэдэг сэдэв. Би өөрөө хэлний эсвэл орчуулагч мэргэжилтэй хүн биш лRead more…

BLOG


 

FRONT PAGE


 

МИНИЙ ТУХАЙ


 

ХАРИЛЦАХ


Hestia | Powered by WordPress


Comments

Post a Comment

Popular posts from this blog

Гариг өдрийн нэрс

Удирдагчын сахих ёс ном

Анхны Гадаадад СУРАЛЦАГЧИД