ஒரு பார்வை

June 9, 2006

Tamil Unicode ?! -1

Filed under: Tamil Unicode — CAPitalZ @ 1:40 pm

ISCII is centralized on HINDI script. Even though its Devanagiri, the order of characters is based on Hindi not any other languages that uses Devanagiri. Hindi language gets all the facilities of binary sorting while no other Indian scripts gets it.

Indian government blindly gave the ISCII to UNICODE. So still other Indian languages doesn’t get the facility of binary sorting.

The characters are not in order.

In English encoding, the alphabet is in correct order. It also has the facility of converting from lower case to upper easily in binary.

The very disturbing fact is that our language needs sophisticated processing to display/ sort/ and store in Unicode, the future encoding, while Hindi gets all the facilities.

I’m seriously doubting the role of Indian government. Is Indian government, by all means, trying to supress other languages? This is what they call “a systematic eliminination”. You go to a job interview and the interviewer doesn’t want to hire you because you are brown/low caste/ etc, he rejects you by giving stupid reasons. Technically he is not racist/ castist. Likewise a government doesn’t give economic opportunites to a certain types of people, hence systematically eliminating their community.

If only all our characters were encoded in UNICODE, we could have had a very simplistic font, just like how English/ French/ Spanish fonts are, for our beloved language. All French/ Spanish accents were encoded while our languages were denied. We could have enjoyed the efficiency of binary sorting. No need for complex software; no need for software developers to develop all sorts of softwares; no need for new softwares for a basic user, just like English.

Oh lord, why?

Thanks to Indian government + Unicode Consortium for not allowing to change, our beloved languages will fade in the mist of Hindi.

பாகம் – 02 >>

______
CAPital

FACT: When Unicode Consortium denied all character encoding for Chinese, the Chinese government said, it will not allow Unicode to be used in the premises of greater China. The result, Unicode Consortium gave space for all character encoding for Chinese.

Is this the way you protect your langueges India?

3 Comments »

  1. அருமையான பதிவு, இன்னும் எழுதுங்கள் தோழர்
    ஸ்ரீஷிவ்

    Comment by songoftheheart — June 9, 2006 @ 6:08 am | Reply

  2. உலக மென்பொருளாளர்கள் ஒருங்குறிக்கு மாறிவிட்ட நேரத்தில், நீங்கள் போய் தமிழ் முழுக்கப் பிழை; முழுக்க மாற்று என்று சொன்னால் அவர்கள் ………….

    நான் தங்களைப் போன்ற கணினி வல்லுநன் அல்லன். தவறானதைத் தவறு என்று சொன்னால் அவர்கள் …………. என்று நீங்கள் கூறுவது சரியா? பல்லாயிரம் ஆண்டுகளாக உலகம் தட்டை என நம்பிவந்தவர்களிடம் உலகம் உருண்டை என்று கலிலியோ கூறியது தவறா. இந்திய அரசோ அல்லது தமிழக அரசோ அல்லது கணினி வல்லுநர்களோ ஒருங்குறியேற்றத்தில் தவறு செய்திருக்கிறார்கள் என்பது உண்மையா இல்லையா?
    தவறு செய்துள்ளார்கள் என்பதை நீங்களே எழுதியிருக்கிறீர்கள். அப்படி செய்யப்பட்ட தவற்றைச் சுட்டிக்காட்டுவது எந்த விதத்தில் தவறு என்று எனது சிற்றறிவுக்கு எட்டவில்லை. எனவே தங்களின் முதல் மூன்று வரிகளை வன்மையாக மறுக்கின்றேன்.

    Comment by இளங்குமரன் — June 9, 2006 @ 11:30 pm | Reply

  3. இளங்குமரன் அவர்களே,

    ஒருங்குறி ஒன்றியம் பிழை செய்யவில்லை. தவறெல்லாம் இந்திய அரசாங்கத்தின் மீதே உள்ளது.

    தவறு என்றாலும் அவை திருத்த முடியாத தவறுகள் அல்ல. நான் மேலே குறிப்பட்டதுபோல், “க்” இல்லை, ஆனால் “க” வும் “புள்ளி” யும் உள்ளன. ஆகவே நீங்கள் “க்” ஐப் பெறலாம். தமிழ் இலக்கணப் படி “க்” தான் மெய், “க” அல்ல. “க்” தான் எழுத்து, “க” அல்ல. ஒருங்குறி ஒன்றியத்தின் கோட்பாட்டில் முதன்மை எழுத்துக்களே ஏற்றவேண்டும் என்று குறிப்பிடப்பட்டுள்ளது.

    தமிழ் எழுத்து வரிசை ஒழுங்கு மாறி உள்ளது. இதையும் மென்பொருளின் மேலதிக சேவைமூலம் கணினியில் வரிசைப்படுத்தலாம்.

    எங்கே இப் பிழைகள் சிக்கலைக் கொடுக்கும் என்றால், அவை மென்பொருள் தாயாரிப்பாளர்களுக்கே.

    ஆகவே, இவை எல்லாம் சாதாரண கணினி பாவிப்பவருக்கு, சரியாக தெரியும் வண்ணம் செய்ய இயலும். உலகம் தட்டை என்பது போல் முற்றுமுழுதான பிழை இல்லை.

    ஆனால், சரியாக தமிழ் எழுத்துக்கள் ஒருங்குறியத்தில் ஏற்றப்பட்டிருந்தால், தமிழுக்கு மேலதிக “advantage” ஆக இருந்திருக்கும். ஃகிந்தி மொழி ஒழுங்கு வரிசையாக ஏற்றப்பட்டுள்ளது. இந்திய அரசாங்கம் ஃகிந்தி மொழிக்கு ஏற்பவாறே, மற்றய இந்திய மொழிகளை பிரித்தும், வரிசைப்படுத்தியும் உள்ளது.

    இந்திய அரசாங்கம் எதை சமர்ப்பித்ததோ, அதை அவ்வாறே ஒருங்குறி ஒன்றியம் ஏற்றியுள்ளது. ஒருங்குறி ஒன்றியம் இப்போ என்ன சொல்கிறதென்றால், இது ஒரு மிகப் பெரும் பிழை அல்ல. மென்பொருளால், சரி செய்யலாம். ஒருங்குறியை பாவித்து பல மென்பொருள் தயாரிப்பாளர்கள் தயாரித்தும் விட்டார்கள். ஆகவே தங்களால் இனி மாற்ற இயலாது.

    புது செருப்புகள் இரண்டு உள்ளன. ஒரு செருப்பு அறுந்துள்ளது. எதிர்கால கணினி உபயோகத்தில் ஃகிந்தி அறாத செருப்பைப் போடும். தமிழ் அறுந்த செருபை தைத்துப் போடும். என்னதான் புதுச் செருப்பை பாவிக்க முடிந்தாலும், அறுந்து தைத்த இடம் எப்பொழுதும் கடிக்கும். இதனால் கணினி efficiency ஐப் பொறுத்த வரையில், தமிழை விட ஃகிந்தி எப்பொழும் முதன்மையாகவே கருதப்படும்.

    ______
    CAPital

    Comment by CAPitalZ — June 10, 2006 @ 10:32 am | Reply


RSS feed for comments on this post. TrackBack URI

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

Blog at WordPress.com.

%d bloggers like this: