ஒரு பார்வை

June 23, 2006

தமிழ் ஒருங்குறி ?! -10

Filed under: Tamil Unicode — CAPitalZ @ 1:13 pm

1) ஒருங்குறி என்பது ஒரு இந்திய தகுதரம் அல்ல. உலக தகுதரம். அதனால், அனுஸ்வரா, விசர்க்கம் என்று தமிழ் எழுத்துக்களுக்கு உலக மேடையில் பெயர் வைக்கத் தேவையில்லை.

ஐயா உலக மேடையில் “தமிழ்” இன் உச்சரிப்பு “டமில்” [Tamil] என்று தான் இருக்கிறது. உலக மேடையில், ஆய்தத்தின் உச்சரிப்பு விசர்க்கம் என்றே இருக்கும்.

2) உலக மேடையில், தமிழ் எழுத்துக்கள் ஒழுங்கு மாறி வைக்கப்பட்டுள்ளது.

3) இந்தப் பிழைகளை, ஒருங்குறி ஒன்றியம் செய்யவில்லை. இந்திய அரசாங்கமே செய்தது.

வட மொழிகளில் உள்ள சத்தங்களை தமிழில் கொண்டுவருகிறோம் என்று கொண்டுவந்து தமிழ் எழுத்துக்களைக் கூட்டினார்கள். ஏன் உலகில் உள்ள எல்லா சத்தங்களுக்கும் தமிழில் ஒரு எழுத்து உருவாக்கி இருக்கலாமே? [சிங்களத்தில் உள்ளது போல்]

ஆகவே, அப்போதிலிருந்தே வடமொழிக்கு ஏற்பவாறே தமிழ் மாற்றியமைக்கப் பட்டு வருகிறது.

இதை வாசியுங்கள்: http://www.indiawebdevelopers.com/technology/oracle9i/sorting.asp


Conventionally, when character data is stored, the sort sequence is based on thenumeric values of the characters defined by the character encoding scheme. This is called a binary sort.

Binary sorts are the fastest type of sort, and produce reasonable results for the English alphabet because the ASCII and EBCDIC standards define the letters A to Z in ascending numeric value.

[Please note the point, the BINARY sorting is only possible because the letters are in order]

[Here is how our Tamil may be sorted]

A linguistic sort operates by replacing characters with numeric values that reflect each character’ s proper linguistic order. These numeric values are found in a table containing major and minor values.

இதற்கு கீழ் குறிப்பிடப் படும் முறைகள் எல்லாம், தமிழ் போன்ற [level-2] மொழிகளுக்கு. பாருங்கள் எவ்வளவு மேலதிக processing தேவை என்பதை.

காலப்போக்கில், இந்த நேர இடைவெளி வெகுவாக குறையும், ஆனால், இவை தேவை என்பது நிரந்தரமே.

****************************

Using linguistic indices you can provide the sophisticated sorting capabilities of a multilingual sort while achieving sorting performance nearly as good as a binary sort (which offers the best performance).

****************************

Binary sort is NOT possible for present day Tamil Unicode!

 

 

பாகம் – 11 >>

<< பாகம் – 09

_____
CAPital

Leave a Comment »

No comments yet.

RSS feed for comments on this post. TrackBack URI

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

Create a free website or blog at WordPress.com.

%d bloggers like this: