ஒரு பார்வை

October 3, 2006

தமிழ் ஒருங்குறி ?! – 17

Filed under: India,Internet,Tamil Unicode — CAPitalZ @ 10:39 am

ஒரு சட்டம், வரையறை, கோட்பாடு இயற்றுவதில் வெள்ளைக்காரன் கெட்டிக்காரன் தான். ஏனெனில், அவன் மற்ற இனத்தவர்களை விட இவைகளை இயற்ற முதலில் எத்தணித்தவன். ஆகவே, அவனுக்கு பல முறை முட்டி மோதி, பல முறை மேம்படுத்தி பழக்கப்பட்டவன். இன்றும், கையில் அதிகாரம் இருந்தால் கூட களவு செய்ய முடியாதபடி (அ) செய்தாலும் பிடிபடும்படி நுணுக்கமாக ஒரு கட்டமைப்பை உருவாக்கி இருப்பதால் தான், கடையின் சொந்தக் காரன் வீட்டில் இருக்க வேலைக்காரன் கல்லாவில் அமர்ந்தாலும் கடை நஷ்டத்தில் போவதில்லை.

ஆகவே, ஒருங்குறி அமைப்பின் சட்ட திட்டங்கள் சரியானதாகவே இருக்கலாம். ஒருங்குறி ஒரு உலக மொழி ஒருங்கமைப்பு என்ற ரீதியில் நோக்குவோமானால் அவர்களின் சட்ட திட்டங்கள் மிகச் சரியானவையே. அதையே, தமிழை மட்டும் பார்த்தால், தமிழுக்கு விவேகக் குறைவே. இருந்தாலும் தமிழை மட்டும் அவர்களால் பார்க்க இயலாது. ஆகவே அவர்கள் நிலைப்பாடு சரியானதே.

இதில் இருந்து என்ன கற்றுக்கொள்ள வேண்டிய விடயம்? இனிமேலாவது தமிழ் மொழியை யாரும் பார்த்துக்கொள்வார்கள் என்று விடாமல், நாம் தாம் நம் மொழியின் முன்னேற்றத்திற்கு உழைக்க வேண்டும். இதை தமிழர்கள் உணர்வார்களா என்பது கேள்விக்குறி.

ஒருங்குறி உதவி வருங்காலத்தில் சகல மென்பொருளிலும் வழங்கப்படும். அதில் ஐயமில்லை. ஆதலால், எதிர்காலத்தில் தமிழுக்கு பிரச்சனை இருக்காது. ஆனால், மற்றய இடர்களான இடம், வேகம் என்பன இருந்து கொண்டே தான் இருக்கும்.என்னதான் தொழில்நுட்பம் வளர்ச்சி அடைந்தாலும், இன்னமும் பலருக்கு கணினியே கிட்டாத நிலை தானே நிலவுகிறது. அப்படியாயின், ஒருங்குறி வேலை செய்யக்கூடிய கணினி கிட்ட இன்னும் எத்தனை காலம் எடுக்கும் என்பதை எதிர்காலம் பதில் சொல்லும். இவ்வளவு காலமும் தமிழுக்கு ஒரு பின்னடைவே. மற்றய மொழிகள் வளர்ந்து கொண்டு வருகையில் தமிழ் மிக மெதுவாகவே துளிர்க்கிறது. இணைய முகவரி 255 எழுத்துக்களுக்குள் இருத்தல் வேண்டும். தமிழில் இணைய முகவரி வைத்தால் இந்த கட்டுப்பாட்டை இலகுவாக தாண்டும். இதை இப்போதே சில வலைப்பதிவாளர்களின் இடுகைகளில் கவனிக்கலாம். மேலதிக எழுத்துக்கள் வெட்டப்படுவதால் ஒழுங்காக வேலை செய்யாமல் போய்விடும்.   [மேலும் அறிய இடுகைகளில் தமிழில் தலைப்பு வைக்கும்போது கவனிக்கப்பட வேண்டியவை] இதை சரி செய்ய இன்னும் கொஞ்ச காலம் அதிகமாக தேவை. போராடிப் போராடியே பழக்கப்பட்டவர்கள் நாம். இதில் தோற்று விடுவோமா என்ன?

என்னைப் பொறுத்த மட்டில் இந்திய அரசாங்கம் இனிமேல் எந்த மாற்று கருத்துக்களையும் ஒருங்குறி அமைப்புக்கு எடுத்துச் செல்ல ஆதரவளிக்காது. அரசே ஆதரவளிக்காத போது ஒருங்குறி அமைப்பும் அதற்கு பெரிய முக்கியத்துவம் கொடுக்கப்போவது இல்லை. எப்பவும் பட்ட பின் தானே தமிழனுக்கு ஞானம் வரும்.

இருந்தாலும், தமிழின் மேம்பட்ட வடிவமைப்பை இன்று செய்து வைத்திருந்தால், எதிர்காலத்தில் உதவலாம் தானே. இனிமேல் எதாவது ஒரு அமைப்பு புதிதாக ஒரு முயற்சி செய்தால், அதற்கு தமிழை சரியாக, மிக மேன்மையானதாக வளங்கக்கூடியதாக நாங்களே முயற்சி செய்ய வேண்டும். அடுத்த முறையும் தவறினால், “குட்டக் குட்டக் குனிபவன் மொக்கன்” என்ற கதையாகிவிடும்.

<< பாகம் – 16

இடுகைகளில் தமிழில் தலைப்பு வைக்கும்போது கவனிக்கப்பட வேண்டியவை

Filed under: Tamil Unicode,WordPress Tips — CAPitalZ @ 10:39 am

வலைப்பதிவில் இடுகைகள் இடும்போது, தமிழில் தலைப்பை வைப்பதினால் சில தொழில்நுட்ப சிக்கல்களுக்குள் தள்ளப்படுகிறார்கள், நமது தமிழ் வலைப்பதிவாளர்கள். அவற்றை சரி செய்ய வழியை இங்கே தருகிறேன்.

ஒருங்குறித் தமிழ் கணினியில் வேலை செய்தாலும், எல்லா இடங்களிலும் ஒருங்குறித் தமிழ் வேலை செய்யாது. இதற்குக் காரணம் தமிழ் இரண்டாம் தர மொழியாக ஒருங்குறியில் ஏற்றப்பட்டதே. [மேலும் அறிய தமிழ் ஒருங்குறி?!]

உங்கள் இடுகைகளை தமிழ் தலைப்பில் சேமிக்கும்போது வலைப்பதிவு மென்பொருள் அந்த தலைப்பை இணைய முகவரியாக எடுத்துக்கொள்கிறது. ஆனால், “போ” என்பது இணைய முகவரி இடும் இடத்தில் அப்படி சரியாகத் தெரியாது. அது இணைய முகவரிகளை சேமிக்கும் முறையில் மாற்றியே தெரியும். அது மட்டுமல்லாமல் “போ” என்பது தமிழ் ஒருங்குறியில் 2 குறிகள். ஒரு குறி அல்ல. அப்படித் தான் தமிழ் ஒருங்குறி அமைக்கப்பட்டு இருக்கிறது. இப்போது நீங்கள் உங்கள் இடுகைக்கு “நான்” என்று தலைப்பைக் கொடுத்தால் அது உண்மையில் 4 குறிகள். இணைய முகவரிக்கு 255 எழுத்துக்களை தாண்டக் கூடாது என்பது விதியாகும். இப்போது நீங்கள் ஒரு பெரிய தமிழ் பெயரைக் கொடுத்தால், மீதமுள்ள எழுத்துக்கள் காணாமல் போய்விடும். அப்போ உங்கள் இடுகைகள் தெரியாமல் “404 – Page Not Found” என்று காட்டும் அல்லது பின்னூட்டமிட முடியாமல் இருக்கும். இந்த 255 எழுத்துக் கட்டுப்பாடே இதற்குக் காரணம்.

இதே 255 எழுத்து கட்டுப்பாடுதான் தமிழ் குழுமங்களில் தமிழில் தலைப்பை வைத்து அதற்கு மறுமொழி மின்னஞ்சலூடாக அனுப்பும்போது இழை பிரிந்து புதியதோர் இழை உருவாகுகிறது. ஒரு மிக நீண்ட எழுத்துக்களைக் கொண்ட தலைப்பில் கடைசியில் சில ஒருங்குறி குறிகள் வெட்டப்பட்டாலுமே அவை புதிய இழையாகிவிடும். கவனிக்கவும். நான் இங்கு எழுத்து என்னும்போதெல்லாம் தமிழின் ஒரு எழுத்தைக் குறிப்பிடவில்லை. தமிழ் “போ” என்பது ஒருங்குறியில் 2 குறிகள். அதே இணைய முகவரியில் இந்த இரண்டு குறிகளுமே மேலும் பல குறிகளாக மாற்றித் தான் உபயோகப்படுத்தப்படுகிறது. தமிழில் இரண்டெழுத்து தலைப்பு இணைய முகவரியாகும்போது பல எழுத்துக்கள்!
இதை சரி செய்ய வழிகள்:

  1. இடுகைகளுக்கு எந்தத் தலைப்பையும் கொடுக்காமல் முதலில் பிரசுரியுங்கள். வலைப்பதிவு மென்பொருள் [WordPress/ Blogspot] தானாகவே ஒரு இலக்கத்தைக் கொடுத்து சேமிக்கும். பின் அந்த இடுகையை திருத்த முயற்சி செய்து [edit], உங்களுக்கு விருப்பமான தலைப்பை கொடுக்கவும். இப்போ உங்கள் இடுகை ஒரு இலக்கமாக சேமித்து இருந்தாலும், மற்றவர்களுக்கு இடுகைத் தலைப்பு சரியாக உங்கள் விருப்பம் போல் தெரியும்.
  2. இடுகைகக்கு ஆங்கில தலைப்பைக் கொடுங்கள். பிரசுரித்த பின் மீண்டும் திருத்த முயற்சி செய்து [edit] உங்களுக்கு விருப்பமான தலைப்பை [தமிழிலோ] கொடுக்கலாம். இப்போ உங்கள் இடுகை ஆங்கில சொற்களால் சேமித்து இருந்தாலும், மற்றவர்களுக்கு இடுகைத் தலைப்பு சரியாக உங்கள் விருப்பம் போல் தெரியும்.
  3. WordPress உபயோகிப்பவர்களுக்கு மட்டும்:
    நீங்கள் புதிய இடுகை எழுத எத்தணிக்கும் போது உங்கள் வலது புறத்தில் சிறு சிறு தகவற் துளி போல் இருக்கும். அதில் “Post Slug” என்பதைக் கண்டு பிடியுங்கள். அதற்கு அருகாமையில் இருக்கும் ‘+’ சக குறியை தட்டி விரித்தால், ஒரு பெட்டி வரும். அந்தப் பெட்டிக்குள் நீங்கள் விருப்பமான ஆங்கில (அ) எண்ணில் தலைப்பை கொடுக்கலாம். அதே நேரத்தில் “Write Post” என்பதற்கு கீழ் உள்ள “Title” என்னும் இடத்தில் தமிழில் தலைப்பைக் கொடுக்கலாம். இது மேலே சொல்லப்பட்ட மேலதிக வேலையை இல்லாமல் ஆக்குகிறது.

Wordpress' Post Slug not expanded

Wordpress' Post Slug expanded

Wordpress' Post Slug and Title filled

பி.கு.: தேடு தளங்கள் [Search engines] இணைய முகவரியில் வரும் சொற்களுக்கு அதிக முக்கியத்துவம் கொடுக்கும். ஆகவே, நீங்கள் உங்கள் இடுகையை எண் கொடுத்து சேமித்தால் (அ) “blog-spot_25″ என்று சேமித்தால் உங்கள் இடுகையை கண்டுபிடித்து அதிக புள்ளி கொடுக்கும் சந்தர்ப்பம் குறையும். நீங்கள் ஆங்கில/ தமிழ் சொற்களில் சேமித்தால், அந்த சொற்களை தேடும்போது உங்கள் இடுகைக்கும் முக்கியத்துவம் கூட கொடுக்கப்படும், தேடு தளங்களால்.

ஆனால் இன்னும் ஒருங்குறியின் இரண்டாம் தர மொழிகளுக்கு [தமிழ் உட்பட] இணைய முகவரியில் போதுமான உதவி இல்லாததால், தமிழின் ஒவ்வொரு எழுத்துக்களும் “%e0%ae%aa%e0%ae%bf%e0%ae%” இப்படி குதர்க்கமாக பிரித்து தான் தெரியும். நீங்கள் உங்கள் இடுகையின் முகவரியை வேறொருவருக்கு கொடுக்க எத்தணிக்கும்போதோ (அ) உங்கள் வலைப்பதிவு பயனர் உங்கள் இடுகையின் இணைய முகவரியை வேறொருவருக்கு கொடுக்க விரும்பினால் உங்கள் இடுகையின் இணைய முகவரி மிக நீண்டதாக, குதர்க்கம் நிறைந்ததாக காணப்படும்.

சிறிய இணைய முகவரியாக வருவதற்காகவும், தேடு தளங்களில் உங்கள் இடுகையின் மதிப்பு அதிகரிக்கவும் இடுகைகளை ஆங்கில சொற்கள் [உங்கள் இடுகையின் கருத்து பொறிந்த சொற்கள்] கொண்டு சேமித்தல் நன்று என்பது என் அறிவுறை.
இந்த இடுகைக்கு நான் தமிழில் தலைப்பைக் கொடுத்திருக்கிறேன். ஆனால் ஆங்கில சொற்கள் கொண்டு “post-slug-tamil-unicode-webpage-address-255″ சேமித்து இருக்கிறேன். இந்த சொற்களைத் தேடினால், எனது இடுகை தெரியட்டும் என்பதற்காக.
______
CAPital

September 23, 2006

தமிழ் ஒருங்குறி ?! – 16

Filed under: India,Tamil Nadu,Tamil Unicode,Thamizh — CAPitalZ @ 7:44 pm

- ஒருங்குறியின் மேன்மை
- பிற மொழிகள் இடம்பெற்ற முறை
- தமிழ் மொழிக்கு உள்ள இடம்
- தமிழ் அறிஞர்கள் செய்யத் தவறிய செயல்
- தமிழுக்கு உள்ள சிக்கல் / அதனால் தமிழுக்குரிய பாதிப்பு
- தமிழுக்குக் கிடைக்க வேண்டிய இடம்
- தமிழை உயர்த்த செய்ய வேண்டிய பணிகள்
- போன்ற கருத்துகளுடன் நான் எடுத்துக் காட்ட விரும்பும் செயல் திட்டம் போன்றவற்றை பவர் பொய்ன்றில் கொடுத்துள்ளேன்.

ஒருங்குறியும் தமிழும்

மேலே உள்ள சுட்டியை தட்டி பவர் பொய்ன்றை தரையிறக்கிக் கொள்ளவும்.
______
CAPital

பி.கு. :-
பவர் பொய்ன்றில் தமிழ் சரியாகத் தெரியாதவர்கள் TSCu_Paranar.ttf எழுத்துருவை தரை இறக்கி நிறுவிப் பார்க்கவும். ஒருங்குறிக்கே இந்த நிலமையா! :(

TSCu_Paranar

தரையிறக்கியவுடன் TSCu_Paranar.txt என்னும் கோப்பின் பெயரை TSCu_Paranar.ttf என்று மாற்றுக.

பாகம் – 17 >>

<< பாகம் – 15

 

August 28, 2006

தமிழ் ஒருங்குறி ?! -15

Filed under: Tamil Unicode — CAPitalZ @ 4:04 pm

இது தான் ஒருங்குறியில் உள்ள உலக மொழிகளின் அட்டவணை:
http://www.unicode.org/charts/

நன்றாகக் கவனிக்கவும்:

Armenian
Armenian Ligatures

Coptic
Coptic in Greek block

Cyrillic
Cyrillic Supplement

Georgian
Georgian Supplement

Greek
Greek Extended
Ancient Greek Numbers
Ancient Greek Musical

Basic Latin
Latin-1
Latin Extended A
Latin Extended B
Latin Extended C (5.0)
Latin Extended D (5.0)
Latin Extended Additional
Latin Ligatures
Fullwidth Latin Letters
Small Forms

இவ்வாறு பல தரப்பட்டுள்ளது. நமது தமிழுக்கும் இதைப் போல் ஒரு “Tamil
Supplement” என்று தற்போது தமிழ் ஒருங்குறியில் இல்லாத எழுத்துக்களை ஏற்ற
முயற்சிக்கலாம்.

ஒருங்குறி அட்டவணையைப் பாருங்கள். ஏறக்குறைய அதில் உள்ள எல்லா மொழிகளுக்கும்
“Supplement”, “Extended” என்ற எதோ ஒரு முறையில் தமது எல்லா எழுத்துக்களையும்
ஏற்றியிருக்கிறார்கள் அம் மொழி வல்லுனர்கள்.

ஏன் Latin எழுத்துக்களுக்கே எத்தனையோ “Extended” எழுத்துக்களை
ஏற்றியிருக்கிறார்கள். எத்தியோப்பியா “Supplement” என்றும் “Extended” என்றும்
ஏற்றியிருக்கிறார்கள்.

அது மட்டுமல்ல சீனா, கொறியா, மற்றும் ஜபான், ஆகியவை அவைகளது எழுத்துக்கள்
மிகவும் அதிகமான பட்சத்திலும் எல்லா எழுத்துக்களையும் ஏற்றி இருக்கிறார்கள்.
சில கோப்புகளைக் கவனிக்கவும். 13MB, 5MB, 2MB என்று எல்லாம் பெரிதாக
இருந்தாலும் எல்லா எழுத்துக்களையும் ஏற்றி இருக்கிறார்கள்.

ஃபிரஞ்சு, ஸ்பானிஷ் போன்ற மொழிகளில் accent [அக்ஸன்ற்] என்று சொல்லும் குறியீடுகளுடன்
எழுத்துக்கள் இருக்கு. அவ் எழுத்துக்கள் எழுத்து வேறு “அக்ஸன்ற்” வேறு ஆகவும்
இருக்கிறது; தனி எழுத்தாகவும் இருக்கிறது. இவ்வாறு இரண்டு விதமாக அவர்கள்
ஏற்றியிருக்கிறார்கள், ஆனால் தமிழுக்கு மட்டும் அப்படியாயினும் எற்றவில்லை
இந்திய அரசு.

பாகம் – 16 >>

<< பாகம் – 14

_____
CAPital

July 28, 2006

தமிழ் ஒருங்குறி ?! -14

Filed under: Tamil Unicode — CAPitalZ @ 10:42 am

நான் சொன்ன தமிழ் எழுத்துக்கள் யாவற்றையும் கணினியில் ஏற்றுதல் என்பது, விசைப்பலகையில் [keyboard] ஏற்றுதல் என்பதல்ல.

பேச்சுக்குச் சொன்னால் கணினியின் மூளையில் ஏற்றுவது. அதாவது ஒருங்குறி என்பது விசைப்பலகை அல்ல. அது ஒரு தகுதரம் [Standard for Computer Information Interchange]். அந்த தகுதரத்தில் தமிழை சரியாக ஏற்றியிருக்கலாம்.

இப்ப எத்தனை கீகள் விசைப்பலகையில் இருக்கிறதோ, அத்தனையே வைத்திருக்கலாம். வேணுமென்றால், கூட்டி (அ) குறைத்துக் கூட வைத்திருக்கலாம்.

அதாவது ஃபிரஞ்சு, ஜேர்மன், ஸ்பானிய மொழிகளில் உள்ளது போல் தமிழிலும் எல்லா எழுத்துக்களையும் ஏற்றியிருக்கலாம். à, á, â, ã, å̀́ இவை இங்கே காண்பது போல் ஒரு எழுத்தாகவும், பிரித்து தனித் தனியாகவும் a, ̀, ́, ˆ, ˜, ˚ ஏற்றப்பட்டிருக்கிறது.

இனிமேல் தமிழுக்கு அவ்வளவு இடங்கள் கிடைக்கும் என்று நம்பிக்கை இல்லை தான். அப்படி கிடைத்தாலும் ஏற்கனவே இப்போதிருக்கும் ஒருங்குறியில் ஊறிப்போனவர்கள் மாற்றத்தை விரும்ப மாட்டார்கள்.

அப்ப பிறகேன் இந்தக் கதறல்?
விட்டது பிழை என்று ஒத்துக்கொள்ளலாம்ல… இல்லை. தமிழ் மொழி இப்படித் தான். எழுத்தை ஒழுங்குமாறி வைத்து பிரித்து பிரித்து சேர்த்தால் தான் தமிழ் கணினியில் தெரியும். இல்லையேல் தமிழ் பிழையாகிவிடும். சும்மா ஏமாத்தக்கூடாது எல்லே.

தமிழ் மொழியின் எழுத்தின் வகைகளைப் புரிந்து கொள்ள எழுத்தைப் பிரித்துதான் சேமிக்க வேண்டிய அவசியமில்லை. கணினிக்கு எழுத்து தெரிவதில்லை, அதற்குண்டான இலக்கம் மட்டுமே தெரியும். அந்த இலக்கத்தை வைத்து இது எந்த மெய், எந்த உயிர் என்று அறியலாம். [TUNE இல் அப்படி செய்திருக்கிறார்கள்]

ஏன் தமிழில் கையாளும்போது இவ்வளவு சிரமம், வேகக் குறைவு, சேமிக்க அதிக இடம் என்று சாதரண கணினி உபயோகிக்கும் தமிழனுக்கு தெரியாது. அவன் சிந்தனையில் தமிழ் மொழி கணினியில் இப்படித் தான் இருக்கும் என்று மட்டுமே அறிந்திருப்பான். அவன் ஒரு ஃபிரஞ்சு, ஜேர்மன், ஸ்பானிய, சீனா, ஜப்பான், (அ) கொரியா மொழி தெரிந்தவனாக இருந்தால், தமிழில் எழுதுவதை விட அந்த மொழியில் எழுதினால் சகலவிதத்திலும் மேன்மை என்று யோசிப்பான். இன்றய காலத்தில் தமிழ் தெரிந்திருந்தாலும், ஆங்கிலத்தில் எழுதுவது இலகுவாக இருப்பது போல்.

கணினியில் ஒரு மென்பொருள் தயாரிக்கும் போது மிகவும் முக்கியமானது அந்த மென்பொருள் மிகவும் வேகமாக செயற்பட வேண்டுமென்பது. தமிழில் கணினி மொழியை [programming in Tamil script] எழுதினால் வெறும் எழுத்தைக் கையாள்வதற்கே ஒரு பகுதி வேகம் போய்விடும். பற்றாததற்கு, அந்த மென்பொருளின் சேமிக்கும் இடம் கூட அதிகமாகும். மென்பொருளை கணினிக்கு இறக்குமதி செய்ய காலம் காத்திருப்பவர்களுக்கு இது இன்னும் பெரிதாக்கும். இதையெல்லாம் அறிந்த ஒரு கணினி மொழி [computer programming்] வல்லுனர் ஒருபோதும் தமிழை கணினி மொழியாக தேர்ந்தெடுக்க மாட்டார். வெறும் பல்கலைக்கழகங்களில் சோதனைப் பயிற்சியாக மட்டுமே இருக்கும்.

 

 

பாகம் – 15 >>

<< பாகம் – 13

_____
CAPital

Next Page »

The Rubric Theme. Blog at WordPress.com.

Follow

Get every new post delivered to your Inbox.