ஒரு வாசகனின் மனப்பதிவுகள்

Tuesday, February 08, 2005

பத்ரி குறிப்பிட்டிருப்பதாலும், சிஃபி தளத்தில் உள்ள அமுதசுரபி இன்னமும் பிப்ரவரி இதழை வெளியிடாததாலும், என் கட்டுரையை வாசிக்க விரும்பும் வாசகர்களின் ஆர்வம் கருதி அந்தக் கட்டுரையை இங்கே பதிவு செய்கிறேன். ( இது ஜன்னலுக்கு வெளியே பதிவில்தான் வெளியாகி இருக்க வேண்டும். ஆனால் பத்ரியின் இணைப்பு இந்தப் பதிவைச் சுட்டுவதால், வாசகர்களின் வசதி கருதி இது இங்கே வெளியிடப்படுகிறது.)


இனி 'ஹேப்பி பொங்கல்' இல்லை!

(இதுதான் நான் தந்த தலைப்பு)

அல்லது

ஒரு பெரும் பாய்ச்சல்

பொங்கல் நாளன்று என் கைத் தொலைபேசிக்கு ஏராளமான குறுஞ்செய்திகள் வந்தன. பெரும்பாலும் ஹேப்பி பொங்கல் என்ற ஆங்கில வாழ்த்துக்கள்.சில பொங்கல் பானை, கரும்பு ஆகியவற்றுடன் பொங்கல் வாழ்த்துக்கள் என்ற வாசகத்தையும் படமாக ஆக்கி அனுப்பப்பட்ட சித்திரச் செய்திகள் (Picture messgages). கைத்தொலை பேசியில் உள்ள விசைகளைப் பயன்படுத்தி ஆங்கிலத்தில் செய்திகள் அனுப்புவது போல, தமிழில் அனுப்ப முடியாதா?
இனி இந்தக் கேள்விக்கு இடமில்லை. இந்தப் பொங்கலன்று சிங்கப்பூர் வானொலியான ஒலி, முரசு அஞ்சலைத் தமிழுக்குத் தந்த முத்து நெடுமாறனுடன் இணைந்து கைத்தொலைபேசிகளில் தமிழிலேயே குறுஞ்செய்திகளை அனுப்பும் தொழில்நுட்பத்தை நடைமுறைக்குக் கொண்டு வந்துவிட்டது. உலகின் முதல் தமிழ்க் குறுந்தகவலை கவிஞர் வைரமுத்து அனுப்பி அந்த சேவையைத் தொடங்கி வைத்துள்ளார்.
கைத்தொலைபேசிக்குத் தமிழை எடுத்துச் சென்றது தமிழ் தகவல் தொழில்நுட்பத்தில் ஒரு பெரும் பாய்ச்சல்.ஒரு தலைமுறை காகிதத்தில் கையால் எழுதுவதை வழக்கமாகக் கொண்டிருந்தது. இன்னொரு தலைமுறை கணினி கொண்டு இணையத்தில் எழுதி மகிழ்ந்து கொண்டிருக்கிறது. இன்றைய இளந்தலைமுறை கணினியை விடக் கைத்தொலைபேசியின்பால் கவர்ந்திழுக்கப்பட்டிருக்கிறது. முத்து நெடுமாறனின் இந்த முயற்சியின் மூலம் தமிழ் இன்னொரு தலைமுறையை நெருங்க அடியெடுத்து வைக்கிறது.
இனி வரும் காலங்களில் இது போன்ற பாய்ச்சல்களைத் தமிழ் தகவல் தொழில்நுட்பம் பெருமளவில் எதிர் கொள்ளும். முத்து நெடுமாறன் மலேசியாவில் இதற்கான முயற்சியில் இறங்கியிருந்த அதே வேளையில் தமிழ்நாட்டில் அண்ணாப் பல்கலைக்கழகத்தில் முனைவர் பாஸ்கரன் இதே போன்றதொரு திட்டத்தில் ஈடுபட்டுள்ளார்.
தமிழில் எழுத்துக்கள் 36 (12 உயிர்+18 மெய்+6 கிரந்த எழுத்துக்கள்) கைத்தொலைபேசியில் உள்ள விசைகள் 9 (12 விசைகளில் 3 விசைகள் அதன் இயக்கத்திற்குத் தேவை) எனவே ஒரு விசையை ஒன்றுக்கு மேற்பட்ட எழுத்துக்களுக்கு ஒதுக்க வேண்டும். ஒரு சொல்லை எழுத பலவிசைகளை பல முறை அழுத்த வேண்டிய நிலை. நீளமான செய்திகளை எழுதும் போது இதனால் அலுப்புத் தட்டும். இதைத் தவிர்ப்பதற்காக ஒரு எழுத்தை உள்ளிடும் போதே அதற்கு அடுத்த எழுத்து எதுவாக இருக்கும் என ஊகித்துக் கொள்ளும் வகையில் அமைத்து விட்டால் நிலமையை எளிதாக்கலாம். இதை predictive text input என்று சொல்கிறோம். இதை சாத்தியமாக்க ஒரு சொற்களஞ்சியத்தை உருவாக்க வேண்டும். தமிழில் அது எளிதல்ல. ஏனெனில், தமிழில், பால், திணை, ஒருமை-பன்மை, காலம் இவற்றை சொல்லின் இறுதியில்தான் (விகுதியில்) வெளிப்படுத்துகிறோம். படித்தான், படித்தாள் இரண்டிற்கும் இறுதி எழுத்து மட்டும்தான் வித்தியாசம். கைத் தொலைபேசியில் ன், ள் இரண்டும் ஒரே விசையில் (L, n) அமைந்திருக்கும் போது சிக்கல் அதிகமாகிறது. தமிழில் உள்ளிடுவதற்கான predictive text system ஐ பாஸ்கரன் உருவாகியிருக்கிறார்.
தமிழ் ஓர் ஆச்சரியமான மொழி. சொல் என்ற வார்த்தைக்கு பேசு என்று அர்த்தம். வார்த்தை என்றும் அர்த்தம். உரை என்ற சொல்லுக்கு பேசு என்று பொருள். எழுதப்பட்ட உரை என்றும் பொருள். பேச்சு, எழுத்து என்ற இரு வழக்குகளுக்கும் உள்ள நெருங்கிய தொடர்பை இந்தச் சொற்களே புலப்படுத்தும். நாம் உச்சரிக்கும் ஒரு வார்த்தையைக் கணினி விளங்கிக் கொண்டு அதை உரையாக மாற்றிக் கொடுத்தால் எவ்வளவு வசதியாக இருக்கும்!. பொறியியல் கல்லூரி ஒன்றில் விரிவுரையாளராகப் பணியாற்றும் மாதரசி இதற்கான தொழில்நுட்பத்தில் முனைந்திருக்கிறார். ஐ.ஐ.டியிலும் இதற்கான முயற்சிகள் நடைபெறுகின்றன. "ஆங்கிலத்தில் இல்லாத ஒரு வசதி தமிழில் உண்டு. ஆங்கிலத்தில் ஒரு எழுத்தை பலவகைகளில் உச்சரிக்கிறார்கள். மாதரசியை ஆங்கிலத்தில் மதராசி என்று படிப்பவர்கள் உண்டு. Coffee என்ற சொல்லில் O என்ற எழுத்து ஆ என்றும் E என்ற எழுத்தி இ என்றும் உச்சரிக்கப்படுகிறது. ஆனால் தம்ழில் ஒரு எழுத்தை அதற்குரிய ஒலியில்தான் உச்சரிக்க முடியும். க, ச, ப போன்ற எழுத்துக்கள் அதன் முன் வரும் ஒற்றின் அடிப்படையில் உச்சரிப்பில் மாற்றம் பெறுகின்றன. தங்கம் என்பதி வரும் 'க'வை கப்பலில் வரும் 'க' போல ஒரு போதும் உச்சரிக்க முடியாது. இது தமிழில் பேச்சை உரையாக்கும் தொழில்நுட்பத்தை எளிதாக்குகிறது"என்கிறார் மாதரசி. உண்மைதான். ஆனால் தமிழில் 'காகம்' இருக்கிறதே, அது பிரசினை தருமோ?
பேச்சை உரையாக்குவது இருக்கட்டும். பேசுவதற்கு ஏற்ற உரையைத் தயாரிக்கவும் கணினியைப் பயன்படுத்தலாம். இந்திய அறிவியல் கழக (IISc) பேராசிரியர் நா.பாலகிருஷ்ணன் அண்மையில் ஒரு சுவையான தகவலைப் பகிர்ந்து கொண்டார். ஒருமுறை இந்தி தெரியாத ஒருவர், இந்தியில் உரையாற்ற வேண்டியிருந்தது. அவருக்கு உரை நிகழ்த்துகிற அளவிற்கு இந்தி தெரியாது. இந்தி உரையை தமிழ் எழுத்துக்களில் ஒலி பெயர்த்துக் கொடுத்துவிட்டது கணினி. அதாவது இந்தியில் பாரத் என்று எழுதப்பட்டிருந்தால் அது தமிழில் பா-ர-த் என்று எழுதிவிடும். அதைப் பார்த்து இந்தியில் பேசுவது போலவே படித்து (நடித்து) விடலாம். சாதனா சர்கம் தமிழில் பாடுகிறாரே அதே டெக்னிக்தான்.

இதற்காக 'ஓம்' என்ற மென்பொருள் பொதியை (Software package) பேராசிரியர் பாலகிருஷ்ணன் உருவாக்கிக் கொடுத்துள்ளார். இது போன்ற ஒலிபெயர்ப்புகள் (Transliteration) எளிதாகிவிட்டால் மொழி என்னும் தடையைக் கடந்து விடலாம்.
ஆனால் உணர்வு ரீதியான பிணைப்பு ஏற்பட வேண்டும் என்றால் அது மொழிபெயர்ப்புகள் மூலம்தான் சாத்தியம். கணினிகள் மொழிபெயர்க்கவும் செய்கின்றன. (Machine Translation) அதையும் பேராசிரியர் பாலகிருஷ்ணன் செய்து காட்டினார். ஆனால் இந்தத் தொழில்நுட்பம் இன்னும் மேம்படவேண்டிய நிலையில்தான் இருக்கிறது. இப்போது கணினி மொழிபெயர்த்துத் தரும் பிரதியை மொழி அறிந்தவர்களைக் கொண்டு மெய்ப்புப் பார்த்து பயன்படுத்திக் கொள்ளும் நிலை இருக்கிறது. மொழிபெயர்ப்பை விரைவாக செய்து கொள்ள அது போதுமானது.
பேராசிரியர் பால கிருஷ்ணன் இன்னொரு பணியில் முனைப்பாக இருக்கிறார். அது அச்சு வடிவில் உள்ள பத்து லட்சம் நூல்களை இலக்கப்பதிவாக்குவது (digitalisation). 90 ஆயிரம் புத்தகங்கள் இலக்கப்பதிவாக்கப்பட்டுள்ளன. அதில் 30 ஆயிரம் புத்தகங்களுக்கு மேல் இந்திய மொழிப் புத்தகங்கள். குடியரசுத்தலைவர் மாளிகை நூலகத்தில் உள்ள பெரும்பாலான புத்தகங்கள் இலக்கப்பதிவு செய்யப்பட்டுள்ளன. எப்படி இவ்வளவு அதிக எண்ணிக்கையில் இலக்கப்பதிவு சாத்தியமாயிற்று? ஒளி உணரி (optical Character recognition) என்னும் தொழில்நுட்பம் பயன்படுத்தப்படுகிறது. ஒரு புத்தகத்தை ஸ்கேன் செய்தால் அது கணினியில் உரையாக மாறிவிடும். பின் அதை மற்ற கணினி ஆவணங்களைப் போலவே பயன்படுத்திக் கொள்ளலாம். இப்படி இலக்கப்பதிவு பெற்ற நூல்கள் இணையத்தில் ஒரு மின் நூலகமாக அமைக்கப்பட்டு வருகிறது
இணையத்தில் உள்ள புத்தகக் கடையான அமோசான். காமில் தமிழ் புத்தகங்களை வாங்க முடியாத நிலை இருக்கிறது. அந்தக் குறையை காமதேனு என்ற இணையதளத்தின் மூலம் போக்கியிருக்கிறார் பத்ரி சேஷாத்ரி. வீட்டில் கணினி முன் அமர்ந்தபடியே நீங்கள் புத்தகங்களுக்கு ஆர்டர் செய்யலாம். நீங்கள் ஆர்டர் செய்த புத்தகம் இரண்டொரு தினங்களில் உங்கள் வீட்டில் டெலிவரி செய்யப்படும். புத்தகக் கண்காட்சி நெரிசலைத் தவிர்க்கலாம் என்பது மட்டுமல்ல, வருடத்தின் 365 நாளும் புத்தகக் கண்காட்சி - இணையத்தில். பெருந்தன்மையாக தன்னுடைய கிழக்குப் பதிப்பக நூல்களுக்கு மட்டுமன்றி பல பதிப்பாளர்களின் நூல்களை இதன் மூலம் பெற வகை செய்திருக்கிறார் பத்ரி.
இங்கு சொல்லப்பட்டவையெல்லாம் ஒரு முன்னோட்டம்தான். இது ஒவ்வொன்றைக் குறித்தும் தனித் தனிக் கட்டுரைகள் எழுதலாம். எழுதப்பட வேண்டும். ஆனால் தமிழர்கள் எப்படி ஒவ்வொரு புதிய தொழில்நுட்பத்தையும் தங்கள் மொழிக்குக் கொண்டுவந்து தங்களுடையதாக ஆக்கிக் கொள்வதில் முனைப்பாக இருக்கிறார்கள் என்பதை இது கோடி காட்டும். அந்தத் திசையில் நீங்களும் ஒரு அடி எடுத்து வைக்கலாம். உங்களிட்ம் ஒரு கணினி இருந்தால், அதைக் கொண்டு தமிழில் எழுதுவதற்கு வேண்டிய முயற்சிகளை மேற்கொள்ளுங்கள். நானும் என் நண்பர்களும் உதவக் காத்திருக்கிறோம், இலவசமாக.

Rate this post at www.thamizmanam.com Current rating is: Click on the stars for voting pad.

0 Comments:

Post a Comment

<< Home

 
Listed in tamizmaNam.com, where bloggers and readers meet :: தமிழ்மணம்.காம்-ல் பட்டியலிடப்பட்டு, திரட்டப்படுகிறது