Community project by students of the Faculty of Information Technology, University of Moratuwa, Sri Lanka.

1.1.1 தகவல்களின் அடிப்படைக் கட்டமைப்பு (Basic Building Blocks of Information)

தரவு – அறிமுகம் (Introduction to Data)

 

இலங்கையில் ஒவ்வொரு 10 வருடத்திற்கும் ஒருமுறை குடிசனமதிப்பீடு மேற்கொள்ளப்படுகின்றது. குடிசனமதிப்பீட்டாளர் ஒருவர் ஒவ்வோர் இல்லங்களுக்கும் சென்று பின்வரும் தரவுகளை சேகரிப்பார். குடும்பத் தலைவரின் பெயர், குடும்ப அங்கத்தவர் எண்ணிக்கை, அங்கத்தவர் பெயர், பால், வயது அத்துடன் மேலும் பலதரவுகள் சேகரிக்கப்படுகின்றன. இவையே அடிப்படை தரவுகள் ஆகும். இவற்றுள் வீட்டு இலக்கத்திற்கு முக்கியத்துவம் அளிக்கப்படுகிறது. கீழுள்ளஅட்டவணை, 2011 இலங்கை குடிசனமதிப்பீடு தொடர்பான தரவுகளை சேமிப்பதற்கு தயாரிக்கப்பட்ட படிவமாகும். மக்களிடம் இருந்து பல்வேறுபட்ட தரவுகள் இப்படிவம் மூலம் சேகரிக்கப்படுகின்றன.

 
 

பின்னர் அத்தரவுகள் கீழுள்ளவாறு தொகுக்கப்படுகின்றன. பல்வேறு இடங்களில் இருந்து பெறப்பட்ட தரவுகள் தேவைப்படும் செயன்முறைக்கு ஏற்ப குறித்தவாறு வகைப்படுத்தப்பட்டுள்ளன.

மேலே காட்டப்பட்டுள்ள படிவத்துக்கும், கீழுள்ளதொகுப்புக்கும் பல வித்தியாசங்கள் காணப்படுகின்றன. ஆனால் மேலுள்ள தரவுகளை அடிப்படையாகக் கொண்டே கீழுள்ள தொகுப்பு தொகுக்கப்பட்டுள்ளது.

(பூரண புள்ளிவிபரவியல்:

ஒரு நாட்டின் சனத்தொகை அடர்த்திவீதம், பிறப்புஇறப்புவீதம் என்பவற்றை பல்வேறு விதங்களில் ஒப்பிடுவதற்கு மேற்குறிப்பிடப்பட்ட தரவுகள் உறுதுணையாக அமைகின்றது. இத்தரவுகளைக் கொண்டு பல்வேறு ஆராய்ச்சிகளை மேற்கொள்வதற்கும், பல்வேறுபட்ட தீர்மானங்களை எடுப்பதற்கும் இலகுவானதாக அமைகின்றது. மேலும் இதனூடாக எடுக்கப்படும் முடிவுகள், தீர்மானங்கள் எதிர்காலத்தில் முக்கிய பங்காற்றுகின்றது.

தரவுகள் மேலுள்ளவாறு மட்டுமன்றி சாதாரணமாக எல்லா மட்டத்திலுமான மக்கள் மத்தியிலும் பயன்படுத்தப்படுகின்றன. சில சந்தர்ப்பங்களில் குடும்பஅங்கத்தவர் எண்ணிக்கையை அறிந்து வைத்திருப்பது முக்கியமான முடிவுகளை எடுப்பதற்கு இலகுவாக வழிவகுக்கின்றது. உதாரணமாக வீட்டில் அம்மா சமைக்கும்போது, வீட்டு அங்கத்தவர்களின் எண்ணிக்கை, விருப்புவெறுப்பு தொடர்பான தரவுகளின் அடிப்படையில், உணவை ஆக்குவார். இவ்வாறு எளிமையாக தரவு என்பதனை விளங்கிக்கொள்ளமுடியும்.

தகவல்தொடர்பாடல் தொழில்நுட்பம் கற்கைநெறியினை கற்கும் எங்களை போன்ற சகோதர, சகோதரிகள் மேற்குறிப்பிடப்பட்ட தரவுகள் சார்பாக பின்வரும் பிரச்சனைகளை எதிர்நோக்குகின்றனர்.

 
  • சேகரிக்கபட்ட படிவங்களில் மாற்றம் எதனையும் ஏற்படுத்தாது கொடுக்கப்பட்ட தரவுகளை ஆராய்ந்து முடிவுகளை எடுக்கலாமா?
  • இரு வீடுகளை மட்டும் ஒப்பிடுவதற்கு, இரு வலையங்களை மட்டும் ஒப்பிடுவதற்கு மேலே குறிப்பிடப்பட்டுள்ள சுருக்கமான தரவுக்கோவையை பயன்படுத்தலாமா?
  • எதற்காக இந்த படிவங்கள் ஒவ்வொரு மனிதருக்கும் ஒரேமாதிரியான வகையில் முக்கியத்துவம் பெறாமல் ஒவ்வொருவருக்கும் வேறுப்பட்ட வழிகளில் முக்கியத்துவம் பெறுகின்றது?
 
காரணம் என்னவெனில் தரவுகள் வெவ்வேறு வகையாக உள்ளன. 

 

தற்போது நாங்கள் தரவுகளின் வரைவிலக்கணத்தை ஆராய்ந்து பார்ப்போம்.

அர்த்தமின்மை(Meaningless)
 
அர்த்தமின்மை என்று கூறப்படுவது தரவுகளில் மாற்றம் ஏற்படுத்தாது தற்போது உள்ளவாறு பயன்படுத்தப்படுத்தும் வேளையில் பயன்படுத்துபவரின் நோக்கத்தை பூரணப்படுத்த முடியாமல் போவதாகும். அவ்வாறான சந்தர்ப்பங்களில் அர்த்தமற்ற தரவுகளை அர்த்தமுள்ள தரவுகளாக மாற்றுவது அவசியமானதாக அமைகிறது. சனத்தொகை கணிப்பீட்டின் உதாரணத்தை நோக்கினோமானால் சனத்தொகைக் கணிப்பீடு ஆராய்ச்சிகளை மேற்கொள்ளல், முடிவுகளை முன்வைத்தல் போன்றவற்றிற்கு வீடுகளிற்கு சென்று சேகரிக்கப்பட்ட தரவுகளின் மூலம் நேரடியான தீர்மானங்களை மேற்கொள்ளுதல் சாத்தியமற்றதாகின்றது.
அவ்வாறான தீர்மானங்களை மேற்கொள்வதில் சிரமம் ஏற்படுவது சேகரிக்கபட்ட தரவுகளை அர்த்தமுள்ள விதத்தில் பயன்படுத்தாமையே ஆகும். ஆகவே தரவுகளை சேகரிப்பதில் மட்டும் கவனத்தை செலுத்தாது அவற்றை அர்த்தமுள்ள விதத்தில் பயன்படுத்துவதிலும்  கவனம் செலுத்துதல்  முக்கியமானதாகும்.
 
ஒழுங்கமைப்பின்மை(Not organized)  

 
தரவுகளில் இருந்து பயனுள்ள விடயங்களை பெற்றுக்கொள்வதற்கு தரவுகளை வேறொரு வடிவில் மாற்றுவது பெரும்பாலும் அவசியமாகும். இலங்கையில் உள்ள எல்லோரினதும் வயதை அறிந்துகொள்ள வேண்டுமானால் எல்லா வீடுகளிலும், வீட்டு அங்கத்தவர்களின் பெயர் அல்லது தேசிய அடையாள அட்டை இலக்கத்தினை குறித்துக் கொள்ளல் அவசியமாகின்றது. தரவுகளை ஒழுங்குபடுத்துவதற்கு பெரும்பாலும் புள்ளிவிபரவியலின் மூலம் ஒழுங்குபடுத்தும் செயன்முறையினை கையாளல் இலகுவானதா என்பது தற்போது உங்களுக்கு நன்றாக புரிந்திருக்கும்.
 

முறைசாரா( Informal )

 
தரவுகள் அமைந்திருப்பதற்கேற்ப அத்தரவுகளை வகுப்பதில் ஈடுபடுபவர் முறையற்றவிதத்தில் அவற்றினை வகுக்கமுடியும். தரவுகளை சேகரிக்கும் போது சில முக்கிய அடிப்படை தரவுகள் பூரணமற்றதாக அமையலாம். சில வயோதிபர்களின் தேசிய அடையாள அட்டை (NIC) இலக்கத்தை பெற்றுக்கொள்ள இயலாமை இதற்கு ஒரு சிறந்த உதாரணம் ஆகும். அவ்வாறான சந்தர்ப்பங்களில் பதிவேடுகளில் காணவேண்டிய சில முக்கியமான தரவுகள் பூரணமில்லாது காணப்படும்.
கணக்கெடுப்பு மற்றும் மதிப்பிடல் பிரிவு மேலே குறிப்பிட்டவாறு அமைந்துள்ள பதிவேடுகளை நிராகரிக்கும் தறுவாயில் கணக்கெடுப்பு பிரதிநிதி வேறுபட்ட ஏடுகளை தயாரித்துக்கொடுக்க முடியும். இதன்போது பதிவேடுகளின் முறையற்றதன்மை (informality) அதிகரிக்கும்.
 
தரவுகளின்வகைகள்
தரவுகளின் வகைகளை கருதினோமானால் 3 வகையான தரவுகள் காணப்படுகின்றன.

 

எழுத்து(Text )

 

தரவுகளை சேகரிக்கும் பொழுது பிரதான வழியாக எழுத்து மூலம் குறித்துக்கொள்ள முடியும்.எழுதக்கூடிய எந்தவொரு நபருக்கும் தரவுத் தாளில், அல்லது கையடக்கத் தொலைபேசியில் எழுத்துக்களை குறித்துக்கொள்ள முடியும்.

நபர் ஒருவருக்கு அன்றாடம் அவசியமாக கருதப்படக்கூடிய தொலைபேசி இலக்கங்கள், பயணம் செய்த இடங்கள், அவற்றுக்கிடையேயான தூரம், வங்கிக் கணக்கு இலக்கங்கள் மற்றும் தேவையான பல விடயங்களை எழுத்து மூலம் குறித்துவைத்துக் கொள்ள முடியும். விளங்கிக் கொள்ளமுடியாத முறையில் இரகசிய அடையாளங்களினூடகவும் எழுத்து மூலம் குறித்து வைத்துக்கொள்ள முடியும்.
 
தரவு சேகரிக்கும் போது கண்காணிப்பு (observation) அல்லது வினாக்கள் வினாவுதல் (questioning) அல்லது தரவு சேகரிக்கும் விசேட உபரணம் இவற்றின் மூலம் குறித்துக்கொள்ள முடியும். உதாரணமாக கோணமானி அல்லது வட்டாரியை பயன்படுத்த முடியும்.
கணினி கண்டுபிடிக்கப்படுவதற்கு முன்னர் தரவு முகாமைத்துவத்திற்கு கோப்பிடல் முறைமை (File System) பயன்படுத்தப்பட்டது.
அவ்வாறு கோப்பிடப்பட்டு வைக்கப்பட்டிருக்கும் தரவுகளை, தன்னியக்கமற்ற (Manual) முறை மூலமோ, ஒளியியல் அடையாள உணரி (Optical mark recognition – OMR) மூலமோ அல்லது ஒளியியல் எழுத்துரு உணரி (Optical character recognition – OCR) மூலமாகவோ கணினியில் பதிவுசெய்ய  (Feed) முடியும். 
 

ஒலி(Audio ) 
 
ஒலிவாங்கி (Microphone) தொழில்நுட்பம் வளர்ச்சியடைந்ததன் பின்னர்,  தொடர்ச்சியான (Continuous) ஒலிஅலைகளை மின்அலைகளாக (electrical signal) மாற்ற (Convert) முடிந்தது.
கணினி மற்றும் தொலைத்தொடர்பு தொழில்நுட்பம் வளர்ச்சியடைந்த பின்னர், இந்த மின்அலைகள் (electrical signal), கணினியால் புரிந்துகொள்ளக்கூடிய அடி இரண்டு (Binary) க்கு மாற்றப்பட்டு கணினியில் பதியக் (Feed) கூடியதாக இருந்தது.
இந்த செயற்பாட்டை விபரமாக தகவல் தொடர்பாடல் புத்தகத்தின் அத்தியாயம் 8 இல் அறியலாம்.
இங்கே ஒலிவாங்கியை (Microphone) தேவைக்கு ஏற்ற வகையில் பயன்படுத்த முடியும். உதாரணமாக இசைவல்லுனர்கள் குரல் பதிவு ஒலிவாங்கி (vocal recording microphone) யை பயன்படுத்துகின்றனர். அதே வேளை இரகசிய பரிவர்த்தனை செயற்பாட்டுக்காக ஒலிவாங்கியும் (Microphone) பயன்படுத்தப்படுகின்றது.
இவ் ஒலி அலைகளை கணினியினுள் பதித்த பின்னர், அதில் உள்ள தவறுகளை நீக்கி, செம்மையாக்கி பயன்படுத்தமுடியும்.
 
காணொளி (Video )  

 

காணொளி அலையை கணினியில் திறம்பட பதித்த பின்னர், கண்ணால் பார்த்து உருவங்களை அடையாளப்படுத்த முடியும். இதற்கு எண்ணியல் கமெரா (Digital Camera) பயன்படுத்தப்படுகின்றது. இவ் எண்ணியல் கமெரா (Digital Camera) வின் உள்ளே தரவானது அடி இரண்டு (Binary) முறையில் சேகரித்து வைக்கப்படும்.

 
உண்மையில் வீடியோவை, வரிசையாக உள்ள அசையாத நிழற்படங்களாக கருதமுடியும். இப் படங்கள், சிறு சதுரங்களாக (Pixel) பிரித்தறியப்பட்டு, கணினியால் புரிந்துகொள்ளக்கூடிய  அடி இரண்டு (Binary) வடிவில் மாற்றப்படும்.

 

சிறிய கமெராவில் இருந்து, தொழில்நுட்பம் மிக்க உணரிகள் (Sensors) கொண்ட கமெராக்கள் வரை இவ் எண்ணியல் கமெரா (Digital Camera) உதவியாக உள்ளது.

The following two tabs change content below.

Leave a Reply

Your email address will not be published. Required fields are marked *