Database Concepts : SARKARI LIBRARY

 डाटा (Data)

  • तथ्यों और सूचनाओं का अव्यवस्थित संकलन (Raw facts) डाटा कहलाता है। 

  • डाटा वह तथ्य है जिसका स्वयं कोई विशेष अर्थ नहीं होता, परंतु एक निश्चित मान (Value) होता है। 

  • कोई भी संख्या, अक्षर, टेक्स्ट, चित्र, आवाज या चलचित्र (Numbers, Letters, Text, Image, Audio or Video) डाटा हो सकता है। 

डाटा के प्रकार (Types of Data)

कम्प्यूटर में स्टोर किए जाने वाली डाटा को निम्नलिखित वर्गों में बांटा जा सकता है

(i) संख्यात्मक डाटा (Numeric Data) :

  •  यह 0 से लेकर 9 तक (कुल 10) अंकों से बना डाटा है। 

  • संख्यात्मक डाटा पर अंकगणितीय क्रियाएं की जा सकती हैं। 

  • किसी कक्षा में विद्यार्थियों की कुल संख्या या परीक्षा में उनका प्राप्तांक संख्यात्मक डाटा है।

(ii) अक्षर डाटा (Alphabetic Data)

  • यह वर्णमाला के सभी अक्षरों से बना डाटा है।

जैसे

  • अंग्रेजी वर्णमाला के अक्षर (A, B, …….Z) या 

  • हिन्दी वर्णमाला के अक्षर (क, ख,…..ज्ञ) आदि। 

  • किसी कक्षा में विद्यार्थियों के नाम अक्षर डाटा हैं।

(iii) अक्षर संख्यात्मक डाटा (Alphanumeric Data) : 

  • यह सभी संख्याओं, सभी अक्षरों तथा विशेष चिह्नों (Special Characters) से मिलकर बना डाटा है। 

  • इसमें अंकगणितीय क्रियाएं नहीं की जा सकती, पर इनकी तुलना की जा सकती है। 

  • कक्षा के विद्यार्थियों का पता अक्षर संख्यात्मक डाटा है।

(iv) ध्वनि डाटा (Sound Data) : 

  • इसमें कम्प्यूटर पर स्टोर किए गए सभी प्रकार के आवाज तथा ध्वनि शामिल हैं।

(v) रेखाचित्र डाटा (Graphics Data)

  • इसमें चित्र, रेखाचित्र या ग्राफ के रूप में स्टोर किए गए डाटा शामिल हैं।

(vi) चलचित्र डाटा (Video Data)

  • इसमें सभी प्रकार के चलचित्र (Moving Pictures) से बने डाटा आते हैं। 

सूचना (Information)

  • सूचना उपयोगी डाटा का समूह है जो डाटा के विश्लेषण और संकलन के बाद प्राप्त किया जाता है तथा जिसके आधार पर कुछ निष्कर्ष निकाला जा सकता है। 

  • कम्प्यूटर उपयुक्त निर्देशों व अनुदेशों के आधार पर डाटा को सूचना में बदलता है। 

ज्ञान (Knowledge)

  • सूचना से निकाला गया निष्कर्ष ही ज्ञान है। 

डाटा बेस (Database)

  • किसी विशेष उद्देश्य के लिए एक स्थान पर संग्रहित एक समान तथा आपस में संबद्ध (Inter related) डाटा को डाटाबेस कहा जाता है। 

  • डाटा को व्यवस्थित कर उससे विभिन्न सूचनाएं प्राप्त की जा सकती हैं तथा उनका आवश्यकतानुसार उपयोग किया जा सकता है। 

  • एक ही डाटाबेस का उपयोग एक से अधिक उद्देश्यों के लिए किया जा सकता है। 

डाटा प्रोसेसिंग (Data Processing)

  • किसी इनपुट को उपयोगी आउटपुट में बदलने के लिए गतिविधियों और प्रक्रियाओं का क्रम प्रोसेसिंग कहलाता है। 

  • डाटा प्रोसेसिंग डाटा (इनपुट) को उपयोगी सूचना (आउटपुट) में बदलता है। 

डाटाबेस मैनेजमेंट सिस्टम (DBMS-Data Base Management System)

  • डाटा बेस मैनेजमेंट सिस्टम एक साफ्टवेयर प्रोग्राम है जो कम्प्यूटर का उपयोग कर डिजिटल डाटा बेस बनाने (create), डाटा को व्यवस्थित करने (Manipulate), उसमें परिवर्तन करने (Edit), उसे अद्यतन बनाने (Update), डाटा का साझा उपयोग करने (Share), पुराने डाटा को मिटाने (Delete) तथा नया डाटा स्टोर करने का कार्य करता है। 

  • डाटा बेस मैनेजमेंट सिस्टम कम्प्यूटर का उपयोग कर तथ्यों को एक स्थान पर स्टोर करने तथा अधिकृत उपयोगकर्ताओं (Authorized Users) द्वारा उनका उपयोग करने की व्यवस्था है। 

  • डाटा बेस मैनेजमेंट सिस्टम (DBMS) अनेक अधिकृत उपयोगकर्ताओं को अलग-अलग उद्देश्य के लिए डाटा व सूचना साझा (Share) करने की सुविधा उपलब्ध कराता है। 

डाटा बेस ऐडमिनिस्ट्रेटर (Data Base Administrator)

  • डाटा बेस ऐडमिनिस्ट्रेटर वह व्यक्ति या संस्था है जो कम्प्यूटर के उपयोग के लिए डाटा संकलित करने (Collect), सही फील्ड (Field) में डाटा स्टोर करने, डाटा को अद्यतन (Update) रखने, अनधिकृत व्यक्तियों (Unauthorized Users) से डाटा को सुरक्षित रखने तथा एंड यूजर को आवश्यकतानुसार उपयोग के लिए डाटा उपलब्ध कराने का काम करता है। 

  • डाटा बेस एडमिनिस्ट्रेटर का संपूर्ण डाटा पर नियंत्रण होता है जो डाटा का निर्माण (Creation) तथा संचालन (Management) करता है।

  • कम्प्यूटर डाटाबेस सिस्टम में एण्ड यूजर (End User) वह व्यक्ति है जिसके पास कम्प्यूटर का विशेष ज्ञान नहीं होता है, पर वह डाटाबेस का उपयोग जरूरी सूचनाएं प्राप्त करने के लिए करता है।

डाटा रिडन्डेन्सी या डाटा की पुनरावृत्ति (Data Redundancy)

  • यदि एक ही डाटा को एक से अधिक स्थानों पर स्टोर किया जाता है, तो इसे डाटा रिडन्डेन्सी कहा जाता है। 

  • इससे डाटा की पुनरावृत्ति (Duplication) होती है, डाटा में विसंगति (Inconsistency) होने की संभावना रहती है तथा स्टोरेज क्षमता की बर्बादी होती है। 

  • यदि किसी कंपनी के डाटाबेस में कर्मचारी का वेतनमान उसके बायोडाटा तथा पेरोल (Pay Roll) दोनों में स्टोर किया गया है. तो इसे डाटा रिडन्डेन्सी कहा जाएगा। 

  • डाटा बेस में सभी डाटा एक ही स्थान पर स्टोर किया जाता है। इससे डाटा रिडन्डेन्सी न्यूनतम होती है। 

डाटा इनकनसिसटेन्सि या डाटा विसंगति (Data Inconsistency)

  • डाटा में अलग-अलग स्थानों पर किसी एक ही तथ्य का अलंग-अलग मान होना Data Inconsistency कहलाता है। 

  • इससे एक ही विषय पर दो अलग-अलग परिणाम प्राप्त हो सकते हैं। 

  • यदि किसी कंपनी के डाटाबेस में कर्मचारियों का वेतनमान दो स्थानों पर स्टोर किया गया है, तो इसमें कोई परिवर्तन होने पर इसे दोनों स्थानों पर परिवर्तित किया जाना चाहिए। ऐसा नहीं होने पर एक ही डाटा के दो अलग-अलग मान प्रदर्शित होंगे। इसे डाटा विसंगति या Data Inconsistency कहा जाता है। 

  • डाटा बेस में डाटा की पुनरावृत्ति (Redundancy) को रोक कर डाटा विसंगति समाप्त किया जा सकता है। 

डाटा सुरक्षा (Data Security)

  • डाटा सुरक्षा का अर्थ है-डाटा को अनधिकृत व्यक्तियों (Unauthorized person) की पहुंच से दूर रखना ताकि डाटा में गलत तरीके से परिवर्तन (Modification) न किया जा सके और न ही डाटा को नष्ट (Destroy or Delete) किया जा सके। 

  • डाटा की सुरक्षा के लिए उपयोगकर्ता को डाटा तक पहुंच (Access) उपलब्ध कराने से पहले उसके प्राधिकार की जांच (Authorization Check) की जाती है। 

डाटा की विश्वसनीयता (Data Integrity)

  • डाटा बेस में प्रत्येक डाटा का मान सही तथा विश्वसनीय होना चाहिए। 

  • डाटा बेस साफ्टवेयर किसी डाटा के असंभव मानों की जांच करता है, परंतु डाटा स्टोर करने से पहले भी इसकी जांच की जानी चाहिए। 

  • डाटा की पुनरावृत्ति (redundancy) से भी डाटा की विश्वसनीयता प्रभावित होती है। 

आत्मनिर्भर डाटा (Data Independance)

  • डाटा बेस में स्टोर किए गए डाटा का प्रत्येक मान (Value) एक दूसरे से स्वतंत्र व आत्मनिर्भर होना चाहिए। 

  • कोई भी प्रोग्राम डाटा के किसी भाग का स्वतंत्रतापूर्वक उपयोग करने में सक्षम होना चाहिए। 

डाटा की गोपनीयता (Privacy of Data)

  • डाटा बेस में डाटा की गोपनीयता बनाये रखने के लिए यह निर्धारित किया जाता है कि कौन, किस डाटा को किस सीमा तक देख सकता है (View) या परिवर्तित (modify) कर सकता है। 

  • इस प्रकार, किसी महत्त्वपूर्ण या व्यक्तिगत डाटा की गोपनीयता सुनिश्चित की जाती है। 

डाटा बेस की प्रकृति (Characteristics of Data Base)

  • डाटा बेस में Data redundancy अर्थात डाटा की पुनरावृत्ति न्यूनतम होनी चाहिए। 

  • डाटा बेस में Data Inconsistency या डाटा विसंगति नगण्य होनी चाहिए। 

  • डाटा विभिन्न उपयोगकर्ताओं द्वारा अलग-अलग उद्देश्यों में प्रयोग के लिए उपलब्ध होना चाहिए। 

  • डाटा का प्रत्येक मान (Values) एक-दूसरे से स्वतंत्र होना चाहिए।

  •  प्रत्येक डाटा का मान सही (Correct) होना चाहिए। 

  • डाटा बेस अनधिकृत व्यक्तियों (Unauthorized Users) से सुरक्षित होना चाहिए। 

डाटा रिकॉर्ड करने के विभिन्न स्तर(Different Levels of Data Storage)

बिट (Bit) : 

  • डिजिटल डाटा की सबसे छोटी और मूल इकाई बिट या बाइनरी डिजिट (0 या 1) है। 

  • किसी भी डिजिटल डाटा को कम्प्यूटर मेमोरी में बिट के रूप में ही स्टोर किया जाता है।

कैरेक्टर (Character) : 

  • 8 बिट या 1 बाइट किसी एक कैरेक्टर को निरूपित करते हैं। 

  • कैरेक्टर वह सबसे छोटी और मूलभूत इकाई है जिसे मनुष्य समझ सकता है

फील्ड (Field) : 

  • डाटा बेस में मूल डाटा के मान जिस स्थान पर स्टोर किए जाते हैं, उन्हें फील्ड कहा जाता है। 

  • फील्ड में सूचनाओं को टेबल (रो और कॉलम) के रूप में व्यवस्थित किया जाता है। 

  • फील्ड कैरेक्टरों का अर्थपूर्ण संग्रह है। 

  • डाटा प्रोसेसिंग में फील्ड सबसे छोटी लॉजिकल इकाई है जिसका कुछ मान या अर्थ होता है।

रिकॉर्ड (Record) : 

  • एक ही विषय पर अलग-अलग फील्ड में स्टोर किए गए डाटा के समूह को रिकॉर्ड कहा जाता है। 

फाइल (File) : 

  • आपस में सम्बद्ध कई रिकार्ड का समूह फाइल कहलाता है। फाइल में प्रत्येक रिकॉर्ड एक ही फील्ड द्वारा पहचाना जाता है।

डाटाबेस (Database) : 

  • कई संबंधित फाइलों का समूह डाटाबेस कहलाता है।

  • डाटाबेस में सभी फाइलें एक-दूसरे से जुड़ी (Link) होती हैं।

  •  अतः डाटाबेस के किसी एक फील्ड में किया गया परिवर्तन सभी संबंधित फाइलों में परिलक्षित होता है। 

डाटाबेस मैनेजमेंट सिस्टम में प्रयुक्त डाटा मॉडल (Different Data Models Used for DBMS)

1.रिलेशनल डाटा मॉडल (Relational Data Model) : 

  • इसमें डाटा को टेबल्स (Tables) के संग्रह के रूप में व्यवस्थित किया जाता है। 

  • टेबल्स में रो (Rows) तथा कॉलम (Columns) होते हैं। 

  • इन टेबल्स को रिलेशन भी कहते हैं। 

  • टेबल या रिलेशन का रो (Rows) टपल (Tupples)कहलाता है जबकि कॉलम (Columns) को एट्रीब्यूट्स (Attributes) कहा जाता है। 

  • इसमें Structured Query Language के साफ्टवेयर का प्रयोग किया जाता है।

2. नेटवर्क डाटा मॉडल (Network Data Model) : 

  • इस मॉडल में डाटा को रिकॉर्ड (Records) के संग्रह के रूप में व्यवस्थित किया जाता है। 

  • रिकॉर्ड आपस में लिंक (Links) द्वारा सम्बद्ध होते हैं।

3.हाइरॉकिकल डाटा मॉडल (Hierarchical Data Model) : 

  • इस मॉडल में भी डाटा को रिकॉर्ड के संग्रह के रूप में व्यवस्थित किया जाता है, परंतु सभी रिकॉर्ड आपस में पदानुक्रम (Tree like structure) से जुड़े होते हैं। 

  • यह सबसे पुराना तथा लोकप्रिय डाटा मॉडल है। 

  • इसमें डाटा मैनुपुलेशन लैंग्वेज (Data Manupulation Language) साफ्टवेयर का प्रयोग किया जाता है। .

डाटा बेस लैंग्वेज (Data Base Language)

डाटाबेस साफ्टवेयर में निम्नलिखित प्रकार के लैंग्वेज का प्रयोग किया जाता है

(i) डाटा डेफिनीशन लैंग्वेज (DDL-Data Definition Language) : 

  • यह डाटा के प्रकार और उनके बीच संबंध को परिभाषित करता है। 

(ii) डाटा मैनीपुलेशन लैग्वेज (DML-Data Manipulation Language) : 

  • डाटा बेस में डाटा डालने (Insert), उसे अद्यतन बनाने (Edit) तथा डिलीट (Delete) करने का काम करता है। 

(iii) क्वारी लैंग्वेज (Query Language) : 

  • डाटाबेस से सूचना खोजने तथा प्राप्त सूचना को उचित रूप में प्रदर्शित करने का काम करता है। 

Structured Query Language (SQL) 

  • उपरोक्त तीनों कार्यों को एक साथ करने में सक्षम डाटा बेस लैंग्वेज है।

Object Query Language 

  • एक डाटाबेस लैंग्वेज है जिसका विकास Object Oriented डाटाबेस के लिए किया गया है। जो


डीबीएमएस साफ्टवेयर (DBMS Software)

डीबीएमएस शब्दावलियां (DBMS Terms) 

(i) रिलेशन (Relation) : 

  • रिलेशन एक डाटा युक्त टेबल (Table) है जिसमें डाटा को रो (rows) या टपल (Tuples) तथा कॉलम (Columns) या एट्रीब्यूट (Attributes) में व्यवस्थित किया जाता है। 

(ii) टपल (Tuples) : 

  • टेबल या रिलेशन का रो (rows) टपल कहलाता है। 

(ii) एट्रीब्यूट (Attributes) : 

  • टेबल या रिलेशन का कॉलम (Column) एट्रीब्यूट कहलाता है। 

(iv) डिग्री (Degree) : 

  • किसी टेबल या रिलेशन में attributes की संख्या उसकी डिग्री कहलाती है। 

(v) कार्डिनलीटी (Cardinality) : 

  • किसी टेबल या रिलेशन में रो (Rows) या टपल की संख्या उसका कार्डिनलीटी … कहलाता है।  

(vi) व्यू (Views) : 

  • वह टेबल, जिसका स्वयं का अपना कोई डाटा नहीं होता, बल्कि उस टेबल के डाटा दूसरे बेस टेबल से लिए गए होते हैं, Views कहलाता है। 

  • इस प्रकार, Views एक आभासी टेबल (Virtual Table) है। 

  • Views उपयोगकर्ता के लिए किसी सूचना तक सीमित पहुंच (access) प्रदान करने का एक उपयोगी तरीका है। 

(vii) प्राइमरी की (Primary Key) : 

  • किसी डाटाबेस में प्रत्येक रिकार्ड या रो का एक विशेष (Unique) पहचान होता है जिसे प्राइमरी की (Primary Key) कहा जाता है। 

(vii) सेकेण्डरी की (Secondary Key) : 

  • डाटाबेस में किसी फील्ड की पहचान के लिए एक से अधिक प्राइमरी की हो सकते हैं, लेकिन उस फील्ड तक पहुंचने के लिए किसी एक ही प्राइमरी की का चयन किया जाता है। ऐसी स्थिति में, जिन की का चयन नहीं किया जाता, वे सेकेण्डरी की (SecondaryKey) कहलाते हैं। 

(ix) मेटा डाटा (Meta Data) : 

  • किसी अन्य डाटा की स्थिति (Location) तथा विषय (Content) की सूचना देने वाला डाटा मेटा डाटा (Meta Data) कहलाता है। 

  • इसे डाटा का डाटा (Data of Data) कहते हैं। 

  • इसका प्रयोग इंटरनेट पर Search Engine Optimization में किया जाता है।