सीधे मुख्य सामग्री पर जाएं

data warehousing and characteristics

 Data warehousing and characteristics:-

डेटा वेयरहाउसिंग decision support technologies का एक storage है, जिसका उद्देश्य knowledge worker (executive, manager, analyst) को बेहतर और fast decision लेने में capable बनाना है।  डेटा माइनिंग क्षमता को बढ़ाया जा सकता है यदि डेटा वेयरहाउस में उपयुक्त डेटा collect और store किया गया हो।  डेटा वेयरहाउस एक रिलेशनल डेटाबेस मैनेजमेंट सिस्टम (RDBMS) है जिसे विशेष रूप से ट्रांजेक्शन प्रोसेसिंग सिस्टम की जरूरतों को पूरा करने के लिए डिज़ाइन किया गया है।  इसे किसी भी centralized data repository के रूप में परिभाषित किया जा सकता है जिसे business profit के लिए inquiry की जा सकती है लेकिन इसे बाद में और अधिक स्पष्ट रूप से define किया जाएगा।  

डेटा वेयरहाउसिंग एक नई शक्तिशाली तकनीक है जो stored operational data को निकालना और Various legacy data formats के बीच anomalies को दूर करना संभव बनाती है।  स्थान, formats या communication आवश्यकताओं की परवाह किए बिना पूरे enterprise में डेटा को Integrated करने के साथ-साथ additional or specialist जानकारी को शामिल करना संभव है।


एक रिलेशनल डेटाबेस के अलावा, एक डेटा वेयरहाउस वातावरण में एक extraction, transportation, transformation और loading (ETL) solution, एक Online analytical processing (OLAP) engine, client analysis tools और अन्य application शामिल हैं जो डेटा एकत्र करने की प्रोसेस का management करते हैं और  इसे business users तक पहुँचाना।

ETL टूल decision लेने के लिए डेटा को डेटा वेयरहाउस में निकालने, बदलने और लोड करने के लिए हैं। ETL टूल्स के विकास से पहले, उपर्युक्त ETL प्रोसेस प्रोग्रामर द्वारा बनाए गए एसक्यूएल कोड का उपयोग करके मैन्युअल रूप से की जाती थी। यह कार्य कई मामलों में exhausting था क्योंकि इसमें कई Resources, Complex Coding  और अधिक काम के घंटे शामिल थे। इसके , कोड को बनाए रखना प्रोग्रामर्स के बीच एक बड़ी चुनौती है।

ETL टूल्स द्वारा इन कठिनाइयों को समाप्त कर दिया गया है क्योंकि वे बहुत शक्तिशाली हैं और पुरानी मेथड की तुलना में वे निष्कर्षण, डेटा सफाई, डेटा प्रोफाइलिंग, परिवर्तन, डिबगिंग और डेटा वेयरहाउस में लोड होने से शुरू होने वाले ETL प्रोसेस के सभी चरणों में कई लाभ प्रदान करते हैं।

डेटा वेयरहाउसिंग शुरू करने का एक सामान्य तरीका डेटा वेयरहाउस की विशेषताओं को reference करना है, जैसा कि William Inmon, बिल्डिंग द डेटा वेयरहाउस के लेखक और गुरु, जिन्हें Comprehensive से डेटा वेयरहाउसिंग concept का originator माना जाता है, द्वारा निर्धारित किया गया है, निम्नानुसार है  : 

  • Subject Oriented 
  • Integrated 
  • Nonvolatile 
  • Time Variant
डेटा वेयरहाउस को डेटा का analysis करने में आपकी सहायता करने के लिए डिज़ाइन किया गया है। 

 उदाहरण : अपनी कंपनी के बिक्री डेटा के बारे में अधिक जानने के लिए, आप एक वेयरहाउस बना सकते हैं जो बिक्री पर केंद्रित हो। इस वेयरहाउस का उपयोग करके, आप "पिछले साल इस आइटम के लिए हमारा सबसे अच्छा ग्राहक कौन था?" जैसे सवालों के जवाब दे सकते हैं।

डेटा वेयरहाउस को अलग-अलग स्रोतों से डेटा को एक consistent format में रखना चाहिए।  उन्हें माप की इकाइयों के बीच Oppose और anomalies के जैसी समस्याओं का solution करना चाहिए।  जब वे इसे हासिल कर लेते हैं, तो उन्हें एकीकृत कहा जाता है।

non-volatile का अर्थ है कि, एक बार गोदाम में प्रवेश करने के बाद, डेटा नहीं बदलना चाहिए। यह reasonable है क्योंकि गोदाम का उद्देश्य आपको analysis करने में सक्षम बनाना है कि क्या हुआ है।


टिप्पणियाँ

इस ब्लॉग से लोकप्रिय पोस्ट

Query Optimization in hindi - computers in hindi 

 आज  हम  computers  in hindi  मे query optimization in dbms ( क्वैरी ऑप्टीमाइजेशन) के बारे में जानेगे क्या होता है और क्वैरी ऑप्टीमाइजेशन (query optimization in dbms) मे query processing in dbms और query optimization in dbms in hindi और  Measures of Query Cost    के बारे मे जानेगे  तो चलिए शुरु करते हैं-  Query Optimization in dbms (क्वैरी ऑप्टीमाइजेशन):- Optimization से मतलब है क्वैरी की cost को न्यूनतम करने से है । किसी क्वैरी की cost कई factors पर निर्भर करती है । query optimization के लिए optimizer का प्रयोग किया जाता है । क्वैरी ऑप्टीमाइज़र को क्वैरी के प्रत्येक operation की cos जानना जरूरी होता है । क्वैरी की cost को ज्ञात करना कठिन है । क्वैरी की cost कई parameters जैसे कि ऑपरेशन के लिए उपलब्ध memory , disk size आदि पर निर्भर करती है । query optimization के अन्दर क्वैरी की cost का मूल्यांकन ( evaluate ) करने का वह प्रभावी तरीका चुना जाता है जिसकी cost सबसे कम हो । अतः query optimization एक ऐसी प्रक्रिया है , जिसमें क्वैरी अर्थात् प्रश्न को हल करने का सबसे उपयुक्त तरीका चुना

acid properties in dbms - computers in hindi

 आज हम computers in hindi के अन्दर Properties of Transaction (acid properties in dbms) के बारे मे जानेगे क्या होता है तो चलिए शुरु करते हैं:- Properties of Transaction ( कार्यसम्पादन के गुण ) (ACID in hindi) :- Atomicity , Consistency , Isolation , Durability - ACID सामान्यत : किसी transaction की 4 प्रॉपर्टीज़ होती हैं-  1. Atomicity  2. Consistency  3. Isolation  4. Durability  1. Atomicity transaction :-   Atomicity transaction की प्रॉपर्टी के द्वारा यह comfirm किया जाता है की transaction   के द्वारा किए जाने वाले सभी ऑपरेशन पूर्ण होंगे या उनमें से एक भी execute नहीं होगा । इसमें transaction के प्रत्येक ऑपरेशन को एक अकेली यूनिट की भांति व्यवहार किया जाता है । आइए इसे एक example की सहायता से समझते हैं। acid properties with example :-  यदि प्रथम ऑपरेशन सफल पूर्ण हो जाए तथा द्वितीय ऑपरेशन पर आते ही transaction असफल अर्थात् फेल हो जाए तो ऐसी स्थिति में प्रथम ऑपरेशन भी rollback हो जाएगा । Atomicity को transaction manager के द्वारा नियंत्रित किया जाता है । transaction manager डेटाबेस