सीधे मुख्य सामग्री पर जाएं

data warehousing and characteristics

 Data warehousing and characteristics:-

डेटा वेयरहाउसिंग decision support technologies का एक storage है, जिसका उद्देश्य knowledge worker (executive, manager, analyst) को बेहतर और fast decision लेने में capable बनाना है।  डेटा माइनिंग क्षमता को बढ़ाया जा सकता है यदि डेटा वेयरहाउस में उपयुक्त डेटा collect और store किया गया हो।  डेटा वेयरहाउस एक रिलेशनल डेटाबेस मैनेजमेंट सिस्टम (RDBMS) है जिसे विशेष रूप से ट्रांजेक्शन प्रोसेसिंग सिस्टम की जरूरतों को पूरा करने के लिए डिज़ाइन किया गया है।  इसे किसी भी centralized data repository के रूप में परिभाषित किया जा सकता है जिसे business profit के लिए inquiry की जा सकती है लेकिन इसे बाद में और अधिक स्पष्ट रूप से define किया जाएगा।  

डेटा वेयरहाउसिंग एक नई शक्तिशाली तकनीक है जो stored operational data को निकालना और Various legacy data formats के बीच anomalies को दूर करना संभव बनाती है।  स्थान, formats या communication आवश्यकताओं की परवाह किए बिना पूरे enterprise में डेटा को Integrated करने के साथ-साथ additional or specialist जानकारी को शामिल करना संभव है।


एक रिलेशनल डेटाबेस के अलावा, एक डेटा वेयरहाउस वातावरण में एक extraction, transportation, transformation और loading (ETL) solution, एक Online analytical processing (OLAP) engine, client analysis tools और अन्य application शामिल हैं जो डेटा एकत्र करने की प्रोसेस का management करते हैं और  इसे business users तक पहुँचाना।

ETL टूल decision लेने के लिए डेटा को डेटा वेयरहाउस में निकालने, बदलने और लोड करने के लिए हैं। ETL टूल्स के विकास से पहले, उपर्युक्त ETL प्रोसेस प्रोग्रामर द्वारा बनाए गए एसक्यूएल कोड का उपयोग करके मैन्युअल रूप से की जाती थी। यह कार्य कई मामलों में exhausting था क्योंकि इसमें कई Resources, Complex Coding  और अधिक काम के घंटे शामिल थे। इसके , कोड को बनाए रखना प्रोग्रामर्स के बीच एक बड़ी चुनौती है।

ETL टूल्स द्वारा इन कठिनाइयों को समाप्त कर दिया गया है क्योंकि वे बहुत शक्तिशाली हैं और पुरानी मेथड की तुलना में वे निष्कर्षण, डेटा सफाई, डेटा प्रोफाइलिंग, परिवर्तन, डिबगिंग और डेटा वेयरहाउस में लोड होने से शुरू होने वाले ETL प्रोसेस के सभी चरणों में कई लाभ प्रदान करते हैं।

डेटा वेयरहाउसिंग शुरू करने का एक सामान्य तरीका डेटा वेयरहाउस की विशेषताओं को reference करना है, जैसा कि William Inmon, बिल्डिंग द डेटा वेयरहाउस के लेखक और गुरु, जिन्हें Comprehensive से डेटा वेयरहाउसिंग concept का originator माना जाता है, द्वारा निर्धारित किया गया है, निम्नानुसार है  : 

  • Subject Oriented 
  • Integrated 
  • Nonvolatile 
  • Time Variant
डेटा वेयरहाउस को डेटा का analysis करने में आपकी सहायता करने के लिए डिज़ाइन किया गया है। 

 उदाहरण : अपनी कंपनी के बिक्री डेटा के बारे में अधिक जानने के लिए, आप एक वेयरहाउस बना सकते हैं जो बिक्री पर केंद्रित हो। इस वेयरहाउस का उपयोग करके, आप "पिछले साल इस आइटम के लिए हमारा सबसे अच्छा ग्राहक कौन था?" जैसे सवालों के जवाब दे सकते हैं।

डेटा वेयरहाउस को अलग-अलग स्रोतों से डेटा को एक consistent format में रखना चाहिए।  उन्हें माप की इकाइयों के बीच Oppose और anomalies के जैसी समस्याओं का solution करना चाहिए।  जब वे इसे हासिल कर लेते हैं, तो उन्हें एकीकृत कहा जाता है।

non-volatile का अर्थ है कि, एक बार गोदाम में प्रवेश करने के बाद, डेटा नहीं बदलना चाहिए। यह reasonable है क्योंकि गोदाम का उद्देश्य आपको analysis करने में सक्षम बनाना है कि क्या हुआ है।


टिप्पणियाँ

इस ब्लॉग से लोकप्रिय पोस्ट

Query Optimization in hindi - computers in hindi 

 आज  हम  computers  in hindi  मे query optimization in dbms ( क्वैरी ऑप्टीमाइजेशन) के बारे में जानेगे क्या होता है और क्वैरी ऑप्टीमाइजेशन (query optimization in dbms) मे query processing in dbms और query optimization in dbms in hindi और  Measures of Query Cost    के बारे मे जानेगे  तो चलिए शुरु करते हैं-  Query Optimization in dbms (क्वैरी ऑप्टीमाइजेशन):- Optimization से मतलब है क्वैरी की cost को न्यूनतम करने से है । किसी क्वैरी की cost कई factors पर निर्भर करती है । query optimization के लिए optimizer का प्रयोग किया जाता है । क्वैरी ऑप्टीमाइज़र को क्वैरी के प्रत्येक operation की cos जानना जरूरी होता है । क्वैरी की cost को ज्ञात करना कठिन है । क्वैरी की cost कई parameters जैसे कि ऑपरेशन के लिए उपलब्ध memory , disk size आदि पर निर्भर करती है । query optimization के अन्दर क्वैरी की cost का मूल्यांकन ( evaluate ) करने का वह प्रभावी तरीका चुना जाता है जिसकी cost सबसे कम हो । अतः query optimization एक ऐसी प्रक्रिया है , जिसमें क्वैरी अर्थात् प्रश्न को हल करने का सबसे उपयुक्त तरीका चुना

Recovery technique in dbms । रिकवरी। recovery in hindi

 आज हम Recovery facilities in DBMS (रिकवरी)   के बारे मे जानेगे रिकवरी क्या होता है? और ये रिकवरी कितने प्रकार की होती है? तो चलिए शुरु करतेे हैं- Recovery in hindi( रिकवरी) :- यदि किसी सिस्टम का Data Base क्रैश हो जाये तो उस Data को पुनः उसी रूप में वापस लाने अर्थात् उसे restore करने को ही रिकवरी कहा जाता है ।  recovery technique(रिकवरी तकनीक):- यदि Data Base पुनः पुरानी स्थिति में ना आए तो आखिर में जिस स्थिति में भी आए उसे उसी स्थिति में restore किया जाता है । अतः रिकवरी का प्रयोग Data Base को पुनः पूर्व की स्थिति में लाने के लिये किया जाता है ताकि Data Base की सामान्य कार्यविधि बनी रहे ।  डेटा की रिकवरी करने के लिये यह आवश्यक है कि DBA के द्वारा समूह समय पर नया Data आने पर तुरन्त उसका Backup लेना चाहिए , तथा अपने Backup को समय - समय पर update करते रहना चाहिए । यह बैकअप DBA ( database administrator ) के द्वारा लगातार लिया जाना चाहिए तथा Data Base क्रैश होने पर इसे क्रमानुसार पुनः रिस्टोर कर देना चाहिए Types of recovery (  रिकवरी के प्रकार ):- 1. Log Based Recovery 2. Shadow pag