सीधे मुख्य सामग्री पर जाएं

Data warehouse | डेटा वेयरहाउस

 आज हम Data warehouse in hindi और data warehouse architecture in hindi के बारे में जानेगे क्या होता है तो चलिए शुरु करते हैं:-

डेटा वेयरहाउस (What is Data warehouse):-

definition of data warehouse in hindi:-

डेटा वेयरहाउस का अर्थ सूचनाओं का संग्रहण है जो कि किसी संस्था के लिए किए जाने वाले कार्यों में भूमिका निभाता है । इसकी भूमिका निर्णय लेने की होती है । इसमें सूचनाओं को संग्रहित करने के साथ - साथ आवश्यकता पड़ने पर उन्हें निकाला भी जा सकता है , यह भी एक महत्वपूर्ण कार्य है । डेटाबेस मैनेजमेन्ट सिस्टम के अन्तर्गत डेटाबेस को स्टोर करना डेटा वेयरहाउस (Data warehouse in hindi) कहलाता है।

data warehousing in hindi:-

डेटा वेयरहाउस को विशेष प्रकार से तैयार किया जाता है ताकि user को जिस जानकारी की आवश्यकता है वह उसे आसानी से पहचान सके । एक डेटा वेयरहाउस में रिलेशनल डेटा तथा डेटाबेस का बहुत बड़ा collection उपस्थित होता है । यह collection डेटा प्रबन्धन ( management ) में मुख्य भूमिका निभाता है । नेटवर्किंग के द्वारा यह उस संस्था के सभी कम्प्यूटर्स से जुड़ा होता है ताकि user किसी भी कम्प्यूटर से इसका प्रयोग कर सके । यह एक डेटाबेस होता है जो कि रिपोर्ट तथा विश्लेषण के लिए प्रयोग किया जाता है । डेटा वेयरहाउस की परिभाषा डेटा के स्टोरेज की तरफ ध्यान केन्द्रित करती है । डेटा वेयरहाउस में डेटा को संग्रह ( store ) करने के दो तरीके

 Types of data warehouse in hindi: -

1.dimensional method 

2. normalized method 

1. Dimensional Method :-

इस मैथड में डेटा दो भागों में स्टोर किया जाता है । इसमें डेटा को facts तथा dimension में विभाजित किया जाता है । अंकगणित्तिय ट्रांजेक्शन डेटा fact कहलाता है तथा इससे सम्बन्धित सूचनाएं dimension कहलाती हैं । यदि किसी बैंक ट्रांजेक्शन का उदाहरण लें तो यह कहा जा कसता है कि खाता संख्या , जमा या निकास राशि facts हैं तथा खाताधारी का एड्रेस , निकासी या जमा रसीद की संख्या , खाताधारी का नाम तथा दिनांक इत्यादि dimension हैं । डेटा वेयरहाउस में डेटा का स्टोर करने का यह सबसे सरलतम एवं अधिक उपयोग मैथड है , क्योंकि इसमें से सूचनाओं को शीघ्र प्राप्त किया जा सकता है । इसे समझने में भी आसानी होती है तथा इसे आसानी से प्रयोग किया जा सकता है ।

2. Normalized method:-

इस मैथड में डेटा को टेबल के रूप में स्टोर किया जाता है । इस मैथड से डेटा का स्टोर करने के लिए डेटाबेस के नॉर्मलाइज़ेशन के नियमों का पालन किया जाता है । यह डेटा को ढंग से स्टोर करने का तरीका है । यह थोड़ा कठिन होता है क्योंकि इसे उपयोग करने के लिए नार्मलाइजेशन के नियम मालूम होने आवश्यक हैं ।

data warehouse architecture:-

Data source जेसे रिलेशनल डेटाबेस ई.आर.पी. सिस्टम आदि से डेटा की integrate किया जाता है । data source डेटा वेयरहाउस में सूचना को ट्रांस्मिट कर सकता है या डेटा वेयरहाउस source को डेटा के लिए request भेज सकता है। 
Data source से प्राप्त डेटा अथवा सूचना को एक central storage में store किया जाता है , जिस डेटा वेयरहाउस कहते हैं । विभिन्न data source अलग - अलग schema में डेटा का संग्रहण ( storage ) करते हैं तथा उनका डेटा मॉडल भी अलग हो सकता है । अत : डेटा वेयरहाउस को schema integration perform करना पड़ता है । डेटा को store करने से पूर्व integrated schema में परिवर्तित किया जाता है।
डेटा को correct करने व pre - processing में होने वाली प्रक्रिया को data cleansing कहा जाता है । data source से प्राप्त डेटा में छोटी गल्तियां या minor inconsistencies का होना सम्भव है जिन्हें सही किया जा सकता है । error जैसे name misspend . wrong data आदि हो सकती हैं । data source से प्राप्त डेटा में duplicates हो सकते हैं जिनको दूर किया जाता है । डेटा को transform भी किया जाता है ।अत : cleaned a transformed डेटा को डेटा वेयरहाउस डिस्क में संग्रहित ( store ) किया जाता है । आवश्यकता पड़ने पर जिनको क्वैरी या analysis tools के द्वारा पुनः प्राप्त किया जा सकता है । ये tools क्लाईंट site पर होते हैं । Data saniree में किसी रिलेशन में बदलाव होने पर डेटा वेयरहाउस में भी बदलाव होता है । 
Transaction processing system के द्वारा generate किया गया raw डेटा ऑनलाईन स्टोर करने के लिए बहुत ज़्यादा होता है इसलिए raw डेटा को summarize करना आवश्यक होता है । 
डेटा वयरहाउस की प्रक्रिया को केवल तीन शब्दों Extract . Transform a Load TETL ) के द्वारा व्यक्त किया जाता है । Data analysis के लिए वेयरहाउस में schena तैयार की जाती हैं । दो प्रकार की schema ( start schema a show flake schema) का प्रयोग किया जाता है । मल्टी - डायमेन्शनल डेटा में दो एट्रीब्यूट्स dimension व measure होते हैं । टेवल जिसमें मल्टी - डायमेन्शनल डेरा होता है वह fact table कहलाती है । स्टोरेज आवश्यकता को कम करने के लिए डायमेन्शन एट्रीब्यूट को अन्य टेबल में foreign key बनाया जाता है । इस टेबल को dimensional table कहा जाता है।
data warehouse architecture


components of Data Warehouse :-

1. Meta Data 
2. Transformation Programs
3. Summery of Data 
4. Current Details 
5. Records of System


टिप्पणियाँ

इस ब्लॉग से लोकप्रिय पोस्ट

Recovery technique in dbms । रिकवरी। recovery in hindi

 आज हम Recovery facilities in DBMS (रिकवरी)   के बारे मे जानेगे रिकवरी क्या होता है? और ये रिकवरी कितने प्रकार की होती है? तो चलिए शुरु करतेे हैं- Recovery in hindi( रिकवरी) :- यदि किसी सिस्टम का Data Base क्रैश हो जाये तो उस Data को पुनः उसी रूप में वापस लाने अर्थात् उसे restore करने को ही रिकवरी कहा जाता है ।  recovery technique(रिकवरी तकनीक):- यदि Data Base पुनः पुरानी स्थिति में ना आए तो आखिर में जिस स्थिति में भी आए उसे उसी स्थिति में restore किया जाता है । अतः रिकवरी का प्रयोग Data Base को पुनः पूर्व की स्थिति में लाने के लिये किया जाता है ताकि Data Base की सामान्य कार्यविधि बनी रहे ।  डेटा की रिकवरी करने के लिये यह आवश्यक है कि DBA के द्वारा समूह समय पर नया Data आने पर तुरन्त उसका Backup लेना चाहिए , तथा अपने Backup को समय - समय पर update करते रहना चाहिए । यह बैकअप DBA ( database administrator ) के द्वारा लगातार लिया जाना चाहिए तथा Data Base क्रैश होने पर इसे क्रमानुसार पुनः रिस्टोर कर देना चाहिए Types of recovery (  रिकवरी के प्रकार ):- 1. Log Based Recovery 2. Shadow pag

Query Optimization in hindi - computers in hindi 

 आज  हम  computers  in hindi  मे query optimization in dbms ( क्वैरी ऑप्टीमाइजेशन) के बारे में जानेगे क्या होता है और क्वैरी ऑप्टीमाइजेशन (query optimization in dbms) मे query processing in dbms और query optimization in dbms in hindi और  Measures of Query Cost    के बारे मे जानेगे  तो चलिए शुरु करते हैं-  Query Optimization in dbms (क्वैरी ऑप्टीमाइजेशन):- Optimization से मतलब है क्वैरी की cost को न्यूनतम करने से है । किसी क्वैरी की cost कई factors पर निर्भर करती है । query optimization के लिए optimizer का प्रयोग किया जाता है । क्वैरी ऑप्टीमाइज़र को क्वैरी के प्रत्येक operation की cos जानना जरूरी होता है । क्वैरी की cost को ज्ञात करना कठिन है । क्वैरी की cost कई parameters जैसे कि ऑपरेशन के लिए उपलब्ध memory , disk size आदि पर निर्भर करती है । query optimization के अन्दर क्वैरी की cost का मूल्यांकन ( evaluate ) करने का वह प्रभावी तरीका चुना जाता है जिसकी cost सबसे कम हो । अतः query optimization एक ऐसी प्रक्रिया है , जिसमें क्वैरी अर्थात् प्रश्न को हल करने का सबसे उपयुक्त तरीका चुना