आज हम Data warehouse in hindi और data warehouse architecture in hindi के बारे में जानेगे क्या होता है तो चलिए शुरु करते हैं:-
डेटा वेयरहाउस (What is Data warehouse):-
definition of data warehouse in hindi:-
डेटा वेयरहाउस का अर्थ सूचनाओं का संग्रहण है जो कि किसी संस्था के लिए किए जाने वाले कार्यों में भूमिका निभाता है । इसकी भूमिका निर्णय लेने की होती है । इसमें सूचनाओं को संग्रहित करने के साथ - साथ आवश्यकता पड़ने पर उन्हें निकाला भी जा सकता है , यह भी एक महत्वपूर्ण कार्य है । डेटाबेस मैनेजमेन्ट सिस्टम के अन्तर्गत डेटाबेस को स्टोर करना डेटा वेयरहाउस (Data warehouse in hindi) कहलाता है।
data warehousing in hindi:-
डेटा वेयरहाउस को विशेष प्रकार से तैयार किया जाता है ताकि user को जिस जानकारी की आवश्यकता है वह उसे आसानी से पहचान सके । एक डेटा वेयरहाउस में रिलेशनल डेटा तथा डेटाबेस का बहुत बड़ा collection उपस्थित होता है । यह collection डेटा प्रबन्धन ( management ) में मुख्य भूमिका निभाता है । नेटवर्किंग के द्वारा यह उस संस्था के सभी कम्प्यूटर्स से जुड़ा होता है ताकि user किसी भी कम्प्यूटर से इसका प्रयोग कर सके । यह एक डेटाबेस होता है जो कि रिपोर्ट तथा विश्लेषण के लिए प्रयोग किया जाता है । डेटा वेयरहाउस की परिभाषा डेटा के स्टोरेज की तरफ ध्यान केन्द्रित करती है । डेटा वेयरहाउस में डेटा को संग्रह ( store ) करने के दो तरीके
Types of data warehouse in hindi: -
1.dimensional method
2. normalized method
1. Dimensional Method :-
इस मैथड में डेटा दो भागों में स्टोर किया जाता है । इसमें डेटा को facts तथा dimension में विभाजित किया जाता है । अंकगणित्तिय ट्रांजेक्शन डेटा fact कहलाता है तथा इससे सम्बन्धित सूचनाएं dimension कहलाती हैं । यदि किसी बैंक ट्रांजेक्शन का उदाहरण लें तो यह कहा जा कसता है कि खाता संख्या , जमा या निकास राशि facts हैं तथा खाताधारी का एड्रेस , निकासी या जमा रसीद की संख्या , खाताधारी का नाम तथा दिनांक इत्यादि dimension हैं । डेटा वेयरहाउस में डेटा का स्टोर करने का यह सबसे सरलतम एवं अधिक उपयोग मैथड है , क्योंकि इसमें से सूचनाओं को शीघ्र प्राप्त किया जा सकता है । इसे समझने में भी आसानी होती है तथा इसे आसानी से प्रयोग किया जा सकता है ।
2. Normalized method:-
इस मैथड में डेटा को टेबल के रूप में स्टोर किया जाता है । इस मैथड से डेटा का स्टोर करने के लिए डेटाबेस के नॉर्मलाइज़ेशन के नियमों का पालन किया जाता है । यह डेटा को ढंग से स्टोर करने का तरीका है । यह थोड़ा कठिन होता है क्योंकि इसे उपयोग करने के लिए नार्मलाइजेशन के नियम मालूम होने आवश्यक हैं ।
data warehouse architecture:-
Data source जेसे रिलेशनल डेटाबेस ई.आर.पी. सिस्टम आदि से डेटा की integrate किया जाता है । data source डेटा वेयरहाउस में सूचना को ट्रांस्मिट कर सकता है या डेटा वेयरहाउस source को डेटा के लिए request भेज सकता है।
Data source से प्राप्त डेटा अथवा सूचना को एक central storage में store किया जाता है , जिस डेटा वेयरहाउस कहते हैं । विभिन्न data source अलग - अलग schema में डेटा का संग्रहण ( storage ) करते हैं तथा उनका डेटा मॉडल भी अलग हो सकता है । अत : डेटा वेयरहाउस को schema integration perform करना पड़ता है । डेटा को store करने से पूर्व integrated schema में परिवर्तित किया जाता है।
डेटा को correct करने व pre - processing में होने वाली प्रक्रिया को data cleansing कहा जाता है । data source से प्राप्त डेटा में छोटी गल्तियां या minor inconsistencies का होना सम्भव है जिन्हें सही किया जा सकता है । error जैसे name misspend . wrong data आदि हो सकती हैं । data source से प्राप्त डेटा में duplicates हो सकते हैं जिनको दूर किया जाता है । डेटा को transform भी किया जाता है ।अत : cleaned a transformed डेटा को डेटा वेयरहाउस डिस्क में संग्रहित ( store ) किया जाता है । आवश्यकता पड़ने पर जिनको क्वैरी या analysis tools के द्वारा पुनः प्राप्त किया जा सकता है । ये tools क्लाईंट site पर होते हैं । Data saniree में किसी रिलेशन में बदलाव होने पर डेटा वेयरहाउस में भी बदलाव होता है ।
Transaction processing system के द्वारा generate किया गया raw डेटा ऑनलाईन स्टोर करने के लिए बहुत ज़्यादा होता है इसलिए raw डेटा को summarize करना आवश्यक होता है ।
डेटा वयरहाउस की प्रक्रिया को केवल तीन शब्दों Extract . Transform a Load TETL ) के द्वारा व्यक्त किया जाता है । Data analysis के लिए वेयरहाउस में schena तैयार की जाती हैं । दो प्रकार की schema ( start schema a show flake schema) का प्रयोग किया जाता है । मल्टी - डायमेन्शनल डेटा में दो एट्रीब्यूट्स dimension व measure होते हैं । टेवल जिसमें मल्टी - डायमेन्शनल डेरा होता है वह fact table कहलाती है । स्टोरेज आवश्यकता को कम करने के लिए डायमेन्शन एट्रीब्यूट को अन्य टेबल में foreign key बनाया जाता है । इस टेबल को dimensional table कहा जाता है।
components of Data Warehouse :-
1. Meta Data
2. Transformation Programs
3. Summery of Data
4. Current Details
5. Records of System
टिप्पणियाँ
एक टिप्पणी भेजें