सीधे मुख्य सामग्री पर जाएं

Data warehouse | डेटा वेयरहाउस

 आज हम Data warehouse in hindi और data warehouse architecture in hindi के बारे में जानेगे क्या होता है तो चलिए शुरु करते हैं:-

डेटा वेयरहाउस (What is Data warehouse):-

definition of data warehouse in hindi:-

डेटा वेयरहाउस का अर्थ सूचनाओं का संग्रहण है जो कि किसी संस्था के लिए किए जाने वाले कार्यों में भूमिका निभाता है । इसकी भूमिका निर्णय लेने की होती है । इसमें सूचनाओं को संग्रहित करने के साथ - साथ आवश्यकता पड़ने पर उन्हें निकाला भी जा सकता है , यह भी एक महत्वपूर्ण कार्य है । डेटाबेस मैनेजमेन्ट सिस्टम के अन्तर्गत डेटाबेस को स्टोर करना डेटा वेयरहाउस (Data warehouse in hindi) कहलाता है।

data warehousing in hindi:-

डेटा वेयरहाउस को विशेष प्रकार से तैयार किया जाता है ताकि user को जिस जानकारी की आवश्यकता है वह उसे आसानी से पहचान सके । एक डेटा वेयरहाउस में रिलेशनल डेटा तथा डेटाबेस का बहुत बड़ा collection उपस्थित होता है । यह collection डेटा प्रबन्धन ( management ) में मुख्य भूमिका निभाता है । नेटवर्किंग के द्वारा यह उस संस्था के सभी कम्प्यूटर्स से जुड़ा होता है ताकि user किसी भी कम्प्यूटर से इसका प्रयोग कर सके । यह एक डेटाबेस होता है जो कि रिपोर्ट तथा विश्लेषण के लिए प्रयोग किया जाता है । डेटा वेयरहाउस की परिभाषा डेटा के स्टोरेज की तरफ ध्यान केन्द्रित करती है । डेटा वेयरहाउस में डेटा को संग्रह ( store ) करने के दो तरीके

 Types of data warehouse in hindi: -

1.dimensional method 

2. normalized method 

1. Dimensional Method :-

इस मैथड में डेटा दो भागों में स्टोर किया जाता है । इसमें डेटा को facts तथा dimension में विभाजित किया जाता है । अंकगणित्तिय ट्रांजेक्शन डेटा fact कहलाता है तथा इससे सम्बन्धित सूचनाएं dimension कहलाती हैं । यदि किसी बैंक ट्रांजेक्शन का उदाहरण लें तो यह कहा जा कसता है कि खाता संख्या , जमा या निकास राशि facts हैं तथा खाताधारी का एड्रेस , निकासी या जमा रसीद की संख्या , खाताधारी का नाम तथा दिनांक इत्यादि dimension हैं । डेटा वेयरहाउस में डेटा का स्टोर करने का यह सबसे सरलतम एवं अधिक उपयोग मैथड है , क्योंकि इसमें से सूचनाओं को शीघ्र प्राप्त किया जा सकता है । इसे समझने में भी आसानी होती है तथा इसे आसानी से प्रयोग किया जा सकता है ।

2. Normalized method:-

इस मैथड में डेटा को टेबल के रूप में स्टोर किया जाता है । इस मैथड से डेटा का स्टोर करने के लिए डेटाबेस के नॉर्मलाइज़ेशन के नियमों का पालन किया जाता है । यह डेटा को ढंग से स्टोर करने का तरीका है । यह थोड़ा कठिन होता है क्योंकि इसे उपयोग करने के लिए नार्मलाइजेशन के नियम मालूम होने आवश्यक हैं ।

data warehouse architecture:-

Data source जेसे रिलेशनल डेटाबेस ई.आर.पी. सिस्टम आदि से डेटा की integrate किया जाता है । data source डेटा वेयरहाउस में सूचना को ट्रांस्मिट कर सकता है या डेटा वेयरहाउस source को डेटा के लिए request भेज सकता है। 
Data source से प्राप्त डेटा अथवा सूचना को एक central storage में store किया जाता है , जिस डेटा वेयरहाउस कहते हैं । विभिन्न data source अलग - अलग schema में डेटा का संग्रहण ( storage ) करते हैं तथा उनका डेटा मॉडल भी अलग हो सकता है । अत : डेटा वेयरहाउस को schema integration perform करना पड़ता है । डेटा को store करने से पूर्व integrated schema में परिवर्तित किया जाता है।
डेटा को correct करने व pre - processing में होने वाली प्रक्रिया को data cleansing कहा जाता है । data source से प्राप्त डेटा में छोटी गल्तियां या minor inconsistencies का होना सम्भव है जिन्हें सही किया जा सकता है । error जैसे name misspend . wrong data आदि हो सकती हैं । data source से प्राप्त डेटा में duplicates हो सकते हैं जिनको दूर किया जाता है । डेटा को transform भी किया जाता है ।अत : cleaned a transformed डेटा को डेटा वेयरहाउस डिस्क में संग्रहित ( store ) किया जाता है । आवश्यकता पड़ने पर जिनको क्वैरी या analysis tools के द्वारा पुनः प्राप्त किया जा सकता है । ये tools क्लाईंट site पर होते हैं । Data saniree में किसी रिलेशन में बदलाव होने पर डेटा वेयरहाउस में भी बदलाव होता है । 
Transaction processing system के द्वारा generate किया गया raw डेटा ऑनलाईन स्टोर करने के लिए बहुत ज़्यादा होता है इसलिए raw डेटा को summarize करना आवश्यक होता है । 
डेटा वयरहाउस की प्रक्रिया को केवल तीन शब्दों Extract . Transform a Load TETL ) के द्वारा व्यक्त किया जाता है । Data analysis के लिए वेयरहाउस में schena तैयार की जाती हैं । दो प्रकार की schema ( start schema a show flake schema) का प्रयोग किया जाता है । मल्टी - डायमेन्शनल डेटा में दो एट्रीब्यूट्स dimension व measure होते हैं । टेवल जिसमें मल्टी - डायमेन्शनल डेरा होता है वह fact table कहलाती है । स्टोरेज आवश्यकता को कम करने के लिए डायमेन्शन एट्रीब्यूट को अन्य टेबल में foreign key बनाया जाता है । इस टेबल को dimensional table कहा जाता है।
data warehouse architecture


components of Data Warehouse :-

1. Meta Data 
2. Transformation Programs
3. Summery of Data 
4. Current Details 
5. Records of System


टिप्पणियाँ

इस ब्लॉग से लोकप्रिय पोस्ट

Recovery technique in dbms । रिकवरी। recovery in hindi

 आज हम Recovery facilities in DBMS (रिकवरी)   के बारे मे जानेगे रिकवरी क्या होता है? और ये रिकवरी कितने प्रकार की होती है? तो चलिए शुरु करतेे हैं- Recovery in hindi( रिकवरी) :- यदि किसी सिस्टम का Data Base क्रैश हो जाये तो उस Data को पुनः उसी रूप में वापस लाने अर्थात् उसे restore करने को ही रिकवरी कहा जाता है ।  recovery technique(रिकवरी तकनीक):- यदि Data Base पुनः पुरानी स्थिति में ना आए तो आखिर में जिस स्थिति में भी आए उसे उसी स्थिति में restore किया जाता है । अतः रिकवरी का प्रयोग Data Base को पुनः पूर्व की स्थिति में लाने के लिये किया जाता है ताकि Data Base की सामान्य कार्यविधि बनी रहे ।  डेटा की रिकवरी करने के लिये यह आवश्यक है कि DBA के द्वारा समूह समय पर नया Data आने पर तुरन्त उसका Backup लेना चाहिए , तथा अपने Backup को समय - समय पर update करते रहना चाहिए । यह बैकअप DBA ( database administrator ) के द्वारा लगातार लिया जाना चाहिए तथा Data Base क्रैश होने पर इसे क्रमानुसार पुनः रिस्टोर कर देना चाहिए Types of recovery (  रिकवरी के प्रकार ):- 1. Log Based Recovery 2. Shadow pag

method for handling deadlock in hindi

आज हम  computer course in hindi  मे हम   method for handling deadlock in hindi  के बारे में जानकारी देते क्या होती है तो चलिए शुरु करते हैं- method for handling deadlock in hindi:- deadlock  को बचाने या हटाने के लिये हमें protocol  का प्रयोग करना पड़ सकता है और जब हम यह fixed कर लें कि सिस्टम को deadlock की state में नहीं जायेगा । हम सिस्टम को deadlock की state में पहचान करने एवं recover करने के लिए जाने दे सकते है । हम सारी परेशनियों को एक साथ हटा सकते हैं , और सिस्टम में फिर दुबारा से deadlock मौजूद नहीं होगा । यह solution कई ऑपरेटिंग सिस्टम एवं UNIX के द्वारा use में लिया जाता है , यह fix करने के लिये कि deadlock कभी नहीं होगा , सिस्टम को या तो  deadlock  बचाव scheme का use करना पड़ेगा या फिर deadlock को हटाने की scheme का use करना पड़ेगा । एक methods का set है जो यह fix करता है कि स्थिति में से एक को sald नहीं किया जा सकता । यह method को रोकते हैं Constraining के द्वारा resource की जरूरत पड़ती है । दूसरी तरफ , deadlock को हटाने की जरूरत पड़ती है ऑपरेटिंग सिस्टम की advanced addition