Data warehousing and characteristics:-
डेटा वेयरहाउसिंग decision support technologies का एक storage है, जिसका उद्देश्य knowledge worker (executive, manager, analyst) को बेहतर और fast decision लेने में capable बनाना है। डेटा माइनिंग क्षमता को बढ़ाया जा सकता है यदि डेटा वेयरहाउस में उपयुक्त डेटा collect और store किया गया हो। डेटा वेयरहाउस एक रिलेशनल डेटाबेस मैनेजमेंट सिस्टम (RDBMS) है जिसे विशेष रूप से ट्रांजेक्शन प्रोसेसिंग सिस्टम की जरूरतों को पूरा करने के लिए डिज़ाइन किया गया है। इसे किसी भी centralized data repository के रूप में परिभाषित किया जा सकता है जिसे business profit के लिए inquiry की जा सकती है लेकिन इसे बाद में और अधिक स्पष्ट रूप से define किया जाएगा।
डेटा वेयरहाउसिंग एक नई शक्तिशाली तकनीक है जो stored operational data को निकालना और Various legacy data formats के बीच anomalies को दूर करना संभव बनाती है। स्थान, formats या communication आवश्यकताओं की परवाह किए बिना पूरे enterprise में डेटा को Integrated करने के साथ-साथ additional or specialist जानकारी को शामिल करना संभव है।
एक रिलेशनल डेटाबेस के अलावा, एक डेटा वेयरहाउस वातावरण में एक extraction, transportation, transformation और loading (ETL) solution, एक Online analytical processing (OLAP) engine, client analysis tools और अन्य application शामिल हैं जो डेटा एकत्र करने की प्रोसेस का management करते हैं और इसे business users तक पहुँचाना।
ETL टूल decision लेने के लिए डेटा को डेटा वेयरहाउस में निकालने, बदलने और लोड करने के लिए हैं। ETL टूल्स के विकास से पहले, उपर्युक्त ETL प्रोसेस प्रोग्रामर द्वारा बनाए गए एसक्यूएल कोड का उपयोग करके मैन्युअल रूप से की जाती थी। यह कार्य कई मामलों में exhausting था क्योंकि इसमें कई Resources, Complex Coding और अधिक काम के घंटे शामिल थे। इसके , कोड को बनाए रखना प्रोग्रामर्स के बीच एक बड़ी चुनौती है।
ETL टूल्स द्वारा इन कठिनाइयों को समाप्त कर दिया गया है क्योंकि वे बहुत शक्तिशाली हैं और पुरानी मेथड की तुलना में वे निष्कर्षण, डेटा सफाई, डेटा प्रोफाइलिंग, परिवर्तन, डिबगिंग और डेटा वेयरहाउस में लोड होने से शुरू होने वाले ETL प्रोसेस के सभी चरणों में कई लाभ प्रदान करते हैं।
डेटा वेयरहाउसिंग शुरू करने का एक सामान्य तरीका डेटा वेयरहाउस की विशेषताओं को reference करना है, जैसा कि William Inmon, बिल्डिंग द डेटा वेयरहाउस के लेखक और गुरु, जिन्हें Comprehensive से डेटा वेयरहाउसिंग concept का originator माना जाता है, द्वारा निर्धारित किया गया है, निम्नानुसार है :
- Subject Oriented
- Integrated
- Nonvolatile
- Time Variant
उदाहरण : अपनी कंपनी के बिक्री डेटा के बारे में अधिक जानने के लिए, आप एक वेयरहाउस बना सकते हैं जो बिक्री पर केंद्रित हो। इस वेयरहाउस का उपयोग करके, आप "पिछले साल इस आइटम के लिए हमारा सबसे अच्छा ग्राहक कौन था?" जैसे सवालों के जवाब दे सकते हैं।
डेटा वेयरहाउस को अलग-अलग स्रोतों से डेटा को एक consistent format में रखना चाहिए। उन्हें माप की इकाइयों के बीच Oppose और anomalies के जैसी समस्याओं का solution करना चाहिए। जब वे इसे हासिल कर लेते हैं, तो उन्हें एकीकृत कहा जाता है।
non-volatile का अर्थ है कि, एक बार गोदाम में प्रवेश करने के बाद, डेटा नहीं बदलना चाहिए। यह reasonable है क्योंकि गोदाम का उद्देश्य आपको analysis करने में सक्षम बनाना है कि क्या हुआ है।
टिप्पणियाँ
एक टिप्पणी भेजें