सीधे मुख्य सामग्री पर जाएं

Data mining in hindi | डाटा माइनिंग क्या है?

 आज हम डाटा माइनिंग क्या है? (Data mining in hindi) और data mining techniques (डाटा माइनिंग) के बारे मे जानेगे क्या होता है तो चलिए शुरु करते हैं:-

What is data mining in hindi (डाटा माइनिंग क्या है?) :-

बहुत बड़े डेटाबेस में से किसी उपयोगी सूचना को ढूंढना ही डाटा माइनिंग कहलाता है । अन्य शब्दों में यह कहा जा सकता है कि किसी प्रकार की सूचना की डेटाबेस में से खोज करना ही डाटा माइनिंग है । इसके लिए सांख्यिकी , कम्प्यूटर ग्राफिक्स , आर्टिफिशल इन्टैलीजेन्स आदि तकनीकों का Use किया जाता है , जिससे चाही गई नवीन प्रकार की सूचना को तीव्र गति से डेटाबेस में से ढूंढकर user को प्रदर्शित किया जा सके । 

Introduction to data mining (डाटा माइनिंग):-

इस तकनीक में user जिस सूचना को डेटाबेस में से ढूंढना चाहता है वह सूचना डाटा माइनिंग के द्वारा ढूंढकर user को उपलब्ध कराई जाती है । इसके द्वारा किसी परिस्थिति की व्याख्या , विशलेषण , विशिष्ट परिकल्पनाओं के पुष्टिकरण के सम्बन्ध में जानकारी प्राप्त की जा सकती है । इस प्रकार की जानकारी डेटाबेस के आधार पर ही दी जाती है , परन्तु इस प्रकार की जानकारी को डेटावेयरहासिंग के अन्तर्गत मेटा डेटा या क्वैरी की माध्यम से नहीं प्राप्त किया जा सकता है ।
डेटा वेयरहाउस में बड़े - बड़े डेटाबेस में जहां पर डेटा की मात्रा अत्यधिक होती है वहां किसी विशेष प्रकार के डेटा की खोज करने के लिए डाटा माइनिंग टूल्स (data mining tools) का प्रयोग किया जाता है । वर्तमान में डाटा माइनिंग की तकनीकें अत्यधिक प्रचलन में है । इन तकनीकों का प्रयोग करके विभिन्न कम्पनियों के द्वारा डाटा माइनिंग की एप्लीकेशन्स बनाई जाती हैं जिनका प्रयोग बड़े व्यवसायियों , उद्योगपतियों अथवा विभिन्न सरकारी अथवा गैर सरकारी कम्पनीयों के द्वारा किया जाता है।
इस प्रकार की तकनीक में कई प्रकार की वैल्यूज़ जो कि डेटाबेस में संचित हैं , को ढूंढकर उन पर कुछ आवश्यक गणनाएं व प्रकियाएं करके आने वाली नई वैल्यू का पूर्वानुमान लगाया जाता है । जैसे मौसम में अगले दिन के तापमान का अनुमान , पिछले आंकड़ों के आधार पर उपभोग किए जाने वाले जल का अनुमान , आंकड़ों के आधार पर कुछ वर्षों के बाद होने वाली जनसंख्या का अनुमान आदि ।

data mining examples  (डाटा माइनिंग उदाहरण):-

एक बैंकिंग कम्पनी है जो कि अपने ग्राहकों के क्रेडिट कार्ड की सुविधा दे रही है । इसके लिए वह कम्पनी उस व्यक्ति के बारे में पूर्वानुमान लगाती है कि वह व्यक्ति क्रेडिट कार्ड के योग्य है कि नहीं । इसके लिए वह कम्पनी उस व्यक्ति के बारे में विभिन्न प्रकार की जानकारियां जैसे कि व्यक्ति का नाम , उम्र , पेशा या नौकरी , नौकरी अथवा पेशे का प्रकार , मासिक आय , वर्तमान ऋण , डूबत ऋण , आदि को डेटाबेस में संचित करती है । इन लक्षणों के आधार पर कम्पनी डाटा माइनिंग तकनीक (data mining techniques) का प्रयोग कर यह तय कर पाती है कि ग्राहक को क्रेडिट कार्ड की सुविधा देनी है या नहीं।

data mining techniques (डाटा माइनिंग तकनीक):-

वर्तमान में डाटा माइनिंग के अन्तर्गत विभिन्न प्रकार की कई नवीन तकनीकों का निर्माण व विकास करने के साथ - साथ उनमें से प्रमुख तकनीकों का प्रयोग भी किया जा रहा है । डाटा माइनिंग  की प्रमुख तकनीकें जैसे कि association , classification , clustering , prediction आदि इनका वर्तमान में प्रयोग किया जा रहा है । 
Data mining


डाटा माइनिंग की इन तकनीकों का वर्णन :-

1. एसोसिएशन डाटा माइनिंग ( association rule mining ) :-

डाटा माइनिंग  की इस तकनीक के अन्तर्गत एक ही कार्यसम्पादन ( transaction ) के विभिन्न आईटम्स के मध्य स्थापित सम्बन्ध ( relationship ) पर आधारित पैटर्न बनाया जाता है इसलिए इसे रिलेशन तकनीक ( relation Technique ) भी कहा जाता है । यह डाटा माइनिंग की जानी मानी तकनीक है । इसका प्रयोग market basket analysis करने में किया जाता है ताकि ग्राहकों ( customer ) के द्वारा निरन्तर रूप से विभिन्न वस्तुओं की होने वाली खरीदारी को उनके अनुसार पहचाना जा सके कि किन वस्तुओं को किन ग्राहकों ने खरीदा है । उदाहरण के तौर पर मान लेते हैं कि अधिकतम ग्राहक जो टुथब्रश खरीदते हैं वे टुथपेस्ट भी खरीदते हैं । अत : दुकानदार टुथपेस्ट के स्टॉक को टुथब्रश के स्टॉक के पास ही रखते हैं ताकि समय आने पर उन्हें ढूंढने की आवश्यकता ना पड़े तथा वे ग्राहक को कम से कम समय में अधिकतम वस्तुएं सुपुर्द करें । 

2. क्लासीफिकेशन / वर्गीकरण डाटा माइनिंग  (classification in data mining in Hindi):-

डाटा माइनिंग की तकनीक है । यह तकनीक डेटा समूह में प्रत्येक item को classify करने का कार्य करती है तथा इसमें ऑब्जेक्ट्स को पूर्व निर्धारित क्लासेस को assign किया जाता है । यह तकनीक machine learning पर आधारित होती है । इस पद्धत्ति में गणित्तिय विधियों ( mathematical techniques ) जैसे कि statistics . decision trees , linear programming आदि का प्रयोग किया जाता है । इस तकनीक में एक सॉफ्वेयर बनाया जाता है जो कि यह सिखाता है कि डेटा ग्रुप में डेटा आईटम को .किस प्रकार classify किया जाता है । इस प्रकार की तकनीक के द्वारा वर्तमान की परिस्थितियों व डेटा को ध्यान में रखते हुए भविष्य में होने वाले लाभ - हानि , विक्रय , उत्पादन इत्यादि की सम्भानाओं का पता लगाने के लिए डेटा का वर्गीकरण किया जाता है । यह कार्य विशिष्ट सॉफ्टवेयर की सहायता से किया जाता है । इस तकनीक के प्रमुख दो विधियां tree induction तथा neural induction से प्रयोग की जाती हैं । इसके लाभ हैं 
• इस तकनीक के द्वारा डेटा आईटम्स को वर्गीकृत किया जाता है । जिससे डेटा अलग अलग समूहों में बंट जाता है इससे डेटा का प्रबन्धन आसानी से हो पाता है । 
• इस तकनीक के द्वारा ऑब्जेक्ट्स के समूह बनाकर उन्हें सम्बन्धित क्लासेस में बांटा जाता है । जिससे डेटा को समझने में आसानी होती है । 
• इस तकनीक के अन्तर्गत पूर्वानुमान लगाने के लिए डेटा का वर्गीकरण किया जाता है , जिससे पूर्वानुमान तकनीक के द्वारा पूर्वानुमान लगाने के लिए प्रयोग किया जाता है । 

3. क्लस्टरिंग / समूह बनाना डाटा माइनिंग ( clustering in data mining in hindi ):-

डाटा माइनिंग की इस तकनीक के अन्तर्गत सर्वप्रथम डेटा के लिए क्लासेस बनाई जाती हैं तथा फिर उन क्लासेस में ऑब्जेक्स को व्यक्त किया जाता है । इस तकनकी में उन अर्थपूर्ण ( meaningful ) व उपयोगी ( useful ) objects के समूह ( cluster ) बनाए जाते हैं जिनकी विशेषताएं व स्वभाव एक जैसे हों , अर्थात् विभिन्न ऑब्जेक्ट्स को उनकी प्रकृति के अनुसार समूहों में रखा जाता है ताकि एक जैसे ऑब्जेक्ट एक ही समूह में मिल जाएं । ऑब्जेक्ट्स के समूह एक से अधिक हो सकते हैं । 
उदाहरण के तौर पर एक पुस्तकालय ( library ) में विभिन्न विषयों पर बहुत सारी किताबें होती हैं । ऐसे में यदि किसी व्यक्ति को किसी विशिष्ट विषय पर उपलब्ध किताबें देखकर उनमें से एक चुननी हो तो यह थोड़ा कठिन हो जाता है । ऐसी स्थिति से बचने के लिए पुस्तकालय में पूर्व में ही किताबों को उनके विषय के अनुसार जमाकर उनके रैक पर विषय के नाम लिख दिए जाते हैं ताकि किसी विषय की किताबें ढूढते समय समस्त किताबें एक ही जगह पर मिल जाएं व अधिक परेशानी का सामना ना करना पड़े । इस तकनीक को ही clustering कहा जाता है । 

4. प्रिडिक्शन / पूर्वानुमान डाटा माइनिंग ( Prediction in data mining in hindi ):-

जैसा कि नाम से ही ज्ञात होता है कि इस तकनीक के अन्दर भविष्य की परिस्थितियों का पूर्वानुमान लगाया जाता है । इसके अन्तर्गत किसी विशिष्ट परिस्थिति के पूर्व तथा वर्तमान डेटा के आधार पर उस परिस्थिति के भविष्य में हाने वाले परिणाम का पूर्वानुमान लगाया जाता है । यह पूर्वानुमान विभिन्न प्रकार के डेटा की गणनाएं व प्रक्रिया करने के बाद regression curve की सहायता से पूर्वानुमान लगाने का प्रयास किया जाता है । इसके अन्तर्गत स्वतंत्र वेरिएबल्स के मध्य के सम्बन्ध को तथा स्वतंत्र वेरिएबल व निर्भर / आश्रित वेरिएबल के मध्य के सम्बन्ध को ज्ञात किया जाता है । इसके द्वारा किसी व्यवसाय के भविष्य में होने वाले उत्पादन , विक्रय व लाभ - हानि आदि का भी पूर्वानुमान लगाया जा सकता है । 
उपरोक्त तकनीकें डाटा माइनिंग की तकनीकें हैं जो कि वर्तमान में प्रचलित हैं । इनके अतिरिक्त और भी कई तकनीकें हैं जिनका प्रयोग भी किया जाता है तथा ऐसी तकनीकों को और भी विकास किया जा रहा है ।

टिप्पणियाँ

इस ब्लॉग से लोकप्रिय पोस्ट

Query Optimization in hindi - computers in hindi 

 आज  हम  computers  in hindi  मे query optimization in dbms ( क्वैरी ऑप्टीमाइजेशन) के बारे में जानेगे क्या होता है और क्वैरी ऑप्टीमाइजेशन (query optimization in dbms) मे query processing in dbms और query optimization in dbms in hindi और  Measures of Query Cost    के बारे मे जानेगे  तो चलिए शुरु करते हैं-  Query Optimization in dbms (क्वैरी ऑप्टीमाइजेशन):- Optimization से मतलब है क्वैरी की cost को न्यूनतम करने से है । किसी क्वैरी की cost कई factors पर निर्भर करती है । query optimization के लिए optimizer का प्रयोग किया जाता है । क्वैरी ऑप्टीमाइज़र को क्वैरी के प्रत्येक operation की cos जानना जरूरी होता है । क्वैरी की cost को ज्ञात करना कठिन है । क्वैरी की cost कई parameters जैसे कि ऑपरेशन के लिए उपलब्ध memory , disk size आदि पर निर्भर करती है । query optimization के अन्दर क्वैरी की cost का मूल्यांकन ( evaluate ) करने का वह प्रभावी तरीका चुना जाता है जिसकी cost सबसे कम हो । अतः query optimization एक ऐसी प्रक्रिया है , जिसमें क्वैरी अर्थात् प्रश्न को हल करने का सबसे उपयुक्त तरीका चुना

acid properties in dbms - computers in hindi

 आज हम computers in hindi के अन्दर Properties of Transaction (acid properties in dbms) के बारे मे जानेगे क्या होता है तो चलिए शुरु करते हैं:- Properties of Transaction ( कार्यसम्पादन के गुण ) (ACID in hindi) :- Atomicity , Consistency , Isolation , Durability - ACID सामान्यत : किसी transaction की 4 प्रॉपर्टीज़ होती हैं-  1. Atomicity  2. Consistency  3. Isolation  4. Durability  1. Atomicity transaction :-   Atomicity transaction की प्रॉपर्टी के द्वारा यह comfirm किया जाता है की transaction   के द्वारा किए जाने वाले सभी ऑपरेशन पूर्ण होंगे या उनमें से एक भी execute नहीं होगा । इसमें transaction के प्रत्येक ऑपरेशन को एक अकेली यूनिट की भांति व्यवहार किया जाता है । आइए इसे एक example की सहायता से समझते हैं। acid properties with example :-  यदि प्रथम ऑपरेशन सफल पूर्ण हो जाए तथा द्वितीय ऑपरेशन पर आते ही transaction असफल अर्थात् फेल हो जाए तो ऐसी स्थिति में प्रथम ऑपरेशन भी rollback हो जाएगा । Atomicity को transaction manager के द्वारा नियंत्रित किया जाता है । transaction manager डेटाबेस