आज हम डाटा माइनिंग क्या है? (Data mining in hindi) और data mining techniques (डाटा माइनिंग) के बारे मे जानेगे क्या होता है तो चलिए शुरु करते हैं:-
What is data mining in hindi (डाटा माइनिंग क्या है?) :-
बहुत बड़े डेटाबेस में से किसी उपयोगी सूचना को ढूंढना ही डाटा माइनिंग कहलाता है । अन्य शब्दों में यह कहा जा सकता है कि किसी प्रकार की सूचना की डेटाबेस में से खोज करना ही डाटा माइनिंग है । इसके लिए सांख्यिकी , कम्प्यूटर ग्राफिक्स , आर्टिफिशल इन्टैलीजेन्स आदि तकनीकों का Use किया जाता है , जिससे चाही गई नवीन प्रकार की सूचना को तीव्र गति से डेटाबेस में से ढूंढकर user को प्रदर्शित किया जा सके ।
Introduction to data mining (डाटा माइनिंग):-
इस तकनीक में user जिस सूचना को डेटाबेस में से ढूंढना चाहता है वह सूचना डाटा माइनिंग के द्वारा ढूंढकर user को उपलब्ध कराई जाती है । इसके द्वारा किसी परिस्थिति की व्याख्या , विशलेषण , विशिष्ट परिकल्पनाओं के पुष्टिकरण के सम्बन्ध में जानकारी प्राप्त की जा सकती है । इस प्रकार की जानकारी डेटाबेस के आधार पर ही दी जाती है , परन्तु इस प्रकार की जानकारी को डेटावेयरहासिंग के अन्तर्गत मेटा डेटा या क्वैरी की माध्यम से नहीं प्राप्त किया जा सकता है ।
डेटा वेयरहाउस में बड़े - बड़े डेटाबेस में जहां पर डेटा की मात्रा अत्यधिक होती है वहां किसी विशेष प्रकार के डेटा की खोज करने के लिए डाटा माइनिंग टूल्स (data mining tools) का प्रयोग किया जाता है । वर्तमान में डाटा माइनिंग की तकनीकें अत्यधिक प्रचलन में है । इन तकनीकों का प्रयोग करके विभिन्न कम्पनियों के द्वारा डाटा माइनिंग की एप्लीकेशन्स बनाई जाती हैं जिनका प्रयोग बड़े व्यवसायियों , उद्योगपतियों अथवा विभिन्न सरकारी अथवा गैर सरकारी कम्पनीयों के द्वारा किया जाता है।
इस प्रकार की तकनीक में कई प्रकार की वैल्यूज़ जो कि डेटाबेस में संचित हैं , को ढूंढकर उन पर कुछ आवश्यक गणनाएं व प्रकियाएं करके आने वाली नई वैल्यू का पूर्वानुमान लगाया जाता है । जैसे मौसम में अगले दिन के तापमान का अनुमान , पिछले आंकड़ों के आधार पर उपभोग किए जाने वाले जल का अनुमान , आंकड़ों के आधार पर कुछ वर्षों के बाद होने वाली जनसंख्या का अनुमान आदि ।
data mining examples (डाटा माइनिंग उदाहरण):-
एक बैंकिंग कम्पनी है जो कि अपने ग्राहकों के क्रेडिट कार्ड की सुविधा दे रही है । इसके लिए वह कम्पनी उस व्यक्ति के बारे में पूर्वानुमान लगाती है कि वह व्यक्ति क्रेडिट कार्ड के योग्य है कि नहीं । इसके लिए वह कम्पनी उस व्यक्ति के बारे में विभिन्न प्रकार की जानकारियां जैसे कि व्यक्ति का नाम , उम्र , पेशा या नौकरी , नौकरी अथवा पेशे का प्रकार , मासिक आय , वर्तमान ऋण , डूबत ऋण , आदि को डेटाबेस में संचित करती है । इन लक्षणों के आधार पर कम्पनी डाटा माइनिंग तकनीक (data mining techniques) का प्रयोग कर यह तय कर पाती है कि ग्राहक को क्रेडिट कार्ड की सुविधा देनी है या नहीं।
data mining techniques (डाटा माइनिंग तकनीक):-
वर्तमान में डाटा माइनिंग के अन्तर्गत विभिन्न प्रकार की कई नवीन तकनीकों का निर्माण व विकास करने के साथ - साथ उनमें से प्रमुख तकनीकों का प्रयोग भी किया जा रहा है । डाटा माइनिंग की प्रमुख तकनीकें जैसे कि association , classification , clustering , prediction आदि इनका वर्तमान में प्रयोग किया जा रहा है ।
डाटा माइनिंग की इन तकनीकों का वर्णन :-
1. एसोसिएशन डाटा माइनिंग ( association rule mining ) :-
डाटा माइनिंग की इस तकनीक के अन्तर्गत एक ही कार्यसम्पादन ( transaction ) के विभिन्न आईटम्स के मध्य स्थापित सम्बन्ध ( relationship ) पर आधारित पैटर्न बनाया जाता है इसलिए इसे रिलेशन तकनीक ( relation Technique ) भी कहा जाता है । यह डाटा माइनिंग की जानी मानी तकनीक है । इसका प्रयोग market basket analysis करने में किया जाता है ताकि ग्राहकों ( customer ) के द्वारा निरन्तर रूप से विभिन्न वस्तुओं की होने वाली खरीदारी को उनके अनुसार पहचाना जा सके कि किन वस्तुओं को किन ग्राहकों ने खरीदा है । उदाहरण के तौर पर मान लेते हैं कि अधिकतम ग्राहक जो टुथब्रश खरीदते हैं वे टुथपेस्ट भी खरीदते हैं । अत : दुकानदार टुथपेस्ट के स्टॉक को टुथब्रश के स्टॉक के पास ही रखते हैं ताकि समय आने पर उन्हें ढूंढने की आवश्यकता ना पड़े तथा वे ग्राहक को कम से कम समय में अधिकतम वस्तुएं सुपुर्द करें ।
2. क्लासीफिकेशन / वर्गीकरण डाटा माइनिंग (classification in data mining in Hindi):-
डाटा माइनिंग की तकनीक है । यह तकनीक डेटा समूह में प्रत्येक item को classify करने का कार्य करती है तथा इसमें ऑब्जेक्ट्स को पूर्व निर्धारित क्लासेस को assign किया जाता है । यह तकनीक machine learning पर आधारित होती है । इस पद्धत्ति में गणित्तिय विधियों ( mathematical techniques ) जैसे कि statistics . decision trees , linear programming आदि का प्रयोग किया जाता है । इस तकनीक में एक सॉफ्वेयर बनाया जाता है जो कि यह सिखाता है कि डेटा ग्रुप में डेटा आईटम को .किस प्रकार classify किया जाता है । इस प्रकार की तकनीक के द्वारा वर्तमान की परिस्थितियों व डेटा को ध्यान में रखते हुए भविष्य में होने वाले लाभ - हानि , विक्रय , उत्पादन इत्यादि की सम्भानाओं का पता लगाने के लिए डेटा का वर्गीकरण किया जाता है । यह कार्य विशिष्ट सॉफ्टवेयर की सहायता से किया जाता है । इस तकनीक के प्रमुख दो विधियां tree induction तथा neural induction से प्रयोग की जाती हैं । इसके लाभ हैं
• इस तकनीक के द्वारा डेटा आईटम्स को वर्गीकृत किया जाता है । जिससे डेटा अलग अलग समूहों में बंट जाता है इससे डेटा का प्रबन्धन आसानी से हो पाता है ।
• इस तकनीक के द्वारा ऑब्जेक्ट्स के समूह बनाकर उन्हें सम्बन्धित क्लासेस में बांटा जाता है । जिससे डेटा को समझने में आसानी होती है ।
• इस तकनीक के अन्तर्गत पूर्वानुमान लगाने के लिए डेटा का वर्गीकरण किया जाता है , जिससे पूर्वानुमान तकनीक के द्वारा पूर्वानुमान लगाने के लिए प्रयोग किया जाता है ।
3. क्लस्टरिंग / समूह बनाना डाटा माइनिंग ( clustering in data mining in hindi ):-
डाटा माइनिंग की इस तकनीक के अन्तर्गत सर्वप्रथम डेटा के लिए क्लासेस बनाई जाती हैं तथा फिर उन क्लासेस में ऑब्जेक्स को व्यक्त किया जाता है । इस तकनकी में उन अर्थपूर्ण ( meaningful ) व उपयोगी ( useful ) objects के समूह ( cluster ) बनाए जाते हैं जिनकी विशेषताएं व स्वभाव एक जैसे हों , अर्थात् विभिन्न ऑब्जेक्ट्स को उनकी प्रकृति के अनुसार समूहों में रखा जाता है ताकि एक जैसे ऑब्जेक्ट एक ही समूह में मिल जाएं । ऑब्जेक्ट्स के समूह एक से अधिक हो सकते हैं ।
उदाहरण के तौर पर एक पुस्तकालय ( library ) में विभिन्न विषयों पर बहुत सारी किताबें होती हैं । ऐसे में यदि किसी व्यक्ति को किसी विशिष्ट विषय पर उपलब्ध किताबें देखकर उनमें से एक चुननी हो तो यह थोड़ा कठिन हो जाता है । ऐसी स्थिति से बचने के लिए पुस्तकालय में पूर्व में ही किताबों को उनके विषय के अनुसार जमाकर उनके रैक पर विषय के नाम लिख दिए जाते हैं ताकि किसी विषय की किताबें ढूढते समय समस्त किताबें एक ही जगह पर मिल जाएं व अधिक परेशानी का सामना ना करना पड़े । इस तकनीक को ही clustering कहा जाता है ।
4. प्रिडिक्शन / पूर्वानुमान डाटा माइनिंग ( Prediction in data mining in hindi ):-
जैसा कि नाम से ही ज्ञात होता है कि इस तकनीक के अन्दर भविष्य की परिस्थितियों का पूर्वानुमान लगाया जाता है । इसके अन्तर्गत किसी विशिष्ट परिस्थिति के पूर्व तथा वर्तमान डेटा के आधार पर उस परिस्थिति के भविष्य में हाने वाले परिणाम का पूर्वानुमान लगाया जाता है । यह पूर्वानुमान विभिन्न प्रकार के डेटा की गणनाएं व प्रक्रिया करने के बाद regression curve की सहायता से पूर्वानुमान लगाने का प्रयास किया जाता है । इसके अन्तर्गत स्वतंत्र वेरिएबल्स के मध्य के सम्बन्ध को तथा स्वतंत्र वेरिएबल व निर्भर / आश्रित वेरिएबल के मध्य के सम्बन्ध को ज्ञात किया जाता है । इसके द्वारा किसी व्यवसाय के भविष्य में होने वाले उत्पादन , विक्रय व लाभ - हानि आदि का भी पूर्वानुमान लगाया जा सकता है ।
उपरोक्त तकनीकें डाटा माइनिंग की तकनीकें हैं जो कि वर्तमान में प्रचलित हैं । इनके अतिरिक्त और भी कई तकनीकें हैं जिनका प्रयोग भी किया जाता है तथा ऐसी तकनीकों को और भी विकास किया जा रहा है ।
टिप्पणियाँ
एक टिप्पणी भेजें