Data Mining process in hindi

 Data Mining process in hindi :-

data mining की 7 प्रोसेस है:
1. Data Selection 
2. Data Cleaning 
3. Data Enrichment 
4. Data Transformation 
5. Coding 
6. Data Mining 
7. Visualisation/Interpretation/Evaluation

 
Data Mining process in hindi

1. Data Selection in hindi :-

डेटा माइनिंग के लिए डेटा का सलेक्ट करने के दो भाग हैं।  पहला भाग, डेटा का पता लगाना, डेटा की पहचान करने वाले Stem part की तुलना में प्रकृति में अधिक टेक्निकल होता है, जिसके लिए डेटा के लिए एक डोमेन एक्सपर्ट द्वारा महत्वपूर्ण इनपुट की आवश्यकता होती है।
एक डोमेन एक्सपर्ट वह होता है जो जांच किए जाने वाले डेटा के business objectives और पहलुओं, या डोमेन से अच्छी तरह परिचित होता है।

2. Data Cleaning in hindi :-

Data Cleaning यह सुनिश्चित करने की प्रोसेस है कि, data mining purposes के लिए, डेटा कुंजी और विशेषता उपयोग के मामले में एक समान है।  physical anomalies के लिए डेटा का supervision करने की प्रोसेस, जैसे कि रिकॉर्ड या आवश्यक फ़ील्ड शून्य पर सेट, और logical inconsistencies हैं ।
Data Cleaning , data enrichment और डेटा परिवर्तन से अलग है क्योंकि Data Cleaning मौजूदा डेटा में गलत को ठीक करने का प्रयास करती है। इसके विपरीत, data enrichment, मौजूदा डेटा में नई विशेषताएँ जोड़ता है, जबकि डेटा परिवर्तन data mining आवश्यकताओं को पूरा करने के लिए मौजूदा डेटा में structure को बदलता है।

3. Data Enrichment in hindi :-

data mining मौजूदा डेटा में नई विशेषताओं, जैसे बाहरी स्रोतों से डेटा को जोड़ने की प्रोसेस है।  डेटा माइनिंग पर इस स्टेप को डेटा परिवर्तन के साथ जोड़ते हैं।  डेटा परिवर्तन में डेटा का हेरफेर शामिल है, लेकिन data mining में मौजूदा डेटा में जानकारी जोड़ना शामिल है।  इसमें बाहरी डेटा के साथ आंतरिक डेटा का संयोजन शामिल हो सकता है, जो विभिन्न कंपनियों या विक्रेताओं से प्राप्त किया जाता है जो standardized industry-संबंधित डेटा बेचते हैं।
 आप डेटा माइनिंग प्रोसेस को अधिक सफल और विश्वसनीय बनाने के लिए standardized external industry sources से ऐसे डेटा में जानकारी जोड़ सकते हैं। 

4. Data Transformation in hindi :-

डेटा माइनिंग के संदर्भ में डेटा परिवर्तन, structure को बदलने की प्रक्रिया है। डेटा परिवर्तन data mining purposes के लिए डेटा सफाई और data enrichment से अलग है क्योंकि यह मौजूदा विशेषता डेटा को सही नहीं करता है या नई विशेषताओं को जोड़ता है, बल्कि data mining purposes के लिए मौजूदा विशेषताओं को तैयार करता है।

5. Coding:-

वह डेटा कई changes से गुजर सकता है। सबसे पहले डेटाबेस को prosperous करने के लिए खरीदी गई अतिरिक्त जानकारी को व्यक्तियों का description करने वाले रिकॉर्ड में जोड़ा जाता है।

6. Data Mining in hindi:-

KDD प्रोसेस का खोज चरण आकर्षक है।  यहां हम कुछ सबसे महत्वपूर्ण मशीन-लर्निंग और पैटर्न रिकग्निशन एल्गोरिदम होते हैं , और इस तरह से उपलब्ध अवसरों के साथ-साथ खोज चरण के दौरान होने वाली कुछ समस्याओं का भी अंदाजा लगा सकते हैं। कि कुछ लर्निंग एल्गोरिदम सेट के एक हिस्से पर अच्छा प्रदर्शन करते हैं जहां अन्य विफल हो जाते हैं, और यह स्पष्ट रूप से हाइब्रिड लर्निंग की आवश्यकता करता है।  कि डेटा माइनिंग step के दौरान एक संबंध का पता चला है।
  • Query tools 
  • Statistical techniques 
  • Visualization 
  • Online analytical processing 
  • Case based learning ( k - nearest neighbor )
  •  Decision trees 
  • Association rules 
  • Neural networks 
  • Genetic algorithms

7.Visualisation/Interpretation/Evaluation:-

विज़ुअलाइज़ेशन तकनीक डेटासेट में पैटर्न की खोज करने का एक बहुत ही उपयोगी तरीका है, और डेटा माइनिंग प्रोसेस की शुरुआत में डेटा सेट की गुणवत्ता और जहां पैटर्न पाए जाने हैं, का एक मोटा अनुभव प्राप्त करने के लिए उपयोग किया जा सकता है। ऑब्जेक्ट ओरिएंटेड थ्री डायमेंशनल टूल किट द्वारा दिलचस्प संभावनाएं पेश की जाती हैं, जैसे कि आविष्कारक, जो उपयोगकर्ता को अंतःक्रियात्मक रूप से तीन संरचनाओं का पता लगाने में सक्षम बनाता है। ग्राफिकल तकनीक लोगों को artificial data रिक्त स्थान के माध्यम से wander में सक्षम बनाती है, डेटा सेट के historical development को एक प्रकार की एनिमेटेड फिल्म के रूप में प्रदर्शित किया जा सकता है। ये सरल तरीके हमें जानकारी प्रदान कर सकते हैं। एक प्राथमिक तकनीक जो महान मूल्य की हो सकती है।

टिप्पणियाँ