k-निकटतम पड़ोसी (kNN) विसंगति का पता लगाने के लिए

ब्लॉग

k-निकटतम पड़ोसी (kNN) विसंगति का पता लगाने के लिए

k-निकटतम पड़ोसी

kNN एक पर्यवेक्षित ML एल्गोरिथम है जिसका उपयोग अक्सर डेटा विज्ञान में वर्गीकरण समस्याओं (कभी-कभी प्रतिगमन समस्याओं के रूप में भी) के लिए किया जाता है। यह सबसे सरल लेकिन व्यापक रूप से उपयोग किए जाने वाले एल्गोरिदम में से एक है जिसमें अच्छे उपयोग के मामले हैं जैसे कि सिफारिशकर्ता सिस्टम बनाना, चेहरे का पता लगाने वाले एप्लिकेशन इत्यादि।



निकटतम-पड़ोसी परिवार में मौलिक धारणा यह है कि समान अवलोकन एक-दूसरे के निकटता में होते हैं और आउटलेयर आमतौर पर अकेले अवलोकन होते हैं, समान अवलोकनों के समूह से दूर रहते हैं।

छात्रों के लिए जावास्क्रिप्ट प्रोजेक्ट

पोस्ट के लिए छवि



केएनएन वैचारिक आरेख (छवि: लेखक)

मैं kNN के बारे में अधिक जानकारी में नहीं जा रहा हूँ क्योंकि इस लेख का उद्देश्य एक उपयोग के मामले पर चर्चा करना है - विसंगति का पता लगाना। लेकिन अगर आप रुचि रखते हैं तो एक नज़र डालें स्पष्ट सभी प्रकार के निकटतम पड़ोसी एल्गोरिदम के लिए प्रलेखन और केएनएन कैसे काम करता है, इसका वर्णन करने वाली ऑनलाइन बहुत सारी सामग्रियां हैं। यदि आप टिप्पणी में एक नोट छोड़ते हैं तो मैं कुछ उपयोगी संसाधनों की ओर इशारा कर सकता हूं।



विसंगति का पता लगाने के लिए केएनएन

हालांकि केएनएन एक पर्यवेक्षित एमएल एल्गोरिथम है, जब विसंगति का पता लगाने की बात आती है तो यह एक अनुपयोगी दृष्टिकोण लेता है। ऐसा इसलिए है क्योंकि इस प्रक्रिया में कोई वास्तविक शिक्षा शामिल नहीं है और डेटासेट में बाहरी या गैर-बाहरी का कोई पूर्व-निर्धारित लेबलिंग नहीं है, इसके बजाय, यह पूरी तरह से थ्रेशोल्ड मानों पर आधारित है। डेटा वैज्ञानिक मनमाने ढंग से कटऑफ मान तय करते हैं जिसके आगे सभी अवलोकन विसंगतियां कहलाते हैं (जैसा कि हम बाद में देखेंगे)। यही कारण है कि डेटा का कोई ट्रेन-परीक्षण-विभाजन या सटीकता रिपोर्ट नहीं है।

आज का लेख हाथ से उदाहरण कोड के साथ विसंगति, बाहरी और धोखाधड़ी का पता लगाने वाले एल्गोरिदम पर मेरी श्रृंखला की निरंतरता है। मेरे पिछले 8 लेख विसंगति का पता लगाने के क्षेत्र में उपलब्ध विभिन्न उपकरणों और तकनीकों पर स्पर्श करते हैं, यदि आप उनके बारे में जानने के इच्छुक हैं तो निम्नलिखित लिंक हैं:

अब आगे बढ़ते हैं और पायथन प्रोग्रामिंग भाषा में kNN एल्गोरिथम का एक सरल प्रदर्शन करते हैं।

#मशीन-लर्निंग #डेटा-साइंस #डेवलपर #पायथन

ओरडाटासाइंस.कॉम

k-निकटतम पड़ोसी (kNN) विसंगति का पता लगाने के लिए

बाहरी और विसंगति का पता लगाने के लिए काटने के आकार का डेटा विज्ञान। kNN (k-Nearest Neighbours) एक पर्यवेक्षित ML एल्गोरिथम है, जब विसंगति का पता लगाने की बात आती है तो यह एक अनुपयोगी दृष्टिकोण लेता है।

pip3 git+https://github.com/rapptz/discord.py@async . स्थापित करें