सिल्हूट विधि - इष्टतम समूहों को खोजने के लिए कोहनी विधि से बेहतर

ब्लॉग

सिल्हूट विधि - इष्टतम समूहों को खोजने के लिए कोहनी विधि से बेहतर

H**yperparameters **मॉडल कॉन्फ़िगरेशन गुण हैं जो मॉडल को परिभाषित करते हैं और मॉडल के प्रशिक्षण के दौरान स्थिर रहते हैं। हाइपरपैरामीटर को ट्यून करके मॉडल का डिज़ाइन बदला जा सकता है। K-मीन्स क्लस्टरिंग के लिए मॉडल के सर्वोत्तम कॉन्फ़िगरेशन को परिभाषित करने के लिए सेट-अप करने के लिए 3 मुख्य हाइपरपैरामीटर हैं:



  • समूहों के प्रारंभिक मूल्य
  • दूरी के उपाय
  • समूहों की संख्या

क्लस्टर के प्रारंभिक मूल्य क्लस्टरिंग मॉडल को बहुत प्रभावित करते हैं, मूल्यों को प्रारंभ करने के लिए विभिन्न एल्गोरिदम हैं। क्लस्टर सेंटर में क्लस्टर में बिंदुओं को खोजने के लिए दूरी उपायों का उपयोग किया जाता है, अलग-अलग दूरी के उपायों से अलग-अलग क्लस्टर मिलते हैं।

समूहों की संख्या ( प्रति ) K-मीन्स क्लस्टरिंग में सबसे महत्वपूर्ण हाइपरपैरामीटर है। यदि हम पहले से ही जानते हैं कि डेटा को समूहबद्ध करने के लिए समूहों की संख्या है, तो k के मान को ट्यून करने का कोई फायदा नहीं है। उदाहरण के लिए, एमएनआईएसटी अंक वर्गीकरण डेटासेट के लिए के = 10।



यदि k के इष्टतम मान के बारे में कोई जानकारी नहीं है, तो k का इष्टतम/सर्वोत्तम मान ज्ञात करने की विभिन्न विधियाँ हैं। इस लेख में हम ऐसी दो विधियों को शामिल करेंगे:

  • कोहनी विधि
  • सिल्हूट विधि

कोहनी विधि:

कोहनी विधि डेटासेट के लिए क्लस्टर की इष्टतम संख्या खोजने के लिए एक अनुभवजन्य विधि है। इस पद्धति में, हम k के उम्मीदवार मानों की एक श्रेणी चुनते हैं, फिर k के प्रत्येक मान का उपयोग करके K-मीन्स क्लस्टरिंग लागू करते हैं। एक क्लस्टर में प्रत्येक बिंदु की उसके केन्द्रक से औसत दूरी का पता लगाएं, और इसे एक प्लॉट में निरूपित करें। k का मान चुनें, जहां औसत दूरी अचानक गिर जाती है .



#क्लस्टरिंग #मशीन-लर्निंग #शिक्षा #डेटा-विज्ञान #कृत्रिम-खुफिया

ओरडाटासाइंस.कॉम

सिल्हूट विधि - इष्टतम समूहों को खोजने के लिए कोहनी विधि से बेहतर

k-मीन्स क्लस्टरिंग में इष्टतम समूहों को खोजने के लिए सिल्हूट विधि का गहन विश्लेषण। इस लेख में हम दो ऐसी विधियों को शामिल करेंगे: कोहनी विधि; सिल्हूट विधि