ऑब्जेक्ट डिटेक्शन के लिए डीप लर्निंग मेथड: आर-सीएनएन ने समझाया

ब्लॉग

ऑब्जेक्ट डिटेक्शन के लिए डीप लर्निंग मेथड: आर-सीएनएन ने समझाया

छवियों को वर्गीकृत करने के लिए सीएनएन का व्यापक रूप से उपयोग किया गया है। लेकिन किसी छवि में किसी वस्तु का पता लगाना और उनके चारों ओर बाउंडिंग बॉक्स बनाना एक कठिन समस्या है। इस समस्या को हल करने के लिए, 2014 में R-CNN एल्गोरिथम प्रकाशित किया गया था। R-CNN के बाद, इसके कई वेरिएंट जैसे Fast-R-CNN, Faster-R-CNN और Mask-R-CNN आए, जिसने ऑब्जेक्ट डिटेक्शन के कार्य को सुधार दिया। नवीनतम आर-सीएनएन वेरिएंट को समझने के लिए, आर-सीएनएन की स्पष्ट समझ होना जरूरी है। एक बार यह समझ लेने के बाद, अन्य सभी विविधताओं को आसानी से समझा जा सकता है।



यह पोस्ट मान लेगा कि पाठक को एसवीएम, सीएनएन का उपयोग करके छवि वर्गीकरण और रैखिक प्रतिगमन के साथ परिचित है।

अवलोकन

आर-सीएनएन पेपर[1] 2014 में प्रकाशित हुआ था। यह दिखाने वाला पहला पेपर था कि सीएनएन ऑब्जेक्ट डिटेक्शन में उच्च प्रदर्शन कर सकता है। यह एल्गोरिथ्म निम्नलिखित तरीके से वस्तु का पता लगाता है:



दो divs अगल-बगल flexbox
  1. विधि इनपुट के रूप में एक छवि लेती है और छवि से लगभग 2000 क्षेत्र प्रस्तावों को निकालती है (उपरोक्त छवि में चरण 2)।
  2. सीएनएन के इनपुट के रूप में पारित करने के लिए प्रत्येक क्षेत्र के प्रस्ताव को एक निश्चित आकार में बदल दिया जाता है (फिर से आकार दिया जाता है)।
  3. सीएनएन प्रत्येक क्षेत्र के प्रस्ताव के लिए एक निश्चित लंबाई वाला फीचर वेक्टर निकालता है (उपरोक्त छवि में चरण 3)।
  4. इन सुविधाओं का उपयोग श्रेणी-विशिष्ट रैखिक एसवीएम (उपरोक्त छवि में चरण 4) का उपयोग करके क्षेत्र प्रस्तावों को वर्गीकृत करने के लिए किया जाता है।
  5. बाउंडिंग बॉक्स रिग्रेशन का उपयोग करके बाउंडिंग बॉक्स को परिष्कृत किया जाता है ताकि बॉक्स द्वारा ऑब्जेक्ट को ठीक से कैप्चर किया जा सके।

अब पोस्ट विवरण में गोता लगाएगा कि मॉडल को कैसे प्रशिक्षित किया जाता है और यह बाउंडिंग बॉक्स की भविष्यवाणी कैसे करता है।

#मशीन-लर्निंग #कृत्रिम-खुफिया #आर-सीएनएन #डीप-लर्निंग



एएसपीनेट खाता विंडोज़ 10

ओरडाटासाइंस.कॉम

ऑब्जेक्ट डिटेक्शन के लिए डीप लर्निंग मेथड: आर-सीएनएन ने समझाया

छवियों को वर्गीकृत करने के लिए सीएनएन का व्यापक रूप से उपयोग किया गया है। लेकिन किसी छवि में किसी वस्तु का पता लगाना और उनके चारों ओर बाउंडिंग बॉक्स बनाना एक कठिन समस्या है। इस समस्या को हल करने के लिए, 2014 में R-CNN एल्गोरिथम प्रकाशित किया गया था। R-CNN के बाद, इसके कई वेरिएंट जैसे Fast-R-CNN, Faster-R-CNN और Mask-R-CNN आए, जिसने ऑब्जेक्ट डिटेक्शन के कार्य को सुधार दिया। नवीनतम आर-सीएनएन वेरिएंट को समझने के लिए, आर-सीएनएन की स्पष्ट समझ होना जरूरी है। एक बार यह समझ लेने के बाद, अन्य सभी विविधताओं को आसानी से समझा जा सकता है। यह पोस्ट मान लेगा कि पाठक को एसवीएम, सीएनएन का उपयोग करके छवि वर्गीकरण और रैखिक प्रतिगमन के साथ परिचित है। आर-सीएनएन ऑब्जेक्ट डिटेक्शन एल्गोरिदम मूल पेपर से चरण दर चरण समझाया गया