घर मशरूम "एक कठिन डेटा वैज्ञानिक एक मध्यम आकार की कंपनी के सीईओ की तरह हो जाता है।" मशीन लर्निंग विशेषज्ञ Yandex.Taxi - डेटा कैसे भविष्य की भविष्यवाणी करता है और दुनिया को आकार देता है। एआई एबीसी: मशीन लर्निंग ऐसी सूक्ष्मताएं भी

मशरूम

"एक कठिन डेटा वैज्ञानिक एक मध्यम आकार की कंपनी के सीईओ की तरह हो जाता है।" मशीन लर्निंग विशेषज्ञ Yandex.Taxi - डेटा कैसे भविष्य की भविष्यवाणी करता है और दुनिया को आकार देता है। एआई एबीसी: मशीन लर्निंग ऐसी सूक्ष्मताएं भी

एमआईपीटी के साथ संयुक्त रूप से एबीसी एआई परियोजना के ढांचे के भीतर, हमने पहले से ही तथाकथित लोगों के बारे में लिखा है जो आपको डार्विनियन विकास के सिद्धांतों और कानूनों के अनुसार कार्यक्रमों को "बढ़ने" की अनुमति देते हैं। हालांकि, कृत्रिम बुद्धि के लिए यह दृष्टिकोण, निश्चित रूप से, "भविष्य से एक अतिथि" है। लेकिन आज आर्टिफिशियल इंटेलिजेंस सिस्टम कैसे बनाए जाते हैं? उन्हें कैसे प्रशिक्षित किया जाता है? मास्को इंस्टीट्यूट ऑफ फिजिक्स एंड टेक्नोलॉजी में एल्गोरिदम और प्रोग्रामिंग टेक्नोलॉजीज विभाग के वरिष्ठ व्याख्याता विक्टर कांतोर, यांडेक्स डेटा फैक्ट्री में उपयोगकर्ता व्यवहार का विश्लेषण करने के लिए समूह के प्रमुख ने हमें यह पता लगाने में मदद की।

शोध फर्म गार्टनर की एक हालिया रिपोर्ट के अनुसार, जो नियमित रूप से अपने "प्रौद्योगिकी परिपक्वता चक्र" को अपडेट करती है, मशीन लर्निंग आज सभी आईटी अपेक्षाओं में सबसे ऊपर है। यह आश्चर्य की बात नहीं है: पिछले कुछ वर्षों में, मशीन लर्निंग एल्गोरिदम के सिद्धांत में गणितज्ञों और विशेषज्ञों के एक संकीर्ण दायरे से बाहर निकल गया है और पहले आईटी व्यवसायियों की शब्दावली में प्रवेश किया है, और फिर दुनिया में आम लोग। अब जबकि उनके विशेष "जादू" के साथ तंत्रिका नेटवर्क जैसी कोई चीज है, जो कोई भी प्रिज्मा एप्लिकेशन का उपयोग करता है, शाज़म का उपयोग करके गाने की खोज करता है या डीपड्रीम के माध्यम से पारित छवियों को देखता है, जानता है।

हालाँकि, तकनीक का उपयोग करना एक बात है, और यह समझना दूसरी बात है कि यह कैसे काम करता है। "एक कंप्यूटर सीख सकता है यदि आप इसे एक संकेत देते हैं" या "एक तंत्रिका नेटवर्क में डिजिटल न्यूरॉन्स होते हैं और मानव मस्तिष्क की तरह व्यवस्थित होते हैं" जैसे सामान्य शब्द किसी की मदद कर सकते हैं, लेकिन अधिक बार वे केवल स्थिति को भ्रमित करते हैं। जो लोग गणित में गंभीरता से शामिल होने जा रहे हैं, उन्हें लोकप्रिय ग्रंथों की आवश्यकता नहीं है: उनके लिए पाठ्यपुस्तकें और उत्कृष्ट ऑनलाइन पाठ्यक्रम हैं। हम बीच के रास्ते पर जाने की कोशिश करेंगे: समझाएं कि सबसे सरल कार्य पर सीखना वास्तव में कैसे होता है, और फिर दिखाएं कि वास्तविक दिलचस्प समस्याओं को हल करने के लिए उसी दृष्टिकोण को कैसे लागू किया जा सकता है।

मशीनें कैसे सीखती हैं

सबसे पहले, यह समझने के लिए कि मशीन लर्निंग वास्तव में कैसे होता है, आइए अवधारणाओं को परिभाषित करें। इस क्षेत्र के अग्रदूतों में से एक, आर्थर सैमुअल, मशीन लर्निंग को उन तरीकों के रूप में परिभाषित करता है जो "कंप्यूटर को सीधे प्रोग्रामिंग के बिना सीखने की अनुमति देते हैं।" मशीन लर्निंग विधियों के दो व्यापक वर्ग हैं: पर्यवेक्षित शिक्षण और अनुपयोगी शिक्षण। पहले का उपयोग तब किया जाता है, उदाहरण के लिए, हमें बिल्लियों की तस्वीरों को खोजने के लिए कंप्यूटर सिखाने की आवश्यकता होती है, दूसरा तब होता है जब हमें मशीन की आवश्यकता होती है, उदाहरण के लिए, स्वतंत्र रूप से समाचारों को भूखंडों में समूहित करने में सक्षम होने के लिए, जैसा कि सेवाओं में होता है। Yandex.News या Google News। यानी, पहले मामले में, हम एक ऐसी समस्या से निपट रहे हैं जो एक सही उत्तर के अस्तित्व का तात्पर्य है (बिल्ली या तो फोटो में है या नहीं), दूसरे में, कोई भी सही उत्तर नहीं है, लेकिन अलग-अलग तरीके हैं समस्या के समाधान की। हम सबसे दिलचस्प के रूप में पहली श्रेणी की समस्याओं पर ध्यान केंद्रित करेंगे।

इसलिए हमें कुछ भविष्यवाणियां करने के लिए कंप्यूटर को सिखाने की जरूरत है। इसके अलावा, यथासंभव सटीक होना वांछनीय है। भविष्यवाणियां दो प्रकार की हो सकती हैं: या तो आपको कई उत्तर विकल्पों के बीच चयन करने की आवश्यकता है (चाहे तस्वीर में एक बिल्ली है या नहीं - यह दो में से एक विकल्प का विकल्प है, छवियों में अक्षरों को पहचानने की क्षमता एक विकल्प है कई दर्जन में से एक विकल्प, और इसी तरह), या एक संख्यात्मक भविष्यवाणी करें ... उदाहरण के लिए, किसी व्यक्ति की ऊंचाई, उम्र, जूते के आकार आदि के आधार पर उसके वजन का अनुमान लगाएं। ये दो प्रकार की समस्याएं केवल भिन्न दिखती हैं, वास्तव में, वे लगभग समान रूप से हल हो जाती हैं। आइए जानने की कोशिश करते हैं कि वास्तव में कैसे।

भविष्यवाणी प्रणाली बनाने के लिए सबसे पहले हमें तथाकथित प्रशिक्षण नमूना, यानी जनसंख्या में लोगों के वजन पर डेटा एकत्र करना है। दूसरा, संकेतों के एक सेट पर निर्णय लेना है, जिसके आधार पर हम वजन के बारे में निष्कर्ष निकाल सकते हैं। यह स्पष्ट है कि "सबसे मजबूत" ऐसे संकेतों में से एक व्यक्ति की ऊंचाई होगी, इसलिए, पहले सन्निकटन के रूप में, यह केवल उसे लेने के लिए पर्याप्त है। यदि वजन रैखिक रूप से ऊंचाई पर निर्भर करता है, तो हमारी भविष्यवाणी बहुत सरल होगी: किसी व्यक्ति का वजन उसकी ऊंचाई के बराबर होगा, कुछ गुणांक से गुणा किया जाएगा, साथ ही कुछ स्थिर मूल्य, जो कि सबसे सरल सूत्र y = kx + b द्वारा लिखा गया है। किसी व्यक्ति के वजन का अनुमान लगाने के लिए मशीन को प्रशिक्षित करने के लिए हमें बस इतना करना है कि किसी तरह k और b के लिए सही मान ज्ञात करें।

मशीन लर्निंग की खूबी यह है कि भले ही हम जिस लत का अध्ययन कर रहे हैं वह बहुत जटिल है, हमारे दृष्टिकोण में, संक्षेप में, लगभग कुछ भी नहीं बदलेगा। हम अभी भी उसी प्रतिगमन से निपटेंगे।

मान लीजिए कि किसी व्यक्ति का वजन उसकी ऊंचाई से रैखिक रूप से प्रभावित नहीं होता है, लेकिन तीसरी डिग्री में (जो आम तौर पर बोल रहा है, अपेक्षित है, क्योंकि वजन शरीर की मात्रा पर निर्भर करता है)। इस निर्भरता को ध्यान में रखते हुए, हम बस अपने समीकरण में एक और शब्द पेश करते हैं, अर्थात् विकास की तीसरी डिग्री अपने गुणांक के साथ, इस प्रकार y = k 1 x + k 2 x 3 + b प्राप्त करना। अब, मशीन को प्रशिक्षित करने के लिए, हमें दो नहीं, बल्कि तीन मात्राएँ (k 1, k 2 और b) खोजने की आवश्यकता है। मान लीजिए कि हम अपनी भविष्यवाणी में किसी व्यक्ति के जूते के आकार, उसकी उम्र, टीवी देखने में बिताए गए समय और उसके अपार्टमेंट से निकटतम फास्ट फूड पॉइंट तक की दूरी को भी ध्यान में रखना चाहते हैं। कोई बात नहीं: हम इन विशेषताओं को एक ही समीकरण में अलग-अलग शब्दों के रूप में रखते हैं।

सबसे महत्वपूर्ण बात यह है कि आवश्यक गुणांक (k 1, k 2,… k n) खोजने के लिए एक सार्वभौमिक तरीका बनाना है। यदि कोई है, तो यह हमारे लिए लगभग उदासीन होगा कि भविष्यवाणी के लिए कौन से संकेतों का उपयोग करना है, क्योंकि मशीन स्वयं महत्वपूर्ण और छोटे से महत्वहीन संकेतों को बहुत अधिक वजन देना सीख जाएगी। सौभाग्य से, इस तरह की एक विधि का आविष्कार पहले ही किया जा चुका है और लगभग सभी मशीन लर्निंग इस पर सफलतापूर्वक काम करती है: सबसे सरल रैखिक मॉडल से लेकर फेस रिकग्निशन सिस्टम और स्पीच एनालाइजर तक। इस विधि को ग्रेडिएंट डिसेंट कहा जाता है। लेकिन यह कैसे काम करता है, यह समझाने से पहले, आपको एक छोटा विषयांतर करने और तंत्रिका नेटवर्क के बारे में बात करने की आवश्यकता है।

तंत्रिका जाल

2016 में, तंत्रिका नेटवर्क ने सूचना के एजेंडे में इतनी मजबूती से प्रवेश किया कि वे लगभग किसी भी मशीन लर्निंग और सामान्य रूप से उन्नत आईटी के साथ पहचाने जाने लगे। औपचारिक रूप से, यह सच नहीं है: तंत्रिका नेटवर्क हमेशा गणितीय सीखने में उपयोग नहीं किए जाते हैं, अन्य प्रौद्योगिकियां भी हैं। लेकिन सामान्य तौर पर, निश्चित रूप से, इस तरह के जुड़ाव को समझा जा सकता है, क्योंकि यह तंत्रिका नेटवर्क पर आधारित सिस्टम है जो अब सबसे अधिक "जादुई" परिणाम देता है, जैसे कि तस्वीर द्वारा किसी व्यक्ति को खोजने की क्षमता, अनुप्रयोगों की उपस्थिति जो स्थानांतरित करती है एक छवि से दूसरी छवि की शैली, या किसी निश्चित व्यक्ति के भाषण के तरीके में ग्रंथों को उत्पन्न करने के लिए सिस्टम।

हमारे पास पहले से ही है कि तंत्रिका नेटवर्क कैसे काम करते हैं। यहां मैं केवल इस बात पर जोर देना चाहता हूं कि अन्य मशीन लर्निंग सिस्टम की तुलना में तंत्रिका नेटवर्क की ताकत उनकी बहुपरत प्रकृति में निहित है, लेकिन यह उनके काम करने के तरीके में मौलिक रूप से कुछ अलग नहीं करता है। लेयरिंग वास्तव में आपको एक तस्वीर में पिक्सल की तरह जटिल सुविधाओं के जटिल सेट में बहुत ही सामान्य सामान्य सुविधाओं और निर्भरताओं को खोजने की अनुमति देता है। लेकिन यह समझना महत्वपूर्ण है कि प्रशिक्षण के सिद्धांतों के दृष्टिकोण से, एक तंत्रिका नेटवर्क सामान्य रैखिक प्रतिगमन सूत्रों के एक सेट से मौलिक रूप से भिन्न नहीं होता है, इसलिए वही ग्रेडिएंट डिसेंट विधि यहां भी बहुत अच्छा काम करती है।

तंत्रिका नेटवर्क की "ताकत" न्यूरॉन्स की एक मध्यवर्ती परत की उपस्थिति में निहित है, जो इनपुट परत के मूल्यों को सारांशित करती है। इस वजह से, तंत्रिका नेटवर्क डेटा की बहुत ही सारगर्भित विशेषताओं को ढूंढ सकते हैं जिन्हें सरल सूत्रों जैसे रैखिक या द्विघात निर्भरता को कम करना मुश्किल है।

आइए एक उदाहरण के साथ समझाते हैं। हम एक भविष्यवाणी पर रुक गए जिसमें एक व्यक्ति का वजन घन में उसकी ऊंचाई और ऊंचाई पर निर्भर करता है, जिसे सूत्र y = k 1 x + k 2 x 3 + b द्वारा व्यक्त किया जाता है। कुछ खिंचाव के साथ, लेकिन वास्तव में, ऐसे सूत्र को भी तंत्रिका नेटवर्क कहा जा सकता है। इसमें, एक पारंपरिक तंत्रिका नेटवर्क की तरह, "न्यूरॉन्स" की पहली परत होती है, यह सुविधाओं की एक परत भी होती है: ये x और x 3 (अच्छी तरह से, और "एकल न्यूरॉन" हैं जिन्हें हम ध्यान में रखते हैं और इसके लिए जो गुणांक b जिम्मेदार है)। ऊपरी, या परिणामी, परत को एक "न्यूरॉन" y द्वारा दर्शाया जाता है, अर्थात, किसी व्यक्ति का अनुमानित वजन। और "न्यूरॉन्स" की पहली और आखिरी परत के बीच कनेक्शन होते हैं, जिनकी ताकत या वजन गुणांक k 1, k 2 और b द्वारा निर्धारित किया जाता है। इस "तंत्रिका नेटवर्क" को प्रशिक्षित करने का अर्थ है इन समान गुणांकों को खोजना।

"वास्तविक" तंत्रिका नेटवर्क से एकमात्र अंतर यह है कि हमारे पास न्यूरॉन्स की एक भी मध्यवर्ती (या छिपी हुई) परत नहीं है जिसका कार्य इनपुट सुविधाओं को संयोजित करना है। इस तरह की परतों की शुरूआत से मौजूदा सुविधाओं के बीच संभावित निर्भरता के बारे में नहीं सोचना संभव हो जाता है, बल्कि तंत्रिका नेटवर्क में उनके पहले से मौजूद संयोजनों पर भरोसा करना संभव हो जाता है। उदाहरण के लिए, टीवी के सामने उम्र और औसत समय का किसी व्यक्ति के वजन पर सहक्रियात्मक प्रभाव हो सकता है, लेकिन एक तंत्रिका नेटवर्क होने के कारण, हमें यह पहले से जानने और उनके उत्पाद को सूत्र में दर्ज करने की आवश्यकता नहीं है। एक तंत्रिका नेटवर्क में, निश्चित रूप से एक न्यूरॉन होगा जो कि किसी भी दो विशेषताओं के प्रभाव को जोड़ता है, और यदि यह प्रभाव वास्तव में नमूने में ध्यान देने योग्य है, तो प्रशिक्षण के बाद यह न्यूरॉन स्वचालित रूप से बहुत अधिक वजन प्राप्त करेगा।

ढतला हुआ वंश

इसलिए, हमारे पास ज्ञात डेटा के साथ उदाहरणों का एक प्रशिक्षण सेट है, जो कि सटीक रूप से मापे गए व्यक्ति के वजन के साथ एक तालिका है, और निर्भरता की कुछ परिकल्पना है, इस मामले में एक रैखिक प्रतिगमन y = kx + b। हमारा कार्य k और b के लिए सही मान खोजना है, और मैन्युअल रूप से नहीं, बल्कि स्वचालित रूप से। और अधिमानतः, एक सार्वभौमिक विधि द्वारा जो सूत्र में शामिल मापदंडों की संख्या पर निर्भर नहीं करता है।

सामान्य तौर पर, ऐसा करना मुश्किल नहीं है। मुख्य विचार एक निश्चित फ़ंक्शन बनाना है जो वर्तमान कुल त्रुटि दर को मापेगा और गुणांक को "ट्वीक" करेगा ताकि कुल त्रुटि स्तर धीरे-धीरे गिर जाए। त्रुटि स्तर को कैसे कम करें? हमें अपने मापदंडों को सही दिशा में मोड़ने की जरूरत है।

हमारे दो मापदंडों की कल्पना करें जिन्हें हम ढूंढ रहे हैं, वही k और b, जो समतल पर दो दिशाओं के रूप में, उत्तर-दक्षिण और पश्चिम-पूर्व अक्ष के रूप में हैं। इस तरह के एक विमान पर प्रत्येक बिंदु गुणांक के एक निश्चित मूल्य, ऊंचाई और वजन के बीच एक निश्चित विशिष्ट संबंध के अनुरूप होगा। और समतल पर ऐसे प्रत्येक बिंदु के लिए, हम त्रुटियों के कुल स्तर की गणना कर सकते हैं जो यह भविष्यवाणी हमारे नमूने में प्रत्येक उदाहरण के लिए देती है।

यह विमान पर एक विशिष्ट ऊंचाई जैसा कुछ निकलता है, और आसपास का पूरा स्थान एक पहाड़ी परिदृश्य जैसा दिखने लगता है। पहाड़ ऐसे बिंदु हैं जहाँ त्रुटि दर बहुत अधिक है, घाटियाँ वे स्थान हैं जहाँ कम त्रुटियाँ हैं। यह स्पष्ट है कि हमारे सिस्टम को प्रशिक्षित करने का अर्थ है जमीन पर निम्नतम बिंदु खोजना, वह बिंदु जहां त्रुटियों का स्तर न्यूनतम है।

आप इस बिंदु को कैसे ढूंढ सकते हैं? सबसे सही तरीका यह है कि हम उस बिंदु से हर समय नीचे की ओर बढ़ते रहें जहां से हम मूल रूप से समाप्त हुए थे। तो देर-सबेर हम स्थानीय न्यूनतम पर आ जाएंगे - एक ऐसा बिंदु जिसके नीचे आसपास के क्षेत्र में कुछ भी नहीं है। इसके अलावा, विभिन्न आकारों के कदम उठाने की सलाह दी जाती है: जब ढलान खड़ी होती है, तो आप व्यापक रूप से चल सकते हैं, जब ढलान छोटा होता है, तो स्थानीय न्यूनतम "टिपटो" तक चुपके से जाना बेहतर होता है, अन्यथा आप फिसल सकते हैं।

इस तरह से ग्रेडिएंट डिसेंट विधि काम करती है: हम एरर फंक्शन के सबसे बड़े पतन की दिशा में फीचर्स के वेट को बदलते हैं। हम उन्हें पुनरावृत्त रूप से बदलते हैं, अर्थात, एक निश्चित चरण के साथ, जिसका मूल्य ढलान की स्थिरता के समानुपाती होता है। दिलचस्प है, सुविधाओं की संख्या में वृद्धि के साथ (किसी व्यक्ति की ऊंचाई, उसकी उम्र, जूते का आकार, और इसी तरह का घन जोड़ना), वास्तव में, कुछ भी नहीं बदलता है, बस हमारा परिदृश्य द्वि-आयामी नहीं, बल्कि बहुआयामी हो जाता है।

त्रुटि फ़ंक्शन को उन सभी विचलनों के वर्गों के योग के रूप में परिभाषित किया जा सकता है जो वर्तमान सूत्र उन लोगों के संबंध में अनुमति देता है जिनका वजन हम पहले से ही निश्चित रूप से जानते हैं। आइए कुछ यादृच्छिक चर k और b लें, उदाहरण के लिए 0 और 50। तब सिस्टम भविष्यवाणी करेगा कि नमूने में प्रत्येक व्यक्ति का वजन हमेशा 50 किलोग्राम y = 0 × x + 50 होता है। ग्राफ पर, यह निर्भरता एक की तरह दिखेगी क्षैतिज के समानांतर सीधी रेखा। यह स्पष्ट है कि यह बहुत अच्छी भविष्यवाणी नहीं है। अब हम इस अनुमानित मूल्य से वजन में विचलन लेते हैं, इसे वर्ग (ताकि नकारात्मक मूल्यों को भी ध्यान में रखा जाता है) और जोड़ - यह इस बिंदु पर त्रुटि होगी। यदि आप विश्लेषण की शुरुआत से परिचित हैं, तो आप यह भी स्पष्ट कर सकते हैं कि k और b के संबंध में त्रुटि फ़ंक्शन के आंशिक व्युत्पन्न द्वारा सबसे बड़ी गिरावट की दिशा दी गई है, और चरण एक मान है जिसे चुना गया है व्यावहारिक विचार: छोटे कदमों की गणना करने में बहुत समय लगता है, और बड़े कदम इस तथ्य को जन्म दे सकते हैं कि हम न्यूनतम से आगे निकल जाते हैं।

ठीक है, क्या होगा अगर हमारे पास कई विशेषताओं के साथ एक जटिल प्रतिगमन नहीं है, बल्कि एक वास्तविक तंत्रिका नेटवर्क है? हम इस मामले में ग्रेडिएंट डिसेंट कैसे लागू करते हैं? यह पता चला है कि ग्रेडिएंट डिसेंट उसी तरह एक तंत्रिका नेटवर्क के साथ काम करता है, केवल प्रशिक्षण होता है 1) चरणों में, परत से परत तक और 2) धीरे-धीरे, नमूने में एक उदाहरण से दूसरे में। यहां उपयोग की जाने वाली विधि को त्रुटि बैकप्रोपेगेशन एल्गोरिदम कहा जाता है और 1974 में सोवियत गणितज्ञ अलेक्जेंडर गैलुश्किन और हार्वर्ड विश्वविद्यालय के गणितज्ञ पॉल जॉन वेब्रोस द्वारा स्वतंत्र रूप से वर्णित किया गया था।

यद्यपि एल्गोरिथम की एक कठोर प्रस्तुति के लिए आंशिक व्युत्पन्न (उदाहरण के लिए) लिखना आवश्यक होगा, सहज स्तर पर सब कुछ काफी सरल है: नमूने में प्रत्येक उदाहरण के लिए, हमारे पास आउटपुट पर एक निश्चित भविष्यवाणी है तंत्रिका नेटवर्क। सही उत्तर होने पर, हम भविष्यवाणी से सही उत्तर घटा सकते हैं और इस प्रकार एक त्रुटि प्राप्त कर सकते हैं (अधिक सटीक, आउटपुट परत में प्रत्येक न्यूरॉन के लिए त्रुटियों का एक सेट)। अब हमें इस त्रुटि को न्यूरॉन्स की पिछली परत में स्थानांतरित करने की आवश्यकता है, और इस परत के इस विशेष न्यूरॉन ने त्रुटि में जितना अधिक योगदान दिया है, उतना ही हमें इसके वजन को कम करने की आवश्यकता है (वास्तव में, हम फिर से एक आंशिक व्युत्पन्न लेने के बारे में बात कर रहे हैं, हमारे काल्पनिक परिदृश्य की अधिकतम स्थिरता के साथ आगे बढ़ने के बारे में) ... जब हमने ऐसा कर लिया है, तो अगली परत के लिए उसी प्रक्रिया को दोहराया जाना चाहिए, जो विपरीत दिशा में चलती है, अर्थात तंत्रिका नेटवर्क के आउटपुट से इनपुट तक।

प्रशिक्षण नमूने के प्रत्येक उदाहरण के साथ इस तरह से तंत्रिका नेटवर्क से गुजरते हुए और सही दिशा में न्यूरॉन्स के वजन को "घुमा"ते हुए, हमें अंततः एक प्रशिक्षित तंत्रिका नेटवर्क प्राप्त करना चाहिए। बैकप्रोपेगेशन विधि बहुपरत तंत्रिका नेटवर्क के लिए ग्रेडिएंट डिसेंट विधि का एक सरल संशोधन है और इसलिए इसे किसी भी जटिलता के तंत्रिका नेटवर्क के लिए काम करना चाहिए। हम यहां "चाहिए" कहते हैं क्योंकि वास्तव में ऐसे मामले हैं जहां ग्रेडिएंट डिसेंट विफल हो जाता है और अच्छे प्रतिगमन या तंत्रिका नेटवर्क प्रशिक्षण की अनुमति नहीं देता है। यह जानना उपयोगी हो सकता है कि ऐसी कठिनाइयों का कारण क्या है।

ढाल वंश की कठिनाइयाँ

निरपेक्ष न्यूनतम का गलत चुनाव।ग्रैडिएंट डिसेंट विधि स्थानीय चरम सीमा को खोजने में मदद करती है। लेकिन हम इसका उपयोग हमेशा पूर्ण वैश्विक न्यूनतम या अधिकतम फ़ंक्शन प्राप्त करने के लिए नहीं कर सकते हैं। ऐसा इसलिए होता है क्योंकि जब हम एंटीग्रेडिएंट के साथ आगे बढ़ते हैं, तो हम उस समय रुक जाते हैं जब हम पहले स्थानीय न्यूनतम तक पहुंच जाते हैं, और एल्गोरिथम काम करना बंद कर देता है।

कल्पना कीजिए कि आप एक पहाड़ की चोटी पर खड़े हैं। यदि आप क्षेत्र में सबसे निचली सतह पर जाना चाहते हैं, तो ढाल वंश हमेशा आपकी मदद नहीं कर सकता है, क्योंकि आपके रास्ते में पहला निम्न बिंदु आवश्यक रूप से निम्नतम बिंदु नहीं होगा। और अगर जीवन में आप देख सकते हैं कि यह थोड़ा ऊपर जाने लायक है और फिर आप और भी नीचे जा सकते हैं, तो ऐसी स्थिति में एल्गोरिथम बस रुक जाएगा। सही कदम चुनकर अक्सर इस स्थिति से बचा जा सकता है।

कदम का गलत चुनाव।ग्रेडिएंट डिसेंट विधि एक पुनरावृत्त विधि है। यही है, हमें खुद कदम का आकार चुनने की जरूरत है - जिस गति से हम उतरते हैं। बहुत बड़ा कदम चुनना, हम उस चरम सीमा को पार कर सकते हैं जिसकी हमें आवश्यकता है और न्यूनतम नहीं मिल रहा है। यह तब हो सकता है जब आप अपने आप को एक बहुत ही अचानक अवतरण के सामने पाते हैं। और यदि हम अपने आप को अपेक्षाकृत सपाट सतह पर पाते हैं तो बहुत छोटे कदम का चुनाव एल्गोरिथम के बेहद धीमी गति से संचालन के लिए खतरा है। यदि हम फिर से कल्पना करें कि हम एक खड़ी पहाड़ की चोटी पर हैं, तो हमें एक ऐसी स्थिति मिल सकती है, जहां न्यूनतम के करीब बहुत खड़ी उतरने के कारण, हम बस उस पर उड़ जाएंगे।

नेटवर्क पक्षाघात।कभी-कभी ऐसा होता है कि ग्रेडिएंट डिसेंट विधि न्यूनतम खोजने में विफल रहती है। यह तब हो सकता है जब न्यूनतम के दोनों किनारों पर समतल खंड हों - एल्गोरिथ्म, एक समतल खंड से टकराकर, चरण को कम करता है और अंततः रुक जाता है। यदि, एक पहाड़ की चोटी पर खड़े होकर, आप अपने घर के निचले इलाकों में जाने का फैसला करते हैं, तो रास्ता बहुत लंबा हो सकता है यदि आप गलती से एक बहुत ही समतल क्षेत्र में भटक जाते हैं। या, यदि समतल क्षेत्रों के किनारों के साथ व्यावहारिक रूप से खड़ी "ढलान" हैं, तो एल्गोरिथ्म, एक बहुत बड़ा कदम चुनकर, एक ढलान से दूसरे पर कूद जाएगा, व्यावहारिक रूप से न्यूनतम तक नहीं जा रहा है।

मशीन लर्निंग सिस्टम को डिजाइन करते समय इन सभी जटिलताओं को ध्यान में रखा जाना चाहिए। उदाहरण के लिए, यह ट्रैक करना हमेशा उपयोगी होता है कि समय के साथ त्रुटि फ़ंक्शन कैसे बदलता है - चाहे वह प्रत्येक नए चक्र के साथ गिरे या स्थिर हो, चरण आकार में परिवर्तन के आधार पर इस गिरावट की प्रकृति कैसे बदलती है। खराब स्थानीय न्यूनतम में जाने से बचने के लिए, परिदृश्य के विभिन्न यादृच्छिक रूप से चयनित बिंदुओं से शुरू करना उपयोगी होता है - फिर फंसने की संभावना बहुत कम होती है। ढाल वंश से निपटने के तरीके के बारे में कई और बड़े और छोटे रहस्य हैं, और अधिक विदेशी सीखने के तरीके हैं जो ढाल वंश के समान नहीं हैं। हालांकि, यह पहले से ही एआई एबीसी परियोजना के ढांचे के भीतर एक और बातचीत और एक अलग लेख का विषय है।

अलेक्जेंडर एर्शोव द्वारा तैयार किया गया

- मशीन लर्निंग कैसे काम करता है, इसका वर्णन करने के लिए क्या आप पूरी तरह से आदिम उदाहरण का उपयोग कर सकते हैं?

कर सकना। एक मशीन सीखने की विधि का एक उदाहरण है जिसे डिसीजन ट्री कहा जाता है, जो सबसे पुरानी चीजों में से एक है। चलो अब हम यह करें। मान लीजिए कि एक अमूर्त व्यक्ति आपसे डेट पर जाने के लिए कहता है। आपके लिए क्या महत्वपूर्ण है?

- पहले, मैं उसे जानता हूं या नहीं ...

(विक्टर इसे बोर्ड पर लिखते हैं।)

... अगर मुझे नहीं पता, तो मुझे इस सवाल का जवाब देना होगा कि यह आकर्षक है या नहीं।

और अगर आप जानते हैं, तो कोई बात नहीं? मुझे लगता है मैं समझ गया, यह मित्र क्षेत्र की एक शाखा है! सामान्य तौर पर, मैं लिख रहा हूं, यदि आप नहीं जानते और अनाकर्षक हैं, तो इसका उत्तर है "हां नहीं, शायद।" अगर आप जानते हैं तो इसका जवाब हां है।

- अगर मुझे पता है, यह भी महत्वपूर्ण है!

नहीं, यह फ्रेंड जोन की ब्रांच होगी।

ठीक है, तो चलिए यहां दिखाते हैं कि यह दिलचस्प है या नहीं। फिर भी, जब आप किसी व्यक्ति को नहीं जानते हैं, तो पहली प्रतिक्रिया उपस्थिति पर होती है, एक दोस्त के साथ हम पहले से ही देखते हैं कि वह क्या सोचता है और कैसे।

आइए इसे अलग तरह से करें। वह महत्वाकांक्षी है या नहीं। अगर वह महत्वाकांक्षी है, तो उसे फ्रेंड जोन बनाना मुश्किल होगा, वह और भी ज्यादा चाहेगा। और गैर-महत्वाकांक्षी सहन करेंगे।

(विक्टर निर्णायक वृक्ष को पूरा करता है।)

तैयार। अब आप अनुमान लगा सकते हैं कि आप किस लड़के को डेट कर सकते हैं। वैसे, कुछ डेटिंग सेवाएं इस तरह की भविष्यवाणी करती हैं। सादृश्य से, आप अनुमान लगा सकते हैं कि ग्राहक कितने उत्पाद खरीदेंगे और दिन के उस समय लोग कहां होंगे।

उत्तर न केवल "हां" और "नहीं" हो सकते हैं, बल्कि संख्याओं के रूप में भी हो सकते हैं। यदि आप अधिक सटीक पूर्वानुमान चाहते हैं, तो आप इनमें से कई पेड़ बना सकते हैं और उनके ऊपर औसत बना सकते हैं। और इतनी आसान सी बात की मदद से आप वास्तव में भविष्य की भविष्यवाणी कर सकते हैं।

अब सोचिये अगर दो सौ साल पहले लोगों के लिए ऐसी योजना बनाना मुश्किल होता? कदापि नहीं! इस योजना में कोई रॉकेट सनसनी नहीं है। एक घटना के रूप में, मशीन लर्निंग लगभग आधी सदी या एक सदी से अस्तित्व में है। रोनाल्ड फिशर ने 20वीं सदी की शुरुआत में आंकड़ों के आधार पर पूर्वानुमान लगाना शुरू किया। उन्होंने irises लिया और उन्हें सीपल और पंखुड़ी की लंबाई और चौड़ाई के साथ वितरित किया, इन मापदंडों के अनुसार, उन्होंने पौधे के प्रकार का निर्धारण किया।

उद्योग में, हाल के दशकों में मशीन लर्निंग का सक्रिय रूप से उपयोग किया गया है: बड़ी मात्रा में डेटा को संसाधित करने के लिए आवश्यक मजबूत और अपेक्षाकृत सस्ती मशीनें, उदाहरण के लिए, ऐसे निर्णय पेड़ों के लिए, बहुत पहले नहीं दिखाई दिए हैं। लेकिन यह अभी भी लुभावनी है: हम प्रत्येक कार्य के लिए इन चीजों को आकर्षित करते हैं और भविष्य की भविष्यवाणी करने के लिए उनका उपयोग करते हैं।

- ठीक है, निश्चित रूप से फुटबॉल मैचों की भविष्यवाणी करने वाले किसी भी ऑक्टोपस से बेहतर नहीं है ...

नहीं, ठीक है, हम ऑक्टोपस के पास कहाँ हैं। यद्यपि हमारे पास अधिक परिवर्तनशीलता है। मशीन लर्निंग अब समय, पैसा बचा सकता है और जीवन के आराम को बेहतर बना सकता है। मशीन लर्निंग ने कुछ साल पहले इमेज क्लासिफिकेशन में इंसानों को मात दी थी। उदाहरण के लिए, एक कंप्यूटर 20 टेरियर नस्लों को पहचान सकता है, लेकिन एक सामान्य व्यक्ति नहीं कर सकता।

- और जब आप उपयोगकर्ताओं का विश्लेषण करते हैं, तो क्या प्रत्येक व्यक्ति आपके लिए संख्याओं का एक समूह है?

मोटे तौर पर, हाँ। जब हम डेटा के साथ काम करते हैं, तो उपयोगकर्ता के व्यवहार सहित सभी वस्तुओं को संख्याओं के एक निश्चित सेट द्वारा वर्णित किया जाता है। और ये संख्याएँ लोगों के व्यवहार की ख़ासियतों को दर्शाती हैं: वे कितनी बार टैक्सी लेते हैं, वे किस वर्ग की टैक्सियों का उपयोग करते हैं, वे आमतौर पर किन स्थानों पर जाते हैं।

अब हम समान व्यवहार वाले लोगों के समूहों की पहचान करने के लिए सक्रिय रूप से समान दिखने वाले मॉडल बना रहे हैं। जब हम कोई नई सेवा शुरू करते हैं या किसी पुरानी सेवा का प्रचार करना चाहते हैं, तो हम इसे उन लोगों के लिए पेश करते हैं जो रुचि रखते हैं।

उदाहरण के लिए, अब हमारे पास एक सेवा है - एक टैक्सी में दो बच्चे की सीटें। हम इस समाचार के साथ सभी को स्पैम कर सकते हैं, या हम केवल कुछ खास लोगों को ही इसके बारे में सूचित कर सकते हैं। वर्ष के दौरान, हमने टिप्पणियों में लिखने वाले उपयोगकर्ताओं की एक निश्चित संख्या जमा की है कि उन्हें दो चाइल्ड सीटों की आवश्यकता है। हमने उन्हें पाया और उन्हें पसंद करने वाले लोग। परंपरागत रूप से, ये 30 वर्ष से अधिक उम्र के लोग हैं जो नियमित रूप से यात्रा करते हैं और भूमध्यसागरीय व्यंजन पसंद करते हैं। हालांकि, निश्चित रूप से, बहुत अधिक संकेत हैं, यह मैं एक उदाहरण के लिए हूं।

- ऐसी सूक्ष्मताएँ भी?

यह एक साधारण बात है। खोज क्वेरी का उपयोग करके सब कुछ की गणना की जाती है।

और आवेदन में, यह किसी तरह काम कर सकता है? उदाहरण के लिए, क्या आप जानते हैं कि मैं एक भिखारी हूं और मुझे "500 रूबल प्रति माह पर कैसे जीवित रहना है" जैसे समूहों की सदस्यता मिली है - मुझे केवल पस्त सस्ती कारों की पेशकश की जाती है, स्पेसएक्स समाचार की सदस्यता ली जाती है - और मुझे समय-समय पर टेस्ला मिलता है समय?

यह इस तरह से काम कर सकता है, लेकिन यांडेक्स ऐसी चीजों को स्वीकार नहीं करता है, क्योंकि यह भेदभाव है। जब आप किसी सेवा को वैयक्तिकृत करते हैं, तो सबसे स्वीकार्य नहीं, बल्कि सर्वोत्तम उपलब्ध और उस व्यक्ति को जो पसंद है उसे पेश करना बेहतर होता है। और तर्क के अनुसार वितरण "इसे एक बेहतर कार की जरूरत है, और इसे कम अच्छे की जरूरत है" बुरा है।

हर किसी की विकृत इच्छाएँ होती हैं, और कभी-कभी आपको भूमध्यसागरीय व्यंजन के लिए नुस्खा नहीं खोजने की ज़रूरत होती है, लेकिन, उदाहरण के लिए, कोप्रोफिलिया के बारे में चित्र। क्या इस मामले में भी निजीकरण काम करेगा?

हमेशा एक निजी मोड होता है।

अगर मैं नहीं चाहता कि किसी को मेरी रुचियों के बारे में पता चले, या, उदाहरण के लिए, दोस्त मेरे पास आए और कुछ कचरा देखना चाहते थे, तो गुप्त मोड का उपयोग करना बेहतर है।

आप यह भी तय कर सकते हैं कि किस कंपनी की सेवा का उपयोग करना है, उदाहरण के लिए, यांडेक्स या Google।

- क्या कोई अंतर है?

जटिल समस्या। मैं दूसरों के बारे में नहीं जानता, लेकिन व्यक्तिगत डेटा की सुरक्षा के साथ यांडेक्स कठिन है। कर्मचारियों पर विशेष नजर रखें।

- यानी, अगर मैंने किसी लड़के से संबंध तोड़ लिया, तो मैं यह पता नहीं लगा पाऊंगा कि वह इस दचा में गया या नहीं?

भले ही आप यांडेक्स के लिए काम करते हों। बेशक, यह दुखद है, लेकिन हां, इसका पता लगाना संभव नहीं होगा। अधिकांश कर्मचारियों के पास इस डेटा तक पहुंच भी नहीं है। सब कुछ एन्क्रिप्ट किया गया है। यह आसान है: आप लोगों की जासूसी नहीं कर सकते, यह व्यक्तिगत जानकारी है।

वैसे, लोगों के साथ बिदाई के विषय पर हमारे पास एक दिलचस्प मामला था। जब हमने बिंदु "बी" की भविष्यवाणी की - टैक्सी में गंतव्य बिंदु, हमने संकेत पेश किए। यहाँ देखो।

(विक्टर Yandex.Taxi एप्लिकेशन में प्रवेश करता है।)

उदाहरण के लिए, एक टैक्सी को लगता है कि मैं घर पर हूँ। वह मुझे या तो काम पर जाने के लिए या RUDN विश्वविद्यालय जाने के लिए आमंत्रित करता है (मैं डेटा माइनिंग इन एक्शन मशीन लर्निंग कोर्स के हिस्से के रूप में व्याख्यान पढ़ता हूं)। और कुछ बिंदु पर, इन युक्तियों को विकसित करते समय, हमने महसूस किया कि हमें उपयोगकर्ता से समझौता नहीं करना चाहिए। कोई बिंदु "बी" देख सकता है। इन कारणों से, हमने समानता के आधार पर स्थानों की पेशकश करने से इनकार कर दिया। और फिर आप सभ्य लोगों के साथ एक अच्छी जगह पर बैठते हैं, एक टैक्सी ऑर्डर करते हैं, और वे आपको लिखते हैं: "देखो, तुम अभी तक इस बार में नहीं गए हो!"

- आपके मानचित्र पर किस प्रकार के नीले बिंदु चमक रहे हैं?

ये हैं पिकअप प्वाइंट ये बिंदु दिखाते हैं कि टैक्सी को कॉल करना सबसे सुविधाजनक कहाँ है। आखिरकार, आप ऐसी जगह पर कॉल कर सकते हैं जहां कॉल करना पूरी तरह से असुविधाजनक होगा। लेकिन सामान्य तौर पर, आप किसी भी बिंदु पर कॉल कर सकते हैं।

- हाँ, कोई। मैंने किसी तरह इससे दो ब्लॉक उड़ाए।

हाल ही में, जीपीएस के साथ कई कठिनाइयां आई हैं, इससे अलग-अलग अजीब स्थितियां पैदा हुईं। लोग, उदाहरण के लिए, टावर्सकाया पर, नेविगेशन ने प्रशांत महासागर में फेंक दिया। जैसा कि आप देख सकते हैं, कभी-कभी गलतियाँ होती हैं और दो से अधिक ब्लॉक होते हैं।

- और यदि आप एप्लिकेशन को पुनरारंभ करते हैं और इसे फिर से दबाते हैं, तो कीमत कुछ रूबल से बदल जाती है। क्यों?

यदि मांग आपूर्ति से अधिक हो जाती है, तो एल्गोरिथ्म स्वचालित रूप से एक गुणा गुणांक उत्पन्न करता है - यह उन लोगों की मदद करता है जिन्हें उच्च मांग की अवधि के दौरान भी टैक्सी का उपयोग करने के लिए जितनी जल्दी हो सके छोड़ने की आवश्यकता होती है। वैसे, मशीन लर्निंग का उपयोग करके, आप अनुमान लगा सकते हैं कि मांग कहाँ अधिक होगी, उदाहरण के लिए, एक घंटा। इससे हमें ड्राइवरों को यह बताने में मदद मिलती है कि कहां अधिक ऑर्डर होंगे ताकि आपूर्ति मांग से मेल खाए।

- क्या आपको नहीं लगता कि यांडेक्स।टैक्सी जल्द ही पूरे टैक्सी मार्केट को खत्म कर देगी?

मेरे ख़्याल से नहीं। हम स्वस्थ प्रतिस्पर्धा के पक्षधर हैं और इससे डरते नहीं हैं।

उदाहरण के लिए, मैं स्वयं विभिन्न टैक्सी सेवाओं का उपयोग करता हूं। प्रतीक्षा समय मेरे लिए महत्वपूर्ण है, इसलिए मैं कई एप्लिकेशन देखता हूं कि कौन सी टैक्सी तेजी से पहुंचेगी।

- आपने उबर के साथ मिलकर काम किया है। किस लिए?

टिप्पणी करना मेरे अधिकार क्षेत्र में नहीं है। मुझे लगता है कि एकजुट होना एक बहुत ही समझदारी भरा फैसला है।

जर्मनी में, एक व्यक्ति ने अपने ड्रोन पर बाथटब स्थापित किया और इसलिए बर्गर के लिए उड़ान भरी। क्या आपने सोचा है कि यह हवाई क्षेत्र में महारत हासिल करने का समय है?

मैं हवाई क्षेत्र के बारे में नहीं जानता। हम "उबेर ने नावों पर एक टैक्सी शुरू की" की भावना में समाचार का पालन किया, लेकिन मैं हवा के बारे में कुछ नहीं कह सकता।

- और टैक्सी ड्रोन के बारे में क्या?

यहाँ एक दिलचस्प बिंदु है। हम उन्हें विकसित कर रहे हैं, लेकिन हमें यह सोचना होगा कि उनका सही उपयोग कैसे किया जाए। यह भविष्यवाणी करना जल्दबाजी होगी कि वे किस रूप में और कब सड़कों पर दिखाई देंगे, लेकिन हम पूरी तरह से स्वायत्त कार के लिए प्रौद्योगिकी विकसित करने के लिए सब कुछ कर रहे हैं, जहां एक मानव चालक की बिल्कुल भी आवश्यकता नहीं होगी।

- क्या कोई आशंका है कि कार को दूर से नियंत्रित करने के लिए ड्रोन सॉफ्टवेयर को हैक किया जा सकता है?

जोखिम हमेशा होते हैं और जहां भी प्रौद्योगिकियां और गैजेट होते हैं। लेकिन प्रौद्योगिकियों के विकास के साथ-साथ एक और दिशा विकसित हो रही है - उनकी सुरक्षा और सुरक्षा। हर कोई जो किसी न किसी तरह से प्रौद्योगिकियों के विकास में शामिल है, सुरक्षा प्रणालियों पर काम कर रहा है।

- आप किस प्रकार का उपयोगकर्ता डेटा एकत्र करते हैं और आप इसे कैसे सुरक्षित रखते हैं?

हम अज्ञात उपयोगकर्ता डेटा एकत्र करते हैं, जैसे कि यात्रा कहाँ, कब और कहाँ की गई थी। सब कुछ महत्वपूर्ण हैशिंग है।

- क्या आपको लगता है कि ड्रोन से नौकरियों की संख्या घटेगी?

मुझे लगता है कि यह केवल बड़ा होगा। फिर भी, इन ड्रोनों को भी किसी तरह से सेवित करने की आवश्यकता है। बेशक, यह थोड़ी तनावपूर्ण स्थिति है, आपकी विशेषता बदल रही है, लेकिन आप क्या कर सकते हैं।

- ग्रीफ अपने प्रत्येक व्याख्यान में कहते हैं कि एक व्यक्ति अपने पेशे को कम से कम तीन बार मौलिक रूप से बदलेगा।

मैं ऐसी किसी विशेषता का नाम नहीं ले सकता जो सदा बनी रहे। एक डेवलपर अपना सारा जीवन एक ही भाषा में और समान तकनीकों के साथ काम नहीं करता है। हर जगह आपको पुनर्निर्माण की जरूरत है। मशीन लर्निंग के साथ, मैं स्पष्ट रूप से महसूस कर सकता हूं कि मुझसे छह साल छोटे लड़के मुझसे ज्यादा तेजी से कैसे सोच रहे हैं। वहीं 40 या 45 साल के लोग इसे और भी ज्यादा महसूस करते हैं।

- अनुभव अब कोई भूमिका नहीं निभाता है?

खेलता है। लेकिन तरीके बदल जाते हैं, आप एक ऐसे क्षेत्र में आ सकते हैं, जहां, उदाहरण के लिए, गहरी शिक्षा का उपयोग नहीं किया गया है, आप वहां कुछ समय के लिए काम करते हैं, फिर हर जगह गहन शिक्षण विधियों को लागू किया जाता है, और आप इसके बारे में कुछ भी नहीं समझते हैं। और बस यही। आपका अनुभव टीम के काम की योजना बनाने में ही उपयोगी हो सकता है, और तब भी हमेशा नहीं।

- क्या आपका पेशा डेटा साइंटिस्ट है, क्या यह मांग में है?

डेटा विज्ञान विशेषज्ञों की मांग बस पैमाने से दूर है। जाहिर है, अब पागल प्रचार का दौर है। भगवान का शुक्र है कि ब्लॉकचेन ने इस प्रचार को थोड़ा कम करने में मदद की। ब्लॉकचेन विशेषज्ञों को और भी तेजी से अलग किया जाता है।

लेकिन कई कंपनियां अब सोचती हैं कि अगर वे मशीन लर्निंग में निवेश करती हैं, तो उनके बगीचे तुरंत खिल जाएंगे। यह सच नहीं है। मशीन लर्निंग को विशिष्ट समस्याओं को हल करना चाहिए, न कि केवल अस्तित्व में।

ऐसे समय होते हैं जब कोई बैंक उपयोगकर्ताओं के लिए सेवाओं की सिफारिश प्रणाली बनाना चाहता है। हम पूछते हैं: "क्या आपको लगता है कि यह आर्थिक रूप से उचित होगा?" वे जवाब देते हैं: “हाँ, हमें परवाह नहीं है। कर दो। सभी समान अनुशंसा प्रणाली, हम प्रवृत्ति में होंगे।"

दर्द यह है कि एक व्यवसाय के लिए वास्तव में उपयोगी चीज एक दिन में नहीं की जा सकती है। आपको यह देखने की जरूरत है कि सिस्टम कैसे सीखेगा। और वह हमेशा शुरुआत में त्रुटियों के साथ काम करती है, प्रशिक्षण के दौरान उसे कुछ डेटा की कमी हो सकती है। आप गलतियों को ठीक करते हैं, फिर आप इसे फिर से ठीक करते हैं और यहां तक कि सब कुछ फिर से करते हैं। उसके बाद, आपको कॉन्फ़िगर करने की आवश्यकता है ताकि सिस्टम उत्पादन में काम करे, ताकि यह स्थिर और स्केलेबल हो, यह अभी भी समय है। नतीजतन, एक परियोजना में छह महीने, एक साल या उससे अधिक समय लगता है।

यदि आप ब्लैक बॉक्स की तरह मशीन सीखने के तरीकों को देखते हैं, तो आप आसानी से चूक सकते हैं कि कैसे कुछ बकवास होने लगती है। दाढ़ी वाली कहानी है। सेना ने एक एल्गोरिथम विकसित करने के लिए कहा जिसका उपयोग यह विश्लेषण करने के लिए किया जा सकता है कि तस्वीर में टैंक है या नहीं। शोधकर्ताओं ने किया है, परीक्षण किया है, गुणवत्ता उत्कृष्ट है, सब कुछ बढ़िया है, सेना को दिया गया है। सेना आती है और कहती है कि कुछ भी काम नहीं कर रहा है। वैज्ञानिक घबराहट से समझने लगे हैं। यह पता चला है कि सेना द्वारा लाए गए टैंक के साथ सभी चित्रों में एक पेन के साथ कोने में एक चेक मार्क था। एल्गोरिथ्म त्रुटिपूर्ण रूप से एक चेक मार्क खोजने के लिए सीखा, वह टैंक के बारे में कुछ भी नहीं जानता था। स्वाभाविक रूप से, नई तस्वीरों पर कोई चेक मार्क नहीं थे।

मैं उन बच्चों से मिला हूं जो अपनी खुद की संवाद प्रणाली विकसित करते हैं। क्या आपने कभी सोचा है कि आपको बच्चों के साथ सहयोग करने की ज़रूरत है?

मैं लंबे समय से स्कूली बच्चों के लिए हर तरह के आयोजनों में जा रहा हूं, मशीन लर्निंग के बारे में व्याख्यान दे रहा हूं। और, वैसे, दसवीं कक्षा के एक छात्र ने मुझे एक विषय पढ़ाया। मुझे पूरा यकीन था कि मेरी कहानी अच्छी और दिलचस्प होगी, मुझे खुद पर गर्व था, मैंने प्रसारण शुरू किया, और लड़की इस तरह थी: "ओह, हम इस बात को कम करना चाहते हैं।" मैं देखता हूं और सोचता हूं, लेकिन वास्तव में, क्यों, और वास्तव में कम से कम किया जा सकता है, और विशेष रूप से साबित करने के लिए कुछ भी नहीं है। कई साल बीत चुके हैं, अब वह Phystech की छात्रा के रूप में हमारे व्याख्यान सुनती है। वैसे, Yandex के पास Yandex.Lece है, जहां छात्र बुनियादी प्रोग्रामिंग ज्ञान मुफ्त में प्राप्त कर सकते हैं।

- उन विश्वविद्यालयों और संकायों को सलाह दें जहां अब मशीन लर्निंग पढ़ाया जाता है।

MIPT, FIVT और FUPM के संकाय हैं। एचएसई में एक अद्भुत कंप्यूटर विज्ञान विभाग भी है, और मॉस्को स्टेट यूनिवर्सिटी में वीएमसी में मशीन लर्निंग उपलब्ध है। ठीक है, अब आप RUDN विश्वविद्यालय में हमारे पाठ्यक्रम को सुन सकते हैं।

जैसा कि मैंने कहा, यह पेशा मांग में है। बहुत लंबे समय तक, तकनीकी शिक्षा प्राप्त करने वाले लोग पूरी तरह से अलग-अलग चीजों में लगे हुए थे। मशीन लर्निंग इसका एक बेहतरीन उदाहरण है जब तकनीकी पृष्ठभूमि वाले लोगों को सिखाई जाने वाली सभी चीजें अब आवश्यक, उपयोगी और अच्छी तरह से भुगतान की जाती हैं।

- कितना अच्छा?

राशि का नाम बताइए।

- 500 हजार प्रति माह।

आप एक साधारण डेटा वैज्ञानिक नहीं हो सकते हैं। लेकिन कुछ कंपनियों में, एक बहुत, बहुत प्रशिक्षु को एक साधारण नौकरी के लिए 50 हजार मिल सकते हैं।बहुत बड़ा प्रसार है। सामान्य तौर पर, एक कठिन डेटा वैज्ञानिक के वेतन की तुलना किसी औसत कंपनी के सीईओ के वेतन से की जा सकती है। कई कंपनियों में, वेतन के अलावा, बहुत सारे बन्स कर्मचारी पर पड़ते हैं, और यदि यह स्पष्ट है कि कोई व्यक्ति अपने रेज़्यूमे पर एक अच्छा ब्रांड लिखने के लिए नहीं आया था, बल्कि वास्तव में काम करने आया था, तो सब कुछ ठीक हो जाएगा उसे।

FIVT को एक असामान्य विषय - एक अभिनव कार्यशाला शुरू किए लगभग एक साल बीत चुका है। इसका सार अनुभवी आकाओं के मार्गदर्शन में छात्र टीमों द्वारा आईटी स्टार्टअप का निर्माण है। यह अच्छी तरह से निकला: पाठ्यक्रम के लिए धन्यवाद, किसी ने क्रेमीवाया घाटी में गर्मियों का हिस्सा बिताया, किसी को परियोजना के विकास के लिए 800,000 रूबल का अनुदान मिला, और किसी और का एबीबीवाई परियोजना को पूरी तरह से खरीदने के लिए तैयार है। और ये सभी कार्यशाला के परिणाम नहीं हैं!

2011 की शुरुआत में, FIVT तृतीय वर्ष के छात्रों को असेंबली हॉल में इकट्ठा किया गया और बताया गया: अगले वर्ष के भीतर, आपको अपना स्टार्टअप बनाने की आवश्यकता होगी। छात्रों ने इस विचार को अस्पष्ट रूप से माना: यह बिल्कुल स्पष्ट नहीं था कि इसे कैसे करना है, और जिम्मेदारी असामान्य थी - आखिरकार, एक तकनीकी व्यवसाय करना आवश्यक था, न कि एक अन्य शैक्षिक परियोजना। यहाँ भौतिकी में MIPT छात्र ओलंपियाड के विजेता, यांडेस्का विभाग के छात्र विक्टर कांतोर इसके बारे में क्या सोचते हैं:

जब मैंने प्रवेश पर FIVT को चुना, तो मुझे उम्मीद थी कि हमारे पास भी कुछ ऐसा ही होगा। इसलिए मुझे खुशी है कि मैं व्यर्थ की उम्मीद नहीं कर रहा था। वर्ष के दौरान, यह महसूस किया गया कि पाठ्यक्रम अभी भी बन रहा था, इसमें बहुत कुछ नया था, न केवल छात्रों के लिए, बल्कि आयोजकों के लिए भी कई मुद्दे विवादास्पद निकले, लेकिन सामान्य तौर पर, मुझे लगता है, रुझान सकारात्मक थे। मुझे यह कोर्स पसंद आया।

छात्रों के काम को सुविधाजनक बनाने के लिए, विभिन्न क्यूरेटरों को आमंत्रित किया गया, जिन्होंने नवीन व्यवसायों के निर्माण के लिए अपने विचार प्रस्तावित किए। उनमें से पूरी तरह से अलग लोग थे: एमआईपीटी के वरिष्ठ छात्रों और स्नातक छात्रों से लेकर अर्न्स्ट एंड यंग के नवाचारों के सलाहकार यूरी पावलोविच अम्मोसोव (वह पूरे पाठ्यक्रम के प्रमुख थे) और मिखाइल बातिन, जो पुनर्योजी चिकित्सा और जीवन विस्तार के मुद्दों में लगे हुए हैं। नतीजतन, भौतिकविदों ने उन विचारों को चुना जो उनके लिए सबसे दिलचस्प थे, क्यूरेटर ने खुद को टीमों से जोड़ा, और कठिन लेकिन रोमांचक काम शुरू हुआ।

उस पल से गुजरे लगभग एक साल से, लोगों को कई समस्याओं का सामना करना पड़ा है, जिनमें से कुछ का समाधान किया गया है। अब आप उनके परिणामों का मूल्यांकन कर सकते हैं - कठिनाइयों के बावजूद, लोगों ने मुकाबला किया। MIPT छात्र (FIVS के अलावा, FOPF और अन्य संकायों के कुछ छात्र इस प्रक्रिया में शामिल हुए) कई दिलचस्प और व्यवहार्य परियोजनाएँ तैयार करने में कामयाब रहे:

Askeroid (पूर्व में आस्क Droid) - स्मार्टफोन खोजें ( अनास्तासिया उरीशेवा)

एंड्रॉइड के लिए एक एप्लिकेशन जो आपको बड़ी संख्या में खोज इंजनों में आसानी से खोज करने की अनुमति देता है। कुछ विशेषज्ञों ने विकास में रुचि दिखाई, और नतीजतन, अनास्तासिया ने पूरी पिछली गर्मियों में सिलिकॉन वैली में सबसे प्रसिद्ध इन्क्यूबेटरों में से एक - प्लग एंड प्ले में बिताया। प्रौद्योगिकी उद्यमिता की मूल बातें सीखना और अंतर्राष्ट्रीय उद्यम पूंजी विशेषज्ञों के साथ बात करना।

1मिनट.आरयू - एक मिनट अच्छे के लिए (लेव ग्रुनिन)

यह परियोजना किसी भी व्यक्ति को दान कार्य को सरलता से, शीघ्रता से और पूरी तरह से नि:शुल्क करने में सक्षम बनाती है। मॉडल सरल है: विज्ञापनदाता साइट पर गतिविधियों का एक निश्चित सेट पेश करते हैं, उपयोगकर्ता स्वेच्छा से उनमें भाग लेते हैं, विज्ञापन से सारा पैसा एक धर्मार्थ नींव में स्थानांतरित कर दिया जाता है। लॉन्च के एक हफ्ते में, परियोजना ने 6500 से अधिक उपयोगकर्ताओं को एकत्र किया है और यह वहाँ रुकने वाला नहीं है। नतीजतन, लेव और उनकी टीम के लिए धन्यवाद, अनाथालयों के 600 बच्चों को नए साल के लिए सांता क्लॉज़ से पोषित उपहार प्राप्त होंगे। क्या आपने पहले ही एक मिनट अच्छे काम पर लगा दिया है?!

एंबेडेड डेस्कटॉप - आपके फोन में एक कंप्यूटर (एलेक्सी वुकोलोव)

एक एप्लिकेशन जो आपको एक मामले में कंप्यूटर की क्षमताओं और फोन की गतिशीलता को संयोजित करने की अनुमति देता है, व्यस्त लोगों के लिए एक अत्यंत उपयोगी उत्पाद है जो अक्सर व्यवसाय पर यात्रा करते हैं। इसे स्मार्टफोन पर स्थापित करने के लिए पर्याप्त है, और उपयोगकर्ता किसी भी होटल, कार्यालय और वास्तव में हर जगह जहां आप एक मॉनिटर (एक टीवी सेट भी उपयुक्त है), एक कीबोर्ड और अपने कंप्यूटर को "अधिग्रहण" करने में सक्षम होगा। एक माउस। परियोजना को विचार के विकास के लिए अनुदान मिला और इसे टेक्नोवेशन कप प्रदर्शनी में प्रस्तुत किया गया, और टीम पहले से ही प्राप्त धन के लिए सक्रिय रूप से उपकरण खरीद रही है। अमेरिकी प्रोसेसर निर्माता MIPS की विकास में गहरी रुचि है।

स्मार्ट टैगर - दस्तावेजों के लिए अर्थपूर्ण खोज (विक्टर कांटोर)

क्या होगा यदि आपको याद है कि आपके इनबॉक्स में कहीं एक बहुत ही महत्वपूर्ण पत्र था, जो बिग बैंग थ्योरी के नवीनतम एपिसोड के बारे में बात करता था, लेकिन साथ ही आपको टेक्स्ट से कोई कीवर्ड याद नहीं है? यांडेक्स और Google खोज शक्तिहीन हैं। स्मार्ट टैगर का विकास बचाव में आएगा - एक "स्मार्ट" प्रोग्राम जो सिमेंटिक खोज का उपयोग करता है, आपको सभी पाठ देगा, जिसका अर्थ लोकप्रिय टीवी श्रृंखला के साथ जुड़ा हुआ है। परियोजना ने U.M.N.I.K में अनुदान प्राप्त किया। कुल 400,000 रूबल!

MathOcr - फॉर्मूला रिकग्निशन (विक्टर प्रून)

ABBYY ने कार्यान्वयन के लिए एक दिलचस्प कार्य का प्रस्ताव दिया - एक ऐसा कार्यक्रम बनाने के लिए जो किसी भी जटिलता के गणितीय सूत्रों को पहचान सके। FIVT छात्रों ने रुचि रखने वाले fopfs के साथ मिलकर कार्य पूरा किया - मॉड्यूल वास्तव में मटन या भौतिकी पर पाठ्यपुस्तकों से स्कैन किए गए फ़ार्मुलों को पहचानता है। परिणाम: ABBYY इस उत्पाद को बहुत सारे पैसे में खरीदने के लिए तैयार है।