इसके अग्रदूतों के अनुसार, गहन शिक्षा का भविष्य

इसके अग्रदूतों के अनुसार, गहन शिक्षा का भविष्य

Posted on

एआई अपनाने की अवस्था में आपका उद्यम कहां खड़ा है? पता लगाने के लिए हमारे एआई सर्वेक्षण में भाग लें।


डीप न्यूरल नेटवर्क प्रतीकात्मक कृत्रिम बुद्धिमत्ता की मदद के बिना अपनी कमियों को दूर करेंगे, डीप लर्निंग के तीन अग्रदूत जुलाई के अंक में प्रकाशित एक पेपर में तर्क देते हैं एसीएम का संचार पत्रिका.

अपने पेपर में, योशुआ बेंगियो, जेफ्री हिंटन और यान लेकन, 2018 ट्यूरिंग अवार्ड के प्राप्तकर्ता, गहरी शिक्षा की वर्तमान चुनौतियों की व्याख्या करते हैं और यह बताते हैं कि यह मनुष्यों और जानवरों में सीखने से कैसे भिन्न है। वे इस क्षेत्र में हालिया प्रगति का भी पता लगाते हैं जो गहन शिक्षा में अनुसंधान के लिए भविष्य की दिशाओं के लिए ब्लूप्रिंट प्रदान कर सकते हैं।

“एआई के लिए डीप लर्निंग” शीर्षक से, पेपर एक ऐसे भविष्य की कल्पना करता है जिसमें गहन शिक्षण मॉडल मनुष्यों से बहुत कम या बिना किसी मदद के सीख सकते हैं, अपने पर्यावरण में बदलाव के लिए लचीले होते हैं, और रिफ्लेक्सिव और संज्ञानात्मक समस्याओं की एक विस्तृत श्रृंखला को हल कर सकते हैं।

गहरी शिक्षा की चुनौतियाँ

ऊपर: डीप लर्निंग के अग्रदूत योशुआ बेंगियो (बाएं), जेफ्री हिंटन (बीच में), और यान लेकन (दाएं)।

डीप लर्निंग की तुलना अक्सर इंसानों और जानवरों के दिमाग से की जाती है। हालांकि, पिछले वर्षों ने साबित कर दिया है कि कृत्रिम तंत्रिका नेटवर्क, गहन शिक्षण मॉडल में उपयोग किया जाने वाला मुख्य घटक, उनके जैविक समकक्षों की दक्षता, लचीलेपन और बहुमुखी प्रतिभा की कमी है।

अपने पेपर में, बेंगियो, हिंटन और लेकन इन कमियों को स्वीकार करते हैं। “पर्यवेक्षित शिक्षण, जबकि विभिन्न प्रकार के कार्यों में सफल होता है, आमतौर पर बड़ी मात्रा में मानव-लेबल वाले डेटा की आवश्यकता होती है। इसी तरह, जब सुदृढीकरण सीखना केवल पुरस्कारों पर आधारित होता है, तो इसके लिए बहुत बड़ी संख्या में बातचीत की आवश्यकता होती है,” वे लिखते हैं।

पर्यवेक्षित शिक्षण मशीन लर्निंग एल्गोरिदम का एक लोकप्रिय उपसमुच्चय है, जिसमें एक मॉडल को लेबल किए गए उदाहरणों के साथ प्रस्तुत किया जाता है, जैसे कि छवियों की सूची और उनकी संबंधित सामग्री। मॉडल को समान लेबल वाले उदाहरणों में आवर्ती पैटर्न खोजने के लिए प्रशिक्षित किया जाता है। इसके बाद यह नए उदाहरणों को सही लेबल के साथ जोड़ने के लिए सीखे गए पैटर्न का उपयोग करता है। पर्यवेक्षित शिक्षण उन समस्याओं के लिए विशेष रूप से उपयोगी है जहां लेबल किए गए उदाहरण प्रचुर मात्रा में उपलब्ध हैं।

रीइन्फोर्समेंट लर्निंग मशीन लर्निंग की एक और शाखा है, जिसमें एक “एजेंट” एक वातावरण में “इनाम” को अधिकतम करना सीखता है। एक वातावरण एक टिक-टैक-टो बोर्ड जितना सरल हो सकता है जिसमें एक एआई खिलाड़ी को तीन एक्स या ओएस को लाइन करने के लिए पुरस्कृत किया जाता है, या शहरी सेटिंग के रूप में जटिल है जिसमें टकराव से बचने के लिए एक सेल्फ-ड्राइविंग कार को पुरस्कृत किया जाता है। यातायात नियम, और अपने गंतव्य तक पहुंचना। एजेंट यादृच्छिक कार्रवाई करके शुरू करता है। जैसा कि यह अपने पर्यावरण से प्रतिक्रिया प्राप्त करता है, यह उन कार्यों के अनुक्रम पाता है जो बेहतर पुरस्कार प्रदान करते हैं।

दोनों ही मामलों में, जैसा कि वैज्ञानिक स्वीकार करते हैं, मशीन लर्निंग मॉडल के लिए भारी श्रम की आवश्यकता होती है। लेबल किए गए डेटासेट का आना मुश्किल है, विशेष रूप से विशेष क्षेत्रों में जिनके पास सार्वजनिक, ओपन-सोर्स डेटासेट नहीं हैं, जिसका अर्थ है कि उन्हें मानव व्याख्याकारों के कठिन और महंगे श्रम की आवश्यकता है। और जटिल सुदृढीकरण सीखने के मॉडल को बड़ी संख्या में प्रशिक्षण एपिसोड चलाने के लिए बड़े पैमाने पर कम्प्यूटेशनल संसाधनों की आवश्यकता होती है, जो उन्हें कुछ, बहुत अमीर एआई प्रयोगशालाओं और तकनीकी कंपनियों के लिए उपलब्ध कराता है।

बेंगियो, हिंटन और लेकन भी स्वीकार करते हैं कि वर्तमान गहन शिक्षण प्रणाली अभी भी उन समस्याओं के दायरे में सीमित हैं जिन्हें वे हल कर सकते हैं। वे विशिष्ट कार्यों पर अच्छा प्रदर्शन करते हैं लेकिन “अक्सर उस संकीर्ण डोमेन के बाहर भंगुर होते हैं जिस पर उन्हें प्रशिक्षित किया गया है।” अक्सर, छवि में कुछ संशोधित पिक्सेल या पर्यावरण में नियमों में बहुत मामूली परिवर्तन जैसे मामूली परिवर्तन गहन शिक्षण प्रणाली को भटका सकते हैं।

डीप लर्निंग सिस्टम की भंगुरता काफी हद तक मशीन लर्निंग मॉडल के “स्वतंत्र और समान रूप से वितरित” (iid) धारणा पर आधारित होने के कारण है, जो मानता है कि वास्तविक दुनिया के डेटा का प्रशिक्षण डेटा के समान वितरण होता है। iid यह भी मानता है कि अवलोकन एक दूसरे को प्रभावित नहीं करते हैं (उदाहरण के लिए, सिक्का या डाइ टॉस एक दूसरे से स्वतंत्र हैं)।

“शुरुआती दिनों से, मशीन लर्निंग के सिद्धांतकारों ने आईआईडी धारणा पर ध्यान केंद्रित किया है … दुर्भाग्य से, यह वास्तविक दुनिया में एक यथार्थवादी धारणा नहीं है,” वैज्ञानिक लिखते हैं।

विभिन्न कारकों के कारण वास्तविक दुनिया की सेटिंग्स लगातार बदल रही हैं, जिनमें से कई बिना कारण मॉडल के प्रतिनिधित्व करना लगभग असंभव है। बुद्धिमान एजेंटों को अपने पर्यावरण और अन्य एजेंटों से लगातार निरीक्षण और सीखना चाहिए, और उन्हें अपने व्यवहार को परिवर्तनों के अनुकूल बनाना चाहिए।

“[T]जब वे प्रयोगशाला से मैदान में जाते हैं, तो आज के सर्वश्रेष्ठ एआई सिस्टम का प्रदर्शन हिट हो जाता है, ”वैज्ञानिक लिखते हैं।

कंप्यूटर दृष्टि और प्राकृतिक भाषा प्रसंस्करण जैसे क्षेत्रों पर लागू होने पर आईआईडी धारणा और भी नाजुक हो जाती है, जहां एजेंट को उच्च-एन्ट्रॉपी वातावरण से निपटना चाहिए। वर्तमान में, कई शोधकर्ता और कंपनियां अधिक डेटा पर तंत्रिका नेटवर्क को प्रशिक्षित करके गहन सीखने की सीमाओं को पार करने की कोशिश करती हैं, उम्मीद है कि बड़े डेटासेट व्यापक वितरण को कवर करेंगे और वास्तविक दुनिया में विफलता की संभावना को कम करेंगे।

डीप लर्निंग बनाम हाइब्रिड एआई

एआई वैज्ञानिकों का अंतिम लक्ष्य मनुष्यों के पास सामान्य बुद्धि की तरह को दोहराना है। और हम जानते हैं कि मनुष्य वर्तमान गहन शिक्षण प्रणालियों की समस्याओं से ग्रस्त नहीं हैं।

बेंगियो, हिंटन और लेकन अपने पेपर में लिखते हैं, “मनुष्य और जानवर दुनिया के बारे में बड़े पैमाने पर पृष्ठभूमि के ज्ञान को सीखने में सक्षम हैं, मोटे तौर पर अवलोकन द्वारा, कार्य-स्वतंत्र तरीके से।” “यह ज्ञान सामान्य ज्ञान को रेखांकित करता है और मनुष्यों को केवल कुछ घंटों के अभ्यास के साथ ड्राइविंग जैसे जटिल कार्यों को सीखने की अनुमति देता है।”

कागज में कहीं और, वैज्ञानिक ध्यान दें, “[H]यूमन सामान्य आईआईडी सामान्यीकरण से अलग और अधिक शक्तिशाली तरीके से सामान्यीकरण कर सकते हैं: हम मौजूदा अवधारणाओं के उपन्यास संयोजनों की सही ढंग से व्याख्या कर सकते हैं, भले ही वे संयोजन हमारे प्रशिक्षण वितरण के तहत बेहद असंभव हों, जब तक वे उच्च-स्तरीय वाक्यविन्यास और अर्थपूर्ण का सम्मान करते हैं पैटर्न हम पहले ही सीख चुके हैं।”

एआई और मानव बुद्धि के बीच की खाई को पाटने के लिए वैज्ञानिक विभिन्न समाधान प्रदान करते हैं। पिछले कुछ वर्षों में व्यापक रूप से चर्चा की गई एक दृष्टिकोण हाइब्रिड कृत्रिम बुद्धि है जो शास्त्रीय प्रतीकात्मक प्रणालियों के साथ तंत्रिका नेटवर्क को जोड़ती है। दुनिया के बारे में तर्क करने की इंसान की क्षमता का प्रतीक हेरफेर एक बहुत ही महत्वपूर्ण हिस्सा है। यह गहन शिक्षण प्रणालियों की बड़ी चुनौतियों में से एक है।

बेंगियो, हिंटन और लेकन तंत्रिका नेटवर्क और प्रतीकात्मक एआई को मिलाने में विश्वास नहीं करते हैं। एसीएम पेपर के साथ आने वाले एक वीडियो में, बेंगियो कहते हैं, “कुछ ऐसे हैं जो मानते हैं कि ऐसी समस्याएं हैं जिन्हें तंत्रिका नेटवर्क हल नहीं कर सकते हैं और हमें शास्त्रीय एआई, प्रतीकात्मक दृष्टिकोण का सहारा लेना होगा। लेकिन हमारा काम कुछ और ही सुझाता है।”

गहन शिक्षण अग्रदूतों का मानना ​​​​है कि बेहतर तंत्रिका नेटवर्क आर्किटेक्चर अंततः मानव और पशु बुद्धि के सभी पहलुओं को जन्म देगा, जिसमें प्रतीक हेरफेर, तर्क, कारण अनुमान और सामान्य ज्ञान शामिल हैं।

गहरी शिक्षा में आशाजनक प्रगति

अपने पेपर में, बेंगियो, हिंटन और लेकन ने गहन शिक्षण में हालिया प्रगति पर प्रकाश डाला है, जिसने कुछ क्षेत्रों में प्रगति करने में मदद की है जहां गहन शिक्षण संघर्ष करता है। एक उदाहरण ट्रांसफॉर्मर है, एक तंत्रिका नेटवर्क आर्किटेक्चर जो ओपनएआई के जीपीटी -3 और Google के मीना जैसे भाषा मॉडल के केंद्र में रहा है। ट्रांसफॉर्मर के लाभों में से एक लेबल डेटा की आवश्यकता के बिना सीखने की उनकी क्षमता है। ट्रान्सफ़ॉर्मर अप्रशिक्षित शिक्षण के माध्यम से अभ्यावेदन विकसित कर सकते हैं, और फिर वे उन अभ्यावेदन को अधूरे वाक्यों पर रिक्त स्थान को भरने के लिए लागू कर सकते हैं या संकेत प्राप्त करने के बाद सुसंगत पाठ उत्पन्न कर सकते हैं।

हाल ही में, शोधकर्ताओं ने दिखाया है कि ट्रांसफॉर्मर को कंप्यूटर विज़न कार्यों के लिए भी लागू किया जा सकता है। दृढ़ तंत्रिका नेटवर्क के साथ संयुक्त होने पर, ट्रांसफार्मर नकाबपोश क्षेत्रों की सामग्री की भविष्यवाणी कर सकते हैं।

एक अधिक आशाजनक तकनीक विपरीत शिक्षा है, जो सटीक पिक्सेल मानों की भविष्यवाणी करने के बजाय लापता क्षेत्रों के वेक्टर प्रतिनिधित्व को खोजने का प्रयास करती है। यह एक पेचीदा तरीका है और ऐसा लगता है कि मानव मन जो करता है उसके बहुत करीब है। जब हम नीचे दी गई छवि की तरह एक छवि देखते हैं, तो हम लापता भागों के एक फोटो-यथार्थवादी चित्रण की कल्पना करने में सक्षम नहीं हो सकते हैं, लेकिन हमारा दिमाग उन नकाबपोश क्षेत्रों में क्या हो सकता है, इसका उच्च-स्तरीय प्रतिनिधित्व कर सकता है (उदाहरण के लिए) , दरवाजे, खिड़कियां, आदि)। (मेरा अपना अवलोकन: यह वास्तविक दुनिया की अवधारणाओं के साथ तंत्रिका नेटवर्क में वेक्टर प्रतिनिधित्व को संरेखित करने के उद्देश्य से क्षेत्र में अन्य शोध के साथ अच्छी तरह से जुड़ सकता है।)

मानव-लेबल वाले डेटा पर तंत्रिका नेटवर्क को कम निर्भर बनाने का धक्का स्व-पर्यवेक्षित सीखने की चर्चा में फिट बैठता है, एक अवधारणा जिस पर LeCun काम कर रहा है।

नकाबपोश घर

ऊपर: क्या आप अनुमान लगा सकते हैं कि उपरोक्त छवि में ग्रे बॉक्स के पीछे क्या है?.

पेपर “सिस्टम 2 डीप लर्निंग” को भी छूता है, जो नोबेल पुरस्कार विजेता मनोवैज्ञानिक डैनियल कन्नमैन से उधार लिया गया शब्द है। सिस्टम 2 मस्तिष्क के कार्यों के लिए खाता है जिसमें सचेत सोच की आवश्यकता होती है, जिसमें प्रतीक हेरफेर, तर्क, बहु-चरण योजना और जटिल गणितीय समस्याओं को हल करना शामिल है। सिस्टम 2 डीप लर्निंग अभी भी अपने शुरुआती चरण में है, लेकिन अगर यह एक वास्तविकता बन जाती है, तो यह तंत्रिका नेटवर्क की कुछ प्रमुख समस्याओं को हल कर सकती है, जिसमें आउट-ऑफ-डिस्ट्रीब्यूशन सामान्यीकरण, कारण अनुमान, मजबूत ट्रांसफर लर्निंग और प्रतीक हेरफेर शामिल हैं।

वैज्ञानिक “तंत्रिका नेटवर्क पर काम का भी समर्थन करते हैं जो वस्तुओं और उनके भागों के संदर्भ के आंतरिक फ्रेम प्रदान करते हैं और ज्यामितीय संबंधों का उपयोग करके वस्तुओं को पहचानते हैं।” यह “कैप्सूल नेटवर्क” का एक संदर्भ है, अनुसंधान का एक क्षेत्र हिंटन ने पिछले कुछ वर्षों में ध्यान केंद्रित किया है। कैप्सूल नेटवर्क का उद्देश्य तंत्रिका नेटवर्क को छवियों में सुविधाओं का पता लगाने से लेकर वस्तुओं का पता लगाने, उनके भौतिक गुणों और एक दूसरे के साथ उनके पदानुक्रमित संबंधों तक अपग्रेड करना है। कैप्सूल नेटवर्क “सहज भौतिकी” के साथ गहन शिक्षा प्रदान कर सकते हैं, एक ऐसी क्षमता जो मनुष्यों और जानवरों को त्रि-आयामी वातावरण को समझने की अनुमति देती है।

“तंत्रिका नेटवर्क को वास्तव में प्रभावी बनाने के तरीके के बारे में हमारी समझ के संदर्भ में अभी भी एक लंबा रास्ता तय करना है। और हम उम्मीद करते हैं कि मौलिक रूप से नए विचार होंगे, ”हिंटन ने एसीएम को बताया।

बेन डिक्सन एक सॉफ्टवेयर इंजीनियर और TechTalks के संस्थापक हैं। वह प्रौद्योगिकी, व्यापार और राजनीति के बारे में लिखते हैं।

यह कहानी मूल रूप से Bdtechtalks.com पर प्रकाशित हुई थी। कॉपीराइट 2021

वेंचरबीट

वेंचरबीट का मिशन तकनीकी निर्णय लेने वालों के लिए परिवर्तनकारी तकनीक और लेन-देन के बारे में ज्ञान हासिल करने के लिए एक डिजिटल टाउन स्क्वायर बनना है।

जब आप अपने संगठनों का नेतृत्व करते हैं तो हमारा मार्गदर्शन करने के लिए हमारी साइट डेटा तकनीकों और रणनीतियों पर आवश्यक जानकारी प्रदान करती है। हम आपको हमारे समुदाय का सदस्य बनने के लिए आमंत्रित करते हैं:

  • आपकी रुचि के विषयों पर अप-टू-डेट जानकारी
  • हमारे समाचार पत्र
  • गेटेड विचार-नेता सामग्री और हमारे बेशकीमती आयोजनों के लिए रियायती पहुंच, जैसे कि रूपांतरण 2021: और अधिक जानें
  • नेटवर्किंग सुविधाएँ, और बहुत कुछ

सदस्य बने

Leave a Reply

Your email address will not be published. Required fields are marked *