डीपमाइंड के नुकसान और कृत्रिम बुद्धिमत्ता का भविष्य


वर्णमाला का दीपमिन्द हार गया पिछले साल $ 572 मिलियन। इसका क्या मतलब है?

दुनिया के सबसे बड़े शोध-केंद्रित कृत्रिम बुद्धिमत्ता ऑपरेशन की संभावना वाले दीपमिन्द को पिछले तीन वर्षों में बहुत तेजी से $ 1 बिलियन से अधिक धन की हानि हो रही है। अगले 12 महीनों में डीपमाइंड पर भी 1 बिलियन डॉलर से अधिक का कर्ज है।

क्या इसका मतलब यह है कि एआई अलग हो रहा है?

वायर्ड अभियान

के बारे में

गैरी मार्कस रॉबस्ट.एवाई के संस्थापक और सीईओ हैं और NYU में मनोविज्ञान और तंत्रिका विज्ञान के प्रोफेसर हैं। वह लेखक हैं, आगामी के अर्नेस्ट डेविस के साथ रिबूटिंग एआई: बिल्डिंग आर्टिफिशियल इंटेलिजेंस वी कैन ट्रस्ट

हर्गिज नहीं। शोध में पैसा खर्च होता है, और दीपमिन्द हर साल अधिक शोध कर रहे हैं। इसमें शामिल डॉलर बड़े हैं, शायद किसी भी पिछले एआई रिसर्च ऑपरेशन की तुलना में अधिक, लेकिन विज्ञान की सबसे बड़ी परियोजनाओं में से कुछ में खर्च किए गए रकम की तुलना में यह अभूतपूर्व है। लार्ज हैड्रॉन कोलाइडर की कीमत प्रति वर्ष $ 1 बिलियन जैसी होती है और हिग्स बोसोन की खोज की कुल लागत $ 10 बिलियन से अधिक आंकी गई है। निश्चित रूप से, वास्तविक मशीन बुद्धिमत्ता (जिसे कृत्रिम सामान्य बुद्धिमत्ता के रूप में भी जाना जाता है), एक प्रकार की शक्ति जो एक शक्ति होगी स्टार ट्रेक-जैसे कंप्यूटर, सामान्य अंग्रेजी में होने वाले सभी प्रकार के प्रश्नों का विश्लेषण करने में सक्षम, उससे कहीं अधिक मूल्य का होगा।

फिर भी, डीपमाइंड के घाटे की बढ़ती मात्रा पर विचार करने योग्य है: 2016 में 154 मिलियन डॉलर, 2017 में $ 341 मिलियन, 2018 में $ 572 मिलियन। मेरे विचार में, तीन केंद्रीय प्रश्न हैं: क्या दीपमिन्द वैज्ञानिक रूप से सही रास्ते पर है? क्या इस परिमाण की ध्वनि वर्णमाला के दृष्टिकोण से है? और नुकसान सामान्य रूप से एआई को कैसे प्रभावित करेगा?

पहले सवाल पर, संदेह का कारण है। डीपमाइंड अपने अधिकांश अंडे एक टोकरी में डाल रहा है, एक तकनीक जिसे गहन सुदृढीकरण सीखने के रूप में जाना जाता है। वह तकनीक जोड़ती है ध्यान लगा के पढ़ना या सीखना, मुख्य रूप से पैटर्न को पहचानने के लिए उपयोग किया जाता है सुदृढीकरण सीखना, इनाम के संकेतों के आधार पर सीखने के लिए तैयार किया जाता है, जैसे कि खेल में स्कोर या शतरंज जैसे खेल में जीत या हार।

DeepMind ने 2013 में तकनीक को एक रोमांचक पेपर में अपना नाम दिया, जिसमें दिखाया गया कि कैसे एक एकल तंत्रिका नेटवर्क प्रणाली को विभिन्न अटारी खेल खेलने के लिए प्रशिक्षित किया जा सकता है, जैसे फैलना तथा अंतरिक्ष आक्रमणकारी, साथ ही, या मनुष्यों की तुलना में बेहतर है। यह पेपर एक इंजीनियरिंग टूर डी फोर्स था, और संभवतः दीपमाइंड की Google को जनवरी 2014 की बिक्री में एक प्रमुख उत्प्रेरक। तकनीक के आगे बढ़ने से गो और कंप्यूटर गेम में दीपमिन्द की प्रभावशाली जीत को बढ़ावा मिला है स्टार क्राफ्ट

परेशानी यह है कि तकनीक संकीर्ण परिस्थितियों के लिए बहुत विशिष्ट है। खेलने में फैलना, उदाहरण के लिए, छोटे परिवर्तन- जैसे कुछ पिक्सल्स को पैडल हिलाना-प्रदर्शन में नाटकीय गिरावट का कारण बन सकता है। DeepMind के स्टार क्राफ्ट परिणाम समान रूप से सीमित थे, बेहतर-से-मानव परिणामों के साथ जब एक एकल मानचित्र पर खेला जाता है, जो चरित्र के एकल "रेस" के साथ होता है, लेकिन विभिन्न मानचित्रों पर और विभिन्न पात्रों के साथ खराब परिणाम होता है। वर्ण स्विच करने के लिए, आपको सिस्टम को खरोंच से पीछे हटाना होगा।

कुछ मायनों में, गहन सुदृढीकरण सीखना एक प्रकार का टर्बोचार्ज मेमोराइजेशन है; सिस्टम जो इसका उपयोग करते हैं वे भयानक कारनामों में सक्षम हैं, लेकिन उनके पास केवल उथली समझ है कि वे क्या कर रहे हैं। नतीजतन, वर्तमान प्रणालियों में लचीलेपन की कमी होती है, और इस तरह अगर दुनिया बदलती है, तो कभी-कभी छोटे तरीकों से भी इसकी भरपाई करने में असमर्थ हैं। (किडनी की बीमारी के साथ डीपमाइंड के हालिया परिणामों पर इसी तरह से सवाल उठाए गए हैं।)

डीप रीइन्फोर्समेंट लर्निंग को भी भारी मात्रा में डेटा की आवश्यकता होती है, जैसे, गो के लाखों सेल्फ-प्ले गेम्स। मानव की तुलना में गो में विश्व स्तर का बनना आवश्यक है, और अक्सर कठिन या महंगा। यह Google-पैमाने के कंप्यूटर संसाधनों के लिए एक आवश्यकता लाता है, जिसका अर्थ है कि कई वास्तविक दुनिया की समस्याओं में, अधिकांश उपयोगकर्ताओं के लिए अकेले कंप्यूटर का समय बहुत महंगा होगा। एक अनुमान के अनुसार, अल्फा गो के प्रशिक्षण समय की लागत $ 35 मिलियन है; इसी अनुमान ने 12,760 मानव दिमागों द्वारा उपभोग की गई ऊर्जा की मात्रा की तुलना बिना नींद के तीन दिनों तक लगातार की।

लेकिन यह सिर्फ अर्थशास्त्र है। असली मुद्दा, अर्नेस्ट डेविस के रूप में और मैं हमारी आगामी पुस्तक में बहस करते हैं एआई को रिबूट करना, भरोसा है। अभी के लिए, गहन सुदृढीकरण सीखना केवल उन वातावरणों पर भरोसा किया जा सकता है जो कुछ आश्चर्य के साथ अच्छी तरह से नियंत्रित होते हैं; 2,000 वर्षों में गो- न तो बोर्ड के लिए ठीक काम करता है और न ही नियम बदले गए हैं – लेकिन आप कई वास्तविक दुनिया की स्थितियों में इस पर भरोसा नहीं करना चाहते हैं।

छोटी व्यावसायिक सफलता

भाग में, क्योंकि कुछ वास्तविक दुनिया की समस्याएं उन खेलों के लिए विवश हैं, जिन पर दीपमिन्द ने ध्यान केंद्रित किया है, दीपमिन्द ने अभी तक गहन सुदृढीकरण सीखने के किसी भी बड़े पैमाने पर वाणिज्यिक आवेदन को नहीं पाया है। अब तक अल्फाबेट ने लगभग $ 2 बिलियन (2014 में $ 650 मिलियन खरीद मूल्य सहित) का निवेश किया है। प्रत्यक्ष वित्तीय रिटर्न, प्रचार की गणना नहीं, पिछले साल लगभग 125 मिलियन राजस्व की तुलना में मामूली रहा है, जिनमें से कुछ Google के सर्वरों को ठंडा करने के लिए बिजली की लागत को कम करने के लिए वर्णमाला के भीतर गहरी सुदृढीकरण सीखने को लागू करने से आए थे।

गहन सुदृढीकरण सीखना ट्रांजिस्टर की तरह हो सकता है, एक शोध आविष्कार जिसने दुनिया को बदल दिया, या यह "समस्या की तलाश में समाधान" हो सकता है।

गो के लिए जो काम करता है वह चुनौतीपूर्ण समस्याओं के लिए काम नहीं कर सकता है जो दीपमिन्द एआई के साथ कैंसर और स्वच्छ ऊर्जा की तरह हल करना चाहते हैं। आईबीएम ने इसे कठिन तरीके से सीखा जब इसने जीता कि वाटसन कार्यक्रम को लेने की कोशिश की जियोपार्डी! और इसे चिकित्सा निदान के लिए लागू करें, थोड़ी सफलता के साथ। वॉटसन ने कुछ मामलों में ठीक काम किया और दूसरों पर विफल रहे, कभी-कभी लापता निदान दिल के दौरे की तरह होता है जो कि प्रथम वर्ष के मेडिकल छात्रों के लिए स्पष्ट होगा।

बेशक, यह केवल समय का मुद्दा हो सकता है। डीपमाइंड कम से कम 2013 से गहन सुदृढीकरण सीखने के साथ काम कर रहा है, शायद अब, लेकिन वैज्ञानिक प्रगति शायद ही कभी रात भर उत्पाद में बदल जाती है। डीपमाइंड या अन्य को अंततः गहन सुदृढीकरण सीखने के साथ गहरे, अधिक स्थिर परिणामों का उत्पादन करने का एक तरीका मिल सकता है, शायद इसे अन्य तकनीकों के साथ एक साथ लाकर – या वे नहीं कर सकते हैं। डीप रीइन्फोर्समेंट लर्निंग अंततः ट्रांजिस्टर की तरह साबित हो सकती है, एक कॉर्पोरेट लैब का एक शोध आविष्कार जिसने पूरी दुनिया को बदल दिया, या यह अकादमिक जिज्ञासा की तरह हो सकता है जिसे जॉन मेनार्ड स्मिथ ने एक बार "समस्या की तलाश में समाधान" के रूप में वर्णित किया था। मेरा व्यक्तिगत अनुमान है कि यह बीच में कहीं एक उपयोगी और व्यापक उपकरण बन जाएगा, लेकिन विश्व-परिवर्तक नहीं।

किसी को भी डीपमाइंड की गिनती नहीं करनी चाहिए, भले ही इसकी मौजूदा रणनीति कम उपजाऊ हो, लेकिन कई लोगों ने उम्मीद की है। डीप रीइन्फोर्समेंट लर्निंग आर्टिफिशियल जनरल इंटेलिजेंस के लिए शाही सड़क नहीं हो सकती है, लेकिन डीपमाइंड स्वयं एक दुर्जेय ऑपरेशन है, कसकर चलता है और अच्छी तरह से वित्त पोषित है, जिसमें सैकड़ों पीएचडी हैं। गो, अटारी, और में सफलताओं से उत्पन्न प्रचार स्टार क्राफ्ट कभी अधिक प्रतिभा को आकर्षित करें। यदि एआई शिफ्ट में हवाएँ चलती हैं, तो दीपमिन्द को एक अलग दिशा में निपटने के लिए अच्छी तरह से रखा जा सकता है। यह स्पष्ट नहीं है कि कोई भी इसका मिलान कर सकता है।

इस बीच, वर्णमाला के बड़े संदर्भ में, प्रति वर्ष $ 500 मिलियन एक बड़ा दांव नहीं है। अल्फाबेट ने (बुद्धिमानी से) एआई पर अन्य दांव लगाए, जैसे कि गूगल ब्रेन, जो खुद तेजी से बढ़ रहा है। वर्णमाला विभिन्न तरीकों से अपने एआई पोर्टफोलियो के संतुलन को बदल सकती है, लेकिन $ 100 बिलियन-वर्ष की राजस्व कंपनी में जो एआई को खोज से लेकर विज्ञापन की सिफारिश तक सब कुछ पर निर्भर करती है, यह अल्फाबेट के लिए कई महत्वपूर्ण निवेश करने के लिए पागल नहीं है।

ओवरप्रोमाइजिंग की चिंता

दीपमाइंड का अर्थशास्त्र एआई को सामान्य रूप से कैसे प्रभावित करेगा, इसका अंतिम प्रश्न, उत्तर देना कठिन है। यदि प्रचार डिलीवरी से अधिक हो जाता है, तो यह "एआई सर्दियों" पर ला सकता है, जहां समर्थकों को निवेश करने के लिए घृणा होती है। निवेश समुदाय महत्वपूर्ण नुकसान को नोटिस करता है; यदि दीपमिन्द की हानियाँ हर साल लगभग दोगुनी होती रही, तो भी वर्णमाला अंततः खींचने के लिए मजबूर हो सकती है। और यह सिर्फ पैसा नहीं है। इस प्रकार अब तक मूर्त वित्तीय परिणामों की कमी भी है। कुछ बिंदु पर, निवेशकों को एआई के लिए अपने उत्साह को फिर से भरने के लिए मजबूर किया जा सकता है।

यह सिर्फ दीपमिन्द नहीं है। कई अग्रिमों ने कुछ साल पहले वादा किया था – जैसे कि कारें जो अपने दम पर ड्राइव कर सकती हैं या चैटबॉट्स जो बातचीत को समझ सकते हैं – अभी तक भौतिक नहीं हुए हैं। मार्क जुकरबर्ग के अप्रैल 2018 में कांग्रेस से वादा किया गया है कि एआई जल्द ही नकली समाचार समस्या को हल करेगा, पहले से ही डेविस और मैंने भविष्यवाणी की थी। बोलना आसान है; एआई के लिए उत्साह की अंतिम डिग्री इस बात पर निर्भर करेगी कि क्या दिया गया है।

अभी के लिए, वास्तविक मशीन इंटेलिजेंस का निर्माण करने की तुलना में प्रचार करना आसान हो गया है। जबकि विज्ञापन और भाषण मान्यता जैसे सीमित डोमेन में काफी प्रगति हुई है, एआई निर्विवाद रूप से अभी भी एक लंबा रास्ता तय करना है। बड़े डेटा सेट के ध्वनि विश्लेषण से लाभ से इनकार नहीं किया जा सकता है; सीमित रूप में भी, AI पहले से ही एक शक्तिशाली उपकरण है। एआई के बारे में कॉरपोरेट दुनिया में कम तेजी हो सकती है, लेकिन यह पूरी तरह से बाहर खींचने के लिए बर्दाश्त नहीं कर सकता है।

मेरा अपना अनुमान?

अब से दस साल बाद हम यह निष्कर्ष निकालेंगे कि 2010 के अंत में गहरी सुदृढीकरण सीखने को खत्म कर दिया गया था, और यह कि कई अन्य महत्वपूर्ण शोध सिद्धांतों की उपेक्षा की गई थी। सुदृढीकरण सीखने में निवेश किया गया प्रत्येक डॉलर कहीं और निवेश नहीं किया गया डॉलर है, जब उदाहरण के लिए, मानव संज्ञानात्मक विज्ञान से अंतर्दृष्टि मूल्यवान सुराग प्राप्त कर सकती है। मशीन लर्निंग के शोधकर्ता अब अक्सर पूछते हैं, "बड़ी मात्रा में डेटा का उपयोग करके मशीन जटिल समस्याओं का अनुकूलन कैसे कर सकती है?" हम यह भी पूछ सकते हैं, "बच्चे भाषा कैसे प्राप्त करते हैं और दुनिया को समझने के लिए आते हैं, वर्तमान एआई सिस्टम की तुलना में कम शक्ति और डेटा का उपयोग करते हैं। ? ”यदि हम पूर्व की तुलना में बाद के प्रश्न पर अधिक समय, धन और ऊर्जा खर्च करते हैं, तो हम बहुत जल्द कृत्रिम सामान्य बुद्धि प्राप्त कर सकते हैं।


अधिक महान WIRED कहानियां