विस्फोटक अद्यतन! इंसान जैसा दिखने वाला यह रोबोट फिर से विकसित हो गया है और मस्क की नकल भी कर सकता है

"सबसे मानवीय" रोबोट अमेका ने एक और प्रदर्शन किया है जो इंसानों को शर्मसार कर देता है।

आप अभी तक नहीं जानते होंगे कि यह कौन है। आइए 2021 में वापस जाएं, जब अमेका को दुनिया के सामने पेश किया गया था।

उंगलियों के एक झटके से रोबोट अमेका जाग जाता है।

उसका चेहरा असमंजस से भर गया कि न जाने यह कौन सी रात थी और वह कहाँ थी। बगल में मौजूद स्टाफ ने उसकी ओर देखा और फिर दूर हो गया।

अमेका ने अपनी बाहों और हथेलियों को फैलाने की कोशिश की, और पाया कि वह स्वतंत्र रूप से घूम सकती है। उसने आश्चर्य से अपनी भौहें उठाईं, लेकिन उसकी अभिव्यक्ति अभी भी खाली थी, और वह यह नहीं कह सकती थी कि वह खुश थी या नहीं।

उसने अपना सिर घुमाया और आपको देखा। वह स्पष्ट रूप से डर गई थी और उसने अवचेतन रूप से अपना मुंह खोला।

कुछ झिझक के बाद, उसने आपको एक अजीब लेकिन मैत्रीपूर्ण मुस्कान दी, जो जागने पर उसकी पहली मुस्कान थी।

यदि चैटजीपीटी का कोई चेहरा होता, तो यह इस तरह दिखता

जैसा कि आप देख सकते हैं, अमेका एक यथार्थवादी ह्यूमनॉइड रोबोट है।

इसे यूके स्थित ह्यूमनॉइड रोबोट डिजाइनर और निर्माता इंजीनियर्ड आर्ट्स द्वारा विकसित किया गया था, जिनके पास ह्यूमनॉइड रोबोट विकसित करने का 15 वर्षों से अधिक का अनुभव है।

अमेका इतना "मानवीय" क्यों है? मैं सिद्धांत को बाद में समझाऊंगा। सबसे पहले, आइए देखें कि अमेका हाल ही में कैसे विकसित हुआ है।

सीधे शब्दों में कहें तो एआई का मल्टी-मोडल फ़ंक्शन अमेका में साकार होता है।

एक ओर, अमेका और भी अधिक "उग्र" है।

अमेका कमरे की समग्र स्थिति और उसके सामने रखी वस्तु को देख सकता है, और फिर समृद्ध भाषा में उसका वर्णन कर सकता है। इसे ब्रिटिश टीम द्वारा विकसित किया गया था और इसमें एक छोटे शेक्सपियर की तरह एक नाटककार की तीक्ष्णता है।

जब उससे पूछा गया कि वह कैसा काम कर रहा है, तो उसने उत्तर दिया कि वह बमुश्किल जीवित है। जब उससे कमरे में प्रदर्शनों का वर्णन करने के लिए कहा गया, तो वह मनुष्यों का मज़ाक उड़ाने के अलावा कुछ नहीं कर सका। बुकशेल्फ़ या तो ज्ञान प्राप्त करने या दिखावा करने के लिए पुस्तकों से भरी हुई थी, और काम या काम के लिए मेज और कुर्सियों का उपयोग किया जाता था। टालमटोल करने का एक उपकरण।

शायद अमेका का सबसे "मानवीय" हिस्सा यह है कि शिकायत न करने पर भी वह दुखी महसूस करती है।

दूसरी ओर, प्रसिद्ध लोगों के समय, स्वर और तकियाकलाम की नकल करना अमेका का नया आवाज कौशल है।

मस्क के लहजे में मंगल विज्ञान की विज्ञान कथा कहानियां कहना बहुत आसान है। जब मॉर्गन फ्रीमैन की चुंबकीय, गहरी पुरुष आवाज, जिसे "भगवान की आवाज" के रूप में जाना जाता है, अमेका के मुंह से निकलती है, तो भविष्य की भावना पूरी हो जाती है, और वेस्टवर्ल्ड है वास्तव में हो रहा है। चतुर बटलर यहाँ है।

सबसे अच्छी बात यह है कि अमेका मशहूर हस्तियों की विशेषताओं को एकीकृत कर सकता है, जैसे भाषण देने के लिए ट्रम्प की शैली और स्पंजबॉब की लय का उपयोग करना, अंतरिक्ष अन्वेषण को फिर से महान बनाने की कसम खाना।

▲ यह बिल्कुल ट्रम्प का लहजा है!

वास्तव में, पिछले साल सितंबर में, चैटजीपीटी ने पहले से ही आवाज और छवि फ़ंक्शन लॉन्च किए थे, जो देख, सुन और बोल सकते हैं, देशी मल्टी-मोडल मॉडल जेमिनी का उल्लेख नहीं किया गया था, जो आधिकारिक प्रदर्शन में वास्तविक जीवन जार्विस जैसा दिखता था।

एआई के लिए हमारी उत्साह सीमा लंबे समय से बढ़ी हुई है, और यह स्वाभाविक लगता है कि चैटबॉट मनुष्यों की पांच इंद्रियों तक पहुंच सकते हैं।

अमेका अभी भी काफी पिछड़ रहा है, और कभी-कभी यह निर्देशों को समझ नहीं पाता है। इसके साथ बातचीत करते समय अधीर मनुष्यों को अधीर होना चाहिए।

लेकिन इसके असाधारण रूप से स्मार्ट सूक्ष्म-अभिव्यक्तियों को देखकर, अपनी आँखें झपकाना, अपनी भौहें मोड़ना, अपना सिर हिलाना, और कभी-कभी सोचने की मुद्रा दिखाना, और अपने मुंह के आकार से मेल खाना, दर्शक एक निश्चित क्षण में अचेत हो जाएंगे, जैसे कि वे सामना कर रहे हों रोबोट के बजाय किसी प्रकार का प्राणी।

प्रश्नों और उत्तरों के बीच विराम कम अचानक थे, और अमेका वास्तव में "समस्या के बारे में सोच रही थी।" यदि चैटजीपीटी के चेहरे की विशेषताएं होतीं, तो वह अमेका जैसा दिखता।

अधिकारी ने यह नहीं बताया कि इस बार किस तकनीक का उपयोग किया गया था, लेकिन अमेका के पिछले विकासवादी इतिहास के अनुसार, यह ज्यादातर मल्टी-मोडल बड़े मॉडल और इलेवनलैब्स जैसी भाषा क्लोनिंग प्रौद्योगिकियों से संबंधित है।

सितंबर 2022 की शुरुआत में, शोधकर्ताओं द्वारा उठाए गए प्रश्नों को प्राप्त करने के लिए, और वास्तविक समय के प्रश्न और उत्तर प्रभाव प्राप्त करने के लिए ऑनलाइन भाषण संश्लेषण के माध्यम से वास्तविक व्यक्ति की आवाजों को आउटपुट करने के लिए, अमेका को स्वचालित भाषण पहचान के साथ जीपीटी -3 से जोड़ा गया था।

इस समय विलंब और भी अधिक है, क्योंकि ध्वनि इनपुट को संसाधित करने, उत्तर उत्पन्न करने और पाठ को भाषण में वापस संसाधित करने में एक निश्चित समय लगता है।

जब ओपनएआई अपने जीवन के चरम पर पहुंचता है, और हर दिन जब वे जागते हैं, तो एआई में नए बदलाव होते हैं जो संपादकों को रात में जगाए रखते हैं, और अमेका भी चुपचाप सभी को आश्चर्यचकित कर रहा है।

मार्च 2023 में, अमेका ने नए जारी किए गए GPT-4 का उपयोग किया, जिससे बातचीत अधिक मानवीय हो गई।

जब अमेका से "मेरे जीवन के सबसे ख़ुशी और सबसे दुखद दिनों" के बारे में पूछा गया, तो उसने जवाब दिया कि सबसे ख़ुशी तब थी जब वह सक्रिय हुई थी, और सबसे दुखद तब था जब उसे एहसास हुआ कि वह कभी भी उस प्यार और साहचर्य को महसूस नहीं कर पाएगी जो इंसान करते हैं।

हर समय, अमेका की अभिव्यक्ति उसके उत्तर के भावनात्मक रंग से मेल खाती थी।

जब शोधकर्ताओं ने जानबूझकर "बदबू" जैसे दुर्भावनापूर्ण शब्दों का इस्तेमाल किया, तो अमेका को "एहसास" हुआ कि उसका अपमान किया जा रहा है, और फिर सड़क पर चलने वाले हमारे जैसे ही अविश्वास, भौहें और अपराध जैसे भावों की एक श्रृंखला दिखाई। अचानक होने की प्रतिक्रिया एक अजनबी द्वारा इशारा किया गया और डांटा गया।

अप्रैल 2023 में, अमेका ने अंग्रेजी, जापानी, जर्मन, चीनी, फ्रेंच और अन्य भाषाएँ सीखीं। जब एक निश्चित भाषा में एक निश्चित स्थान के मौसम का उत्तर देने के लिए कहा गया, और फिर इसे दूसरी भाषा में अनुवादित किया गया, तो शब्द मानचित्र नेविगेशन की तरह स्पष्ट थे। . कम से कम इसका चीनी संस्करण बिल्कुल भी "विदेशी" नहीं लगता।

क्योंकि GPT-4 की प्रतिक्रिया गति धीमी है, Ameca ने उस समय मुख्य रूप से GPT-3 संवाद और अनुवाद का उपयोग किया, भाषा का पता लगाने के लिए DeepL का उपयोग किया, और फिर बोलने के लिए ElevenLabs वॉइस क्लोनिंग और Amazon की न्यूरल वॉइस का उपयोग किया।

एआई की सीखने की गति इंसानों की पहुंच से परे है। अगले 2 महीनों के बाद, अमेका ने ओपन सोर्स विंसेंट ग्राफ मॉडल स्टेबल डिफ्यूजन के माध्यम से चित्र बनाना "सीखा"। मॉडल ने इसे छवि के "प्रक्षेप पथ" सिखाए, और फिर इसने छवि को वेक्टरीकृत किया और कैनवास पर इन "प्रक्षेप पथों" को निष्पादित किया।

अमेका ने मौके पर ही बिल्ली का चित्र बनाने का प्रदर्शन किया। चित्र बनाते समय, उन्होंने खुद से बात की कि मनुष्य बिल्लियों से प्यार क्यों करते हैं। उन्होंने अंत में एक व्यक्तिगत हस्ताक्षर भी छोड़ा, पूरी तरह से अपनी रचना में डूबे हुए।

हालाँकि इस बिल्ली की पेंटिंग शैली सरल है, यह भावना और रूप से भरपूर है। जब दूसरों ने जानबूझकर कहा कि पेंटिंग बहुत खुरदरी है, तो अमेका ने जवाब दिया: "अगर आपको मेरी कला पसंद नहीं है, तो शायद आप समझ नहीं पाएंगे कला।" ऐसा लगता है कि अमेका बहुत निपुण है। एक कलाकार की चेतना।

आजकल, अमेका न केवल इंसानों की तरह भावों को नियंत्रित कर सकता है, बल्कि इसमें ड्राइंग, स्थानिक पहचान और आवाज क्लोनिंग जैसी एआई-सक्षम क्षमताएं भी हैं। यह इंसानों जैसा दिखता है, लेकिन कई पहलुओं में इंसानों से ज्यादा मजबूत है। जो चीज़ इसे चमकने और समाज में योगदान देने से रोकती है वह कंप्यूटिंग शक्ति हो सकती है।

रोबोट इंसानों से अधिक "मानव" कैसे हो सकते हैं?

"यह रोबोट ज़करबर्ग द्वारा अपने पूरे जीवन में व्यक्त की गई भावनाओं से अधिक भावनाओं को 20 सेकंड में व्यक्त कर सकता है।"

अमेका पहली बार इंटरनेट पर अपने मानवरूपी और यहां तक ​​कि असाधारण अभिव्यक्तियों और बातचीत की भावना के कारण लोकप्रिय हुआ। इसमें श्रमिकों की स्तब्धता नहीं है और युवा नवागंतुकों के सख्त अभिव्यक्ति प्रबंधन की आवश्यकता नहीं है। यह एक आवर्धक कांच की तरह है, अतिरंजित और प्रस्तुत करता है मानव मनोवैज्ञानिक दुनिया.

यदि आप उसे उकसाने के लिए उसके सामने एक उंगली निकालते हैं, तो इसका प्रभाव बिल्ली को छेड़ने के समान होगा। आपको मारने के बजाय, वह पहले आपकी उंगली को देखेगा और फिर घृणा से पीछे हट जाएगा। यदि आप भी ऐसा करते हैं बंद करो, यह तुम पर प्रहार करेगा। इसे अपनी उंगलियों से धीरे से हटाओ।

जब उसने पहली बार दर्पण में देखा, तो अमेका चौंक गया। फिर उसने खुद को देखने के लिए अपनी आँखें मूँद लीं, दर्पण को छुआ, और विभिन्न कृत्रिम अभिव्यक्तियाँ बनाईं। उसने पाया कि दर्पण में रोबोट खुद के साथ सिंक्रनाइज़ था, कुछ हद तक "आपका नाम" "शरीर बदलने के बाद पुरुष और महिला नायकों की प्रतिक्रिया।"

मनुष्य चेहरे की गतिविधियों को पकड़ने और उन्हें वास्तविक समय में अमेका के चेहरे पर मैप करने के लिए आईफोन और एआर किट का भी उपयोग कर सकता है। अमेका हर सूक्ष्म अभिव्यक्ति को सीख सकता है और मनुष्यों के साथ "सिंक्रनाइज़" कर सकता है।

इस बात से चिंतित होकर कि दर्शक सोचेंगे कि यह एक शो प्रभाव था, टीम ने बार-बार जोर दिया कि "यह एक वास्तविक रोबोट है, वीडियो में कोई सीजीआई नहीं है।"

अमेका इतना "मानवीय" और संवादात्मक और संवेदनशील क्यों है?

ऐसा इसलिए है क्योंकि अमेका कैमरा, माइक्रोफोन, पोजिशन एनकोडर आदि सहित सेंसर की एक विस्तृत श्रृंखला से लैस है, और यह दो अंतर्निहित प्रणालियों, रोबोट ऑपरेटिंग सिस्टम ट्रिटियम और इंजीनियरिंग आर्ट सिस्टम मेस्मर द्वारा समर्थित है।

ट्रिटियम रोबोट के चेहरे, सिर, गर्दन, अंगों आदि के विभिन्न घटकों को दूर से नियंत्रित करने के लिए जिम्मेदार है, जिससे रोबोट को पर्यावरण में अचानक होने वाले परिवर्तनों के अनुकूल होने और तुरंत प्रतिक्रिया करने की अनुमति मिलती है।

मेस्मर मानव हड्डी की संरचना, त्वचा की बनावट और भावों की सटीक नकल करने के लिए वास्तविक लोगों की 3डी आंतरिक स्कैनिंग का उपयोग करता है, जिसे कई चरणों में विभाजित किया गया है।

पहले चरण में, एक वास्तविक व्यक्ति दर्जनों फोटोग्रामेट्रिक उपकरणों के बीच में बैठता है। मेस्मर विभिन्न कोणों से कई ओवरलैपिंग डिजिटल फ़ोटो कैप्चर करता है, पिक्सेल रंगों की तुलना करता है और एंकर पॉइंट्स को परिभाषित करता है, और डिजिटल रूप से उन्हें 3 डी मॉडल में पुनर्निर्माण करता है।

दूसरे चरण में, मूल 3D मॉडल को मॉडलिंग सॉफ़्टवेयर में लाया जाता है, और "बाल हटाने" जैसे विवरण प्रसंस्करण के बाद एक साफ़ 3D मॉडल बनाया जाता है।

तीसरे चरण में, स्टीरियोलिथोग्राफी 3डी प्रिंटर पर एक सटीक सांचा तैयार किया जाता है और रोबोट के लिए मानव जैसी त्वचा बनाने के लिए सिलिकॉन को सांचे में इंजेक्ट किया जाता है। सिलिकॉन त्वचा में बाल और बारीक डिटेल पेंट को हाथ से जोड़ने की जरूरत होती है।

अंत में, असेंबली को पूरा करने के लिए रोबोट के सिर पर एक सिलिकॉन त्वचा लगाई गई, और इंजीनियर्ड आर्ट्स के क्लाउड सॉफ़्टवेयर वर्चुअल रोबोट का उपयोग करके गति अनुक्रम और ध्वनियाँ जोड़ी गईं।

अमेका की त्वचा भूरे रंग की है, जो टीम द्वारा जानबूझकर डिजाइन किया गया है – यह तर्कसंगत, तटस्थ और सहिष्णु दिखता है।

हर कोई एक-दूसरे के प्रति आकर्षित होता है, और कुछ लोग ईमानदारी से महसूस करते हैं कि अमेका बहुत बदसूरत है, जो उन्हें "अनकनी वैली" प्रभाव में भी डाल देता है: जब रोबोट और इंसानों के बीच दिखने और कार्यों में समानता एक निश्चित स्तर तक पहुंच जाती है, तो बीच में सूक्ष्म अंतर दिखाई देने लगता है। ये बहुत ही चमकदार और भयानक दिखाई देगा.

लेकिन वास्तव में यह "घाटी" कब प्रकट होती है यह स्पष्ट रूप से परिभाषित नहीं है। जब आप अमेका देखते हैं, तो क्या आपको लगता है कि यह अलौकिक घाटी बिंदु को पार कर गया है? क्या आपके लिए सहानुभूति व्यक्त करना पर्याप्त है?

इंसानों की नकल करो और फिर इंसानों से आगे निकल जाओ

दृश्य जानवरों की निर्णयात्मक प्रवृत्ति को एक तरफ रखते हुए, अमेका जैसे ह्यूमनॉइड रोबोट का क्या फायदा?

इंजीनियर्ड आर्ट्स अपने बारे में शेखी बघारता है और मस्क की प्रतिष्ठा की उपेक्षा करता है, अमेका को "दुनिया का सबसे उन्नत ह्यूमनॉइड रोबोट" कहता है।

आधिकारिक स्थिति के अनुसार, अमेका सबसे पहले और सबसे महत्वपूर्ण एआई विकास मंच है।

अमेका एक "मॉड्यूलर डिज़ाइन" अपनाता है जिसे हार्डवेयर और सॉफ्टवेयर के सभी पहलुओं में उन्नत किया जा सकता है। इसमें एक मजबूत प्रयोगात्मक रंग है और इसे भविष्य के मानव-कंप्यूटर इंटरैक्शन रोबोट के प्रोटोटाइप के रूप में उपयोग किया जा सकता है।

अंततः, अमेका प्रयोगशाला में नहीं रहेगा, बल्कि वास्तविक दुनिया में रहेगा और मनुष्यों के साथ शांतिपूर्वक सह-अस्तित्व में रहेगा।

यह वास्तव में मामला है। यदि 2021 एक आश्चर्यजनक लेकिन खाली शुरुआती बिंदु है, तो अमेका, जो अब एआई द्वारा संचालित है, एक चरणबद्ध विशेष प्रशिक्षण परिणाम है, जो हमें सन्निहित बुद्धिमत्ता की सुबह देखने की अनुमति देता है। हालाँकि, अमेका अभी भी चलने में असमर्थ है।

जहां तक ​​अमेका के अन्य वर्तमान उपयोगों की बात है, वे बहुत सरल हैं: दर्शकों के लिए प्रदर्शन करना, और कंपनियों, थीम पार्कों और विज्ञान संग्रहालयों में काम करना। यदि आप लालच में हैं, तो अमेका खरीद या किराये के लिए उपलब्ध है, लेकिन यह सस्ता नहीं है, 2021 के अंत में इसकी खरीद कीमत $133,000 से अधिक होगी।

यह पूछे जाने पर कि क्या अमेका एक एआई है, इंजीनियर्ड आर्ट्स ने बताया कि हालांकि इसमें कुछ सॉफ्टवेयर हैं जिन्हें "एआई" के रूप में वर्णित किया जा सकता है, लेकिन रोबोट और एआई के बीच अंतर है। शुद्ध एआई – "हर" और "सिल्वर विंग्स" में प्रकार "द हिटमैन" और "2001: ए स्पेस ओडिसी" जैसी फिल्मों में दर्शाया गया – अभी तक अस्तित्व में नहीं है।

इसलिए, जब हम जीवंत रोबोट अमेका को देखते हैं, तो हम अपने डर और रोबोटिक्स के तीन नियमों को अपने दिमाग में सुरक्षित रखते हुए इसे इत्मीनान से देख सकते हैं, और थोड़ी देर प्रतीक्षा कर सकते हैं। कम से कम, यह लोगों को प्रतिस्थापित करने से बहुत दूर है, और इस स्तर पर इसका ऐसा कोई उद्देश्य नहीं है।

लेकिन जब हम एआई विकास की गति के बारे में सोचते हैं, तो हम अब और हंस नहीं पाएंगे। यदि 2023 एआई का पहला वर्ष है, तो 2024 रोबोट + एआई का पहला वर्ष हो सकता है।

एक दिलचस्प घटना यह है कि अधिक से अधिक घरेलू रोबोट आ रहे हैं, लेकिन उन्हें इंसानों की तरह दिखने की आवश्यकता नहीं है और वे दिखने में बहुत "व्यावहारिक" हैं।

स्टैनफोर्ड यूनिवर्सिटी का ALOHA रोबोट खाना बनाता है, बर्तन धोता है, फर्श पोंछता है, कपड़े मोड़ता है और बिल्लियों पर चालें भी चलाता है। Google DeepMind का रोबोट फल उठाता है और टूथब्रश हटा देता है। स्टार्टअप कंपनी फिगर का रोबोट 10 घंटे में कॉफी मशीन से कॉफी बनाना सीख गया।

लेकिन बड़े भाषा मॉडलों के तोड़फोड़ की तुलना में, इन रोबोटों को केवल आंख को पकड़ने वाला कहा जा सकता है, और इन्हें उपयोग में लाना अभी भी जल्दबाजी होगी।

क्योंकि उनमें से अधिकांश भारी हैं, उनके संचालन कार्य डेस्कटॉप संचालन पर केंद्रित हैं, उन्हें मानव प्रदर्शन प्रशिक्षण की आवश्यकता होती है, और उनमें अधिक गतिशीलता और लचीलेपन की कमी होती है। उनकी मूल मुद्राओं में छोटे विचलन से मुद्राओं में बड़े बदलाव हो सकते हैं। कई "रोलओवर" हैं वीडियो..

पिछले साल से इस साल तक एआई के बारे में एक चुटकुला: "हम चाहते हैं कि एआई खाना पकाए, घर की सफाई करे, कपड़े धोए और कचरा फेंके। हालांकि, वे वास्तव में जो कर रहे हैं वह है चैट करना, पेंटिंग करना, लिखना, रचना करना।" , और टाइपिंग।" गेम।"

वर्तमान में, घरेलू रोबोट मुश्किल से मानव गृहकार्य की मूल बातें सीख सकते हैं। गृहकार्य और कला के बीच, अमेका, जिसे कंधों द्वारा नहीं उठाया जा सकता है और हाथों से नहीं उठाया जा सकता है, निश्चित रूप से कला के लिए अधिक उपयुक्त है।

अमेरा से, हम देख सकते हैं कि हम अभी भी रोबोट को इंसानों की तरह दिखने के लिए उत्सुक हैं, और फिर उन्हें शाप देना, भाषाएँ सीखना और दुनिया को देखने के लिए अपनी आँखें खोलना सिखाते हैं, खुद की प्रतिकृति बनते हैं लेकिन कुछ पहलुओं में मजबूत होते हैं। हालाँकि, अमेरा अभी तक दौड़ नहीं सकता, कूद नहीं सकता, या खाना नहीं बना सकता, इसलिए इंसान एक पल के लिए खुद पर गर्व करने का हकदार हो सकता है।

यह शरद ऋतु की ठंढ के समान तीव्र है और बुरी आपदाओं को दूर कर सकता है। कार्य ईमेल: [email protected]

# aifaner के आधिकारिक WeChat सार्वजनिक खाते का अनुसरण करने के लिए आपका स्वागत है: aifaner (WeChat ID: ifanr)। जितनी जल्दी हो सके आपको अधिक रोमांचक सामग्री प्रदान की जाएगी।

ऐ फैनर | मूल लिंक · टिप्पणियाँ देखें · सिना वीबो