अल्फ़ागो से पराजित ली सेडोल ने ढही हुई दुनिया के पुनर्निर्माण में 8 साल बिताए

एआई से हारकर मुझे ऐसा लगता है जैसे मेरी पूरी दुनिया ढह गई है।

ली सेडॉल ने न्यूयॉर्क टाइम्स के साथ हाल ही में एक साक्षात्कार में कहा

2016 में, 14 बार के विश्व चैंपियन कोरियाई शतरंज खिलाड़ी ने Google के AlphaGo के खिलाफ एक खेल में मनुष्यों का प्रतिनिधित्व किया, और अंततः 1:4 से हार गए।

जब उन्होंने निमंत्रण स्वीकार किया, तो उन्होंने सोचा कि यह एक "मज़ेदार" अनुभव होगा:

मौज-मस्ती का आधार यह है कि मुझे लगता है कि मैं जीतूंगा। मैंने कभी नहीं सोचा था कि मैं हार जाऊंगा.

चैटजीपीटी में एआई तकनीक की शुरुआत से पहले यह शायद सबसे महत्वपूर्ण हाइलाइट्स में से एक था।

चैटजीपीटी को रिलीज़ हुए अब दो साल से भी कम समय बीत चुका है, हमने देखा है कि कई क्षेत्र एआई से प्रभावित हो रहे हैं, और ऐसा लगता है कि जीवन के और भी पहलुओं में बदलाव की आशंका है। ऐ.

इस संदर्भ में, गो वर्ल्ड, जो अन्य उद्योगों और क्षेत्रों की तुलना में एआई से पहले प्रभावित हुआ था, हमें उस संभावना को देखने में मदद कर सकता है जो पहले ही हो चुकी है।

इंसानों को हराने के बाद, मजबूत एआई और भी अमानवीयकरण कर रहा है

मैं अब गो का आनंद नहीं ले सका, इसलिए मैंने संन्यास ले लिया।

अल्फ़ागो के विरुद्ध खेलने के तीन साल बाद, ली सेडोल ने आधिकारिक तौर पर अपनी सेवानिवृत्ति की घोषणा की।

ली सेडॉल, जिन्होंने 5 साल की उम्र में गो सीखना शुरू किया था, के लिए गो सिर्फ एक प्रतियोगिता नहीं है, बल्कि एक कला है, खिलाड़ी के व्यक्तित्व और शैली का विस्तार है, हालांकि, एआई युग में, इसे "कम" कर दिया गया है एक एल्गोरिथम दक्षता खेल।

इन तीन वर्षों के दौरान वास्तव में एक और चीज़ घटी।

2017 में, डीपमाइंड ने अल्फ़ागो के एक नए संस्करण – अल्फ़ागो ज़ीरो की घोषणा की।

अल्फ़ागो का जन्म तंत्रिका नेटवर्क के मानव स्वामी द्वारा 30 मिलियन से अधिक चालों के सीखने और स्व-अभ्यास से हुआ था, लेकिन अल्फ़ागो ज़ीरो को शुरुआत से ही "मानव स्पर्श" से अलग कर दिया गया था, प्रशिक्षण अवधि के दौरान, यह किसी के संपर्क में नहीं आया मानव शतरंज रिकॉर्ड और पूरी तरह से खुद पर और अपने शतरंज प्रशिक्षण पर निर्भर था।

केवल तीन दिनों में, अल्फ़ागो ज़ीरो ने पहले ही अल्फ़ागो के ख़िलाफ़ 100:0 से जीत हासिल कर ली।

अटलांटिक इसे "एआई" कहता है जिसे इंसानों से कुछ भी सीखने की ज़रूरत नहीं है।

गो में, एक ऐसी तकनीक है जो सरल या महत्वहीन लगती है, लेकिन लंबे समय में घातक खतरा पैदा कर सकती है। कुछ लोग कहेंगे कि यह "भूत" की तरह है।

अल्फ़ागो और अल्फ़ागो ज़ीरो के गेम रिकॉर्ड को समझना इतना कठिन है कि उन्हें सीधे तौर पर "एक विदेशी सभ्यता द्वारा छोड़ा गया एक रहस्यमय गाइड" माना जाता है।

अमेरिकी पेशेवर शतरंज खिलाड़ी माइकल रेडमंड ने 2017 में कहा था कि इंसानों के लिए गो सीखने का एक महत्वपूर्ण साधन एक कहानी बनाना है: "इसी तरह हम संवाद करते हैं। यह एक बहुत ही मानवीय चीज़ है।"

इससे ली सेडॉल की बात भी दोहराई जा सकती है कि शतरंज खेलते समय शतरंज खिलाड़ी इंसान के रूप में अपना एक हिस्सा भी दिखाते हैं।

रेडमंड ने कहा कि उनकी अपनी टिप्पणियों के आधार पर, जब मानव शतरंज खिलाड़ी पहली बार "एआई-फ्लेवर्ड" शतरंज देखते हैं तो उनके "हाथ ऊपर उठाकर आत्मसमर्पण करने" की संभावना होती है:

अल्फ़ागो जिस तरह से शतरंज खेलता है वह हमेशा बहुत "अमानवीय" लगता है, ऐसे शतरंज के खेल का सामना करते हुए, हमारे लिए इसमें शामिल होना और भी मुश्किल है।

प्रभावित होने वाले पहले गो मास्टर्स में से एक के रूप में, ली सेडोल लंबे समय तक जाने नहीं दे सके।

वह एआई के प्रति जुनूनी हो गया।

सेवानिवृत्त होने के बाद, अपनी खुद की गो अकादमी खोलने, किताबें प्रकाशित करने और गो पर आधारित बोर्ड गेम लॉन्च करने के अलावा, ली सेडॉल ने एआई पर व्याख्यान देना भी शुरू किया :

मुझे एआई समस्याओं का सामना बहुत पहले ही करना शुरू हो गया था, और दूसरों को भी इसका अनुभव होगा। इससे सुखद अंत नहीं हो सकता।

उनके लिए एआई का सबसे चिंताजनक पहलू यह है कि यह मानवीय मूल्यों को बदल सकता है:

अतीत में, लोग रचनात्मकता, मौलिकता और नवीनता से आश्चर्यचकित होते थे, लेकिन एआई के आगमन के बाद से, इनमें से अधिकांश गायब हो गए हैं।

इस कथन से हर कोई सहमत नहीं है.

मानव-मशीन सह-निर्माण का युग

एआई ने गो दुनिया में सभी मौजूदा व्यवस्था को नष्ट कर दिया और फिर इसका पुनर्निर्माण करना शुरू कर दिया।

जिउहेंग हे ने कहा, एक गो उत्साही जो कॉर्नेल विश्वविद्यालय में कृत्रिम बुद्धिमत्ता का अध्ययन करता है।

कई गो अकादमियों में, गो सीखने के लिए एआई का उपयोग करना एक ऐसी प्रक्रिया है जिससे लगभग सभी खिलाड़ियों को गुजरना पड़ता है

हांगकांग में एक गो अकादमी में, एनजी ची मैन छात्रों को एआई का उपयोग करके गो सीखने के लिए आईपैड प्रदान करता है।

हर बार जब कोई छात्र शतरंज खेलता है, तो एआई "सर्वश्रेष्ठ चाल" सुझाव दिखाएगा, साथ ही, सिस्टम यह भी रिकॉर्ड करेगा कि छात्र ने कौन सी चाल अच्छी बनाई और कौन सी चाल अच्छी नहीं थी।

पिछले साल, प्रोसीडिंग्स ऑफ द नेशनल एकेडमी ऑफ साइंसेज में प्रकाशित एक अध्ययन में बताया गया था कि जब से एआई ने गो सर्कल में प्रवेश किया है, मानव खिलाड़ियों की निर्णय क्षमता में सुधार हुआ है।

2016 की शुरुआत में, अल्फ़ागो द्वारा ली सेडोल को हराने से पहले, फैन हुई, जिन्होंने एक निजी टेस्ट में अल्फ़ागो के खिलाफ खेला था, को भी ऐसा ही अनुभव हुआ था।

हालाँकि वह हार गए, फैन हुई ने कहा कि अल्फ़ागो ने उन्हें गो को एक नए तरीके से देखने की अनुमति दी, उनके कौशल में सुधार किया और उन्हें विश्व रैंकिंग में तेज़ी से ऊपर चढ़ने की अनुमति दी।

2023 का अध्ययन 1950 से 2021 तक जमा हुए शतरंज रिकॉर्ड पर आधारित है, जिसमें 5.8 मिलियन हाथों का डेटा भी शामिल है।

शोधकर्ताओं ने पाया कि अल्फ़ागो द्वारा ली सेडॉल को हराने से पहले, मानव शतरंज खिलाड़ियों के निर्णय की गुणवत्ता 66 वर्षों तक स्थिर और मूल रूप से अपरिवर्तित रही थी, हालांकि, 2016 और 2017 के दौरान, शतरंज खिलाड़ियों के निर्णय की गुणवत्ता में वृद्धि शुरू हुई।

दूसरे शब्दों में, हालांकि मानव शतरंज खिलाड़ी एआई शतरंज खिलाड़ियों को हराने में सक्षम नहीं हो सकते हैं, लेकिन उनके निर्णय कौशल में वास्तव में सुधार हुआ है।

यह देखना बहुत प्रेरणादायक है कि मानव शतरंज खिलाड़ी कितनी जल्दी इन नई चालों को अपना सकते हैं और अपने तरीकों में शामिल कर सकते हैं।

इन परिणामों से पता चलता है कि मनुष्य इन खोजों को अपनाएंगे और अपनी क्षमता में काफी सुधार करने के लिए उन पर काम करेंगे।

डीपमाइंड के मुख्य अनुसंधान वैज्ञानिक और अल्फ़ागो प्रोजेक्ट के नेता डेविड सिल्वर ने इस शोध पर टिप्पणी की

के जी, जो 2017 में अल्फ़ागो से हार गए थे, ने 2023 में यह भी कहा कि वह प्रतियोगिताओं को छोड़कर शायद ही कभी वास्तविक लोगों के साथ अभ्यास करते हैं, और उनका मानना ​​​​है कि एआई गो में रचनात्मकता का स्रोत भी बन गया है:

रचनात्मकता का मतलब सिर्फ कुछ अलग करना नहीं है। रचनात्मकता को वास्तविक लड़ाई में शामिल किया जाना चाहिए और आजकल गो में अधिकांश नवाचार एआई द्वारा किए जाते हैं, अगर हम कुछ ऐसे गेम खेलना चाहते हैं जो पहले से अलग हों, तो इसकी बहुत अधिक संभावना है कि हम हार जाएंगे क्योंकि एआई बहुत सारी वास्तविक लड़ाई से गुजरता है, और पहले से अलग सोच के साथ आना, यही रचनात्मकता है।

इसके अलावा, एक अन्य पेशेवर शतरंज खिलाड़ी का प्रदर्शन भी विशेष रूप से दिलचस्प है।

कोरियाई शतरंज खिलाड़ी शिन जिन-जिन 2000 के बाद विश्व चैम्पियनशिप जीतने वाले पहले शतरंज खिलाड़ी हैं। शतरंज प्रशंसकों द्वारा उन्हें अक्सर "शेन गोंग इंटेलिजेंस" कहा जाता है क्योंकि वह अपने दीर्घकालिक एआई प्रशिक्षण और अनुसंधान के लिए प्रसिद्ध हैं।

इस साल फरवरी में, शिन जिन-सेओक ने 25वें नोंगशिम कप में चीनी कप्तान गु जिहाओ को हराया, एक ही सीज़न में लगातार छह जीत और सभी सीज़न में लगातार 16 जीत हासिल करते हुए, अपने पूर्ववर्ती ली चांग-हो को पीछे छोड़ दिया। इस साल मार्च में उन्होंने एआई के साथ अपने संबंधों के बारे में बात की :

मुझे ऐसा लगता है कि एआई और मैं अब दोस्त हैं।

मैंने उन एआई के साथ अध्ययन किया जो मुझसे बेहतर थे। एआई और मानव सोच बिल्कुल अलग हैं। एआई गणितीय एल्गोरिदम के माध्यम से समस्याओं को हल करता है। एआई की सोच से सीखने से मुझे बहुत फायदा हुआ है।

अब, चीन, दक्षिण कोरिया और जापान में पेशेवर खिलाड़ी प्रशिक्षण के लिए एआई का उपयोग करेंगे।

"एआई फ्लेवर" सर्वनाश

जेनेरिक एआई के युग की तरह, कुछ डिजाइनरों और लेखकों को उनके कार्यों में निहित तथाकथित "एआई फ्लेवर" के कारण जटिल स्व-प्रमाणन करने की आवश्यकता होती है, जो लंबे समय से एआई के साथ एकीकृत है। "एआई फ्लेवर" के उद्भव से भी विभिन्न मुद्दों का सामना करना पड़ रहा है।

वर्तमान गो गेम में, एआई का उपयोग अक्सर जीत की दर की भविष्यवाणी करने के लिए किया जाता है और एआई सर्वोत्तम चाल की सिफारिश करता है। इसलिए दर्शक खेल देखने की प्रक्रिया में एक प्रकार की "पहल" प्राप्त कर सकते हैं और उनके पास कई देखने के कोण हो सकते हैं।

2022 में, शेन जेनज़ेन के खिलाफ मैच के दौरान, चीनी शतरंज खिलाड़ी ली जुआनहाओ ने कई निर्णय लिए जो एआई के इष्टतम निर्णय द्वारा भविष्यवाणी की गई शीर्ष तीन के अनुरूप थे, इसलिए उनके टीम के साथी यांग डिंगक्सिन ने एआई के साथ धोखाधड़ी के उनके संदेह पर सवाल उठाया

ली जुआनहाओ, जिनका जन्म 1995 में हुआ था, एआई प्रशिक्षण पर "पूरे वर्ष नौ से नौ तक काम करते हैं, और वास्तव में कड़ी मेहनत करते हैं", इसलिए, शतरंज के खेल को कभी-कभी तथाकथित "मशीन स्वाद" के रूप में माना जाता है।

संदेह के संबंध में, चीनी गो एसोसिएशन ने एक जांच की और अंततः निर्धारित किया कि आरोप के लिए कोई सबूत नहीं था, और यांग डिंगक्सिन ने जुर्माना लगाया।

लेकिन एआई से धोखाधड़ी के मामले मौजूद हैं।

2020 में, दक्षिण कोरिया के 13 वर्षीय पेशेवर शतरंज खिलाड़ी किम यून-ची को ऑनलाइन मैचों में उनकी चाल और एआई सिफारिशों के बीच 92% ओवरलैप पाया गया। जांच के बाद, अंततः यह निर्धारित हुआ कि उसने धोखाधड़ी की थी (और उसने इसे स्वीकार कर लिया) और उस पर जुर्माना लगाया गया और एक साल के लिए निलंबित कर दिया गया।

2022 में, चीनी शतरंज खिलाड़ी लियू रुइज़ी को एआई धोखाधड़ी का दोषी ठहराया गया था और वह चीन के पहले पेशेवर शतरंज खिलाड़ी थे जिन्हें एआई धोखाधड़ी के लिए आधिकारिक तौर पर दंडित किया गया था। किम यून-ची की तुलना में, लियू रुइज़ी ने "एआई फ्लेवर" से बचना सीख लिया है और केवल कुछ प्रमुख बिंदुओं में एआई का उपयोग करते हैं।

इसके जवाब में, विभिन्न देशों में प्रतिस्पर्धाएं लगातार एआई धोखाधड़ी विरोधी तंत्र में सुधार कर रही हैं।

वहीं, कुछ लोगों ने एआई को हराने के लिए "एआई फ्लेवर" का इस्तेमाल किया है।

2023 में, अमेरिकी शौकिया शतरंज खिलाड़ी केलिन पेल्रिन ने गो एआई काटागो को हराया

काटागो उपलब्ध सबसे शक्तिशाली ओपन सोर्स गो एआई में से एक है, और दक्षिण कोरिया इसका उपयोग गो खिलाड़ियों को प्रशिक्षित करने के लिए भी करेगा।

पेल्रिन ने काटागो के खिलाफ 1 मिलियन से अधिक गेम खेलने के लिए एफएआर एआई नामक कार्यक्रम का उपयोग किया। अंत में, एफएआर एआई ने काटागो की कमजोरियों का पता लगाया, मानव-मशीन द्वंद्व में उनका अभ्यास किया और जीत हासिल की:

वह रणनीति बिल्कुल बचकानी नहीं है, लेकिन इसे सीखना विशेष रूप से कठिन भी नहीं है।

फिर, उन्होंने एक अन्य अपेक्षाकृत शक्तिशाली गो एआई, लीला ज़ीरो को हराने के लिए भी उसी पद्धति का उपयोग किया।

रणनीति की कुंजी प्रतिद्वंद्वी के शतरंज के मोहरों के समूह को घेरने के लिए एक बड़ा "सर्कल" बनाना है, और फिर एआई के साथ हस्तक्षेप करने के लिए अचानक एक मोहरे को दूसरे असंबंधित कोने में ले जाना है।

पेल्रिन ने कहा कि अगर यह एक मानव शतरंज खिलाड़ी होता, तो सर्कल को देखते ही उसे निश्चित रूप से पता चल जाता कि कुछ गड़बड़ है, लेकिन एआई को इस पर ध्यान नहीं दिया जाएगा।

यह कमजोरी थोड़ी "मुश्किल" लगती है। क्या एआई को लक्षित प्रशिक्षण देकर इसे ठीक किया जा सकता है?

पिछले हफ्ते नेचर की एक रिपोर्ट में इस साल के एक प्रीप्रिंट पेपर का हवाला दिया गया था और बताया गया था कि उन कार्यक्रमों के सामने जो विशेष रूप से एआई कमजोरियों की तलाश करते हैं, मॉडल कमजोरियों को ठीक करना उतना आसान नहीं है जितना सोचा गया था।

इस बार यह काटागो था जिसे "लक्षित" किया गया था। काटागो को पलटवार करने में अधिक सक्षम बनाने के लिए शोधकर्ताओं ने तीन अलग-अलग रणनीतियों का उपयोग किया:

  • काटागो को यह सीखने दें कि स्व-खेल के माध्यम से हमलों का जवाब कैसे दिया जाए;
  • पुनरावृत्तीय प्रशिक्षण, KataGo पर हमला करने के लिए आक्रमण कार्यक्रम का उपयोग करें, KataGo को भेद्यता वापस भेजें, उसे स्व-खेल या अन्य तरीकों से इससे निपटना सीखने दें, और फिर चक्र को दोहराते हुए KataGo पर आक्रमण करने के लिए आक्रमण कार्यक्रम का उपयोग करें;
  • एक अलग न्यूरल नेटवर्क मॉडल का उपयोग करके एक नए गो एआई सिस्टम को शुरू से प्रशिक्षित करें।

हालाँकि इन प्रशिक्षणों ने काटागो को कुछ हद तक अपनी रक्षा क्षमताओं में सुधार करने में मदद की है, फिर भी आक्रमण कार्यक्रम अभी भी खामियाँ ढूंढ सकता है और काटागो को क्रमशः 91%, 81% और 78% जीत दर के साथ हरा सकता है।

ये आक्रमण कार्यक्रम स्वयं उत्कृष्ट गो एआई नहीं हैं और इन्हें मनुष्यों द्वारा आसानी से हराया जा सकता है।

निःसंदेह, यहां मुख्य बात यह प्रतिस्पर्धा करना नहीं है कि मनुष्य बेहतर हैं या एआई।

मुद्दा यह है कि गो के लिए, एक ऐसा क्षेत्र जिसे एआई ने "विकृत" कर दिया है, और इतने वर्षों के अनुप्रयोग और सुधार के बाद, इसके एआई में अभी भी कई समस्याएं हैं। पेपर के लेखक एडम ग्लीव ने कहा:

यदि हम इस समस्या को गो जैसे एकल डोमेन में हल नहीं कर सकते हैं, तो अल्पावधि में, चैटजीपीटी जैसे मॉडल में जेलब्रेक को ठीक करने की संभावना कम लगती है।

# Aifaner के आधिकारिक WeChat सार्वजनिक खाते का अनुसरण करने के लिए आपका स्वागत है: Aifaner (WeChat ID: ifanr) आपको जल्द से जल्द अधिक रोमांचक सामग्री प्रदान की जाएगी।

ऐ फ़ैनर | मूल लिंक · टिप्पणियाँ देखें · सिना वीबो