वॉल-फेसिंग इंटेलिजेंस के मुख्य वैज्ञानिक लियू झियुआन के साथ संवाद: बड़े मॉडलों में एक नया “मूर का नियम” होगा, और एजीआई युग में स्मार्ट टर्मिनल जरूरी नहीं कि मोबाइल फोन हों

पिछले साल से, चीन के एआई उद्योग ने "सैकड़ों मॉडलों की लड़ाई" शुरू की है, जिसमें लगभग सभी बड़ी मॉडल कंपनियों का लक्ष्य जीपीटी-4 को पकड़ना है। एक ऐसी कंपनी भी है जो थोड़ी अजीब लगती है, और वह वॉल-फेसिंग इंटेलिजेंस है जो एंड-साइड मॉडल पर ध्यान केंद्रित करती है।

स्टैनफोर्ड की एआई अनुसंधान टीम द्वारा हाल ही में की गई साहित्यिक चोरी की घटना के कारण वॉल-फेसिंग इंटेलिजेंस लोगों की नजरों में आ गई। वॉल-फ़ेसिंग इंटेलिजेंस के मुख्य वैज्ञानिक लियू ज़ियुआन ने उस समय लिखा था कि इस घटना ने चीन के नवाचारों के अंतर्राष्ट्रीय प्रभाव को दूसरे दृष्टिकोण से साबित कर दिया है।

हाल ही में विश्व आर्टिफिशियल इंटेलिजेंस सम्मेलन में, फेस वॉल ने कुशल विरल सक्रियण मॉडल मिनीसीपीएम-एस जारी किया, जो कम ऊर्जा खपत का उपयोग कर सकता है और तेज तर्क गति ला सकता है।

वॉल-फेसिंग इंटेलिजेंस ने सार्वजनिक रूप से यह भी कहा कि वह 2026 के अंत तक GPT-4 स्तर का एंड-साइड मॉडल हासिल करने में सक्षम होगा

यदि GPT-4 और एंड-साइड मॉडल को एक साथ रखा जाए, तो यह वांग झा के बराबर है।

इस साल, कई देशी एआई हार्डवेयर पर सवाल उठाए गए हैं, और एआई मोबाइल फोन और एआई पीसी बेहद लोकप्रिय हैं, लेकिन उपभोक्ताओं के खरीदारी निर्णयों पर उनका बहुत कम प्रभाव पड़ता है, वे बड़े अंत-पक्ष की क्षमताओं से सीमित हैं मॉडल और अधिकांश जटिल कार्यों को पूरा करने के लिए क्लाउड पर निर्भर रहने की आवश्यकता होती है।

बड़े मॉडलों की गरमागरम चर्चा में, दीवार का सामना करने वाली बुद्धिमान एंड-टू-साइड "छोटी स्टील तोप" MiniCPM कुछ हद तक कम आंका गया मॉडल है। फरवरी 2024 में जारी MiniCPM 2.4B मॉडल वास्तव में Llama2-13b को पार कर सकता है।

वॉल-फेसिंग इंटेलिजेंस के मुख्य वैज्ञानिक लियू झियुआन का मानना ​​है कि बड़े मॉडलों के युग का अपना मूर का नियम होगा। भविष्य में कुशल बड़े मॉडलों के पहले सिद्धांत के लिए मुख्य शब्द ज्ञान घनत्व होना चाहिए।

लियू झियुआन, वॉल-फेसिंग इंटेलिजेंस के मुख्य वैज्ञानिक

WAIC 2024 के दौरान, APPSO ने लियू झियुआन के साथ बातचीत की, जिसमें भविष्य के बुद्धिमान टर्मिनल रूपों पर एंड-साइड मॉडल के प्रभाव के बारे में बात की गई, बड़े मॉडलों के मूर के नियम की खोज कैसे की गई, और आइवरी टॉवर से बाहर आया एक आदर्शवादी कैसे सफल हो सकता है व्यापार जगत का लक्ष्य एजीआई के करीब है।

लियू ज़ियुआन और एपीपीएसओ के बीच बातचीत की प्रतिलेख निम्नलिखित है:

बड़े मॉडलों के युग में मूर का नियम

एपीपीएसओ: जब हर कोई बड़े सामान्य मॉडल बनाने के लिए ओपनएआई के खिलाफ बेंचमार्किंग कर रहा है, तो वॉलफेस इंटेलिजेंस ने एंड-साइड मॉडल पर ध्यान केंद्रित करने का विकल्प क्यों चुना? क्या कोई आंतरिक विवाद है?

लियू झियुआन: वास्तव में, हमने कई बड़ी घरेलू मॉडल कंपनियों की तुलना में पिछले साल के मध्य में ही 100 बिलियन मॉडल जारी कर दिया था। लेकिन हमारे सामने एक विकल्प है कि क्या मॉडल प्रक्रिया को उसके ज्ञान घनत्व स्तर के अनुरूप रखा जाए। उस समय, उद्योग की सहमति बड़े मॉडलों को पेश करने और जीपीटी-4 तक पहुंचने का प्रयास करने पर थी।

एक उद्यमी के रूप में, खुद को किसी और के स्थान पर रखना स्वाभाविक है, इसलिए हमने इस बात पर भी गंभीर आंतरिक चर्चा की है कि क्या हमें इस मॉडल को बड़ा बनाना चाहिए। फिर अधिक कंप्यूटिंग शक्ति खरीदें और इस मॉडल को बनाने में कुछ महीने खर्च करें।

एपीपीएसओ: आख़िर आपने ऐसा क्यों नहीं किया?

लियू ज़ियुआन: हमें लगता है कि हमें पहले अपनी मॉडल निर्माण प्रक्रिया में सुधार करने की आवश्यकता है। हम मॉडल प्रशिक्षण को पूर्वानुमानित बनाने के लिए पिछले वर्ष की दूसरी छमाही से मॉडल पवन सुरंगों का निर्माण कर रहे हैं। दूसरे शब्दों में, मॉडल को प्रशिक्षित करने से पहले यह अनुमान लगाया जा सकता है कि क्या इन डेटा के साथ प्रशिक्षण अपेक्षित स्तर प्राप्त कर सकता है।

इसलिए हमने GPT-4 को रोल करना जारी नहीं रखा। हमारी भविष्यवाणी यह ​​है कि यदि हम कंप्यूटिंग शक्ति, डेटा और मॉडल पैरामीटर स्केल को बढ़ाने के लिए कड़ी मेहनत करते हैं, तो इस साल जून तक जीपीटी-4-स्तरीय मॉडल जारी किया जाएगा। यह कुछ ऐसा है जिसे सभी बड़ी घरेलू प्रथम-स्तरीय मॉडल कंपनियां हासिल कर सकती हैं .

यदि हर कोई इसे कर सकता है, और हम भी इसे कर सकते हैं, तो हमारा प्रतिस्पर्धात्मक लाभ क्या है? इसलिए हमने पहले GPT-3.5 स्तर के अनुप्रयोगों के साथ शुरुआत करने और फिर रोलिंग प्रक्रिया पर जाने का निर्णय लिया।

एपीपीएसओ: रोलिंग प्रक्रिया कुछ हद तक चिप निर्माण के विचार की तरह है।

लियू ज़ियुआन: वास्तव में, प्रक्रिया ज्ञान घनत्व का प्रतिनिधित्व करती है। हमने अपेक्षाकृत छोटे मॉडल का उपयोग करना चुना और फिर अपनी प्रक्रिया क्षमताओं को सत्यापित किया। इसलिए हमने उस समय एक डिवाइस-साइड मॉडल बनाने का फैसला किया, इस साल की शुरुआत तक हमने 2.4B मॉडल बना लिया था।

दरअसल, ऐसा करने से पहले हम सोच रहे थे कि जब हम इतना छोटा मॉडल बनाने जा रहे हैं तो हमें इसे मोबाइल फोन पर भी चलाना होगा। बेशक, मुझे यह कहने की उम्मीद नहीं थी कि हमें मोबाइल फोन के लिए एंड-साइड इंटेलिजेंस का निर्माण करना चाहिए। यह पता चला है कि विंड टनल तकनीक का उपयोग करके हमने जो एंड-साइड मॉडल बनाया है, वह 2.4B मापदंडों के साथ GPT-3 के 175 बिलियन पैरामीटर स्तर तक पहुंच सकता है, और मिस्ट्रल 7B और लामा 2 13B के प्रभावों को बेंचमार्क कर सकता है।

एपीपीएसओ: आपने कई बार ज्ञान घनत्व और विनिर्माण प्रक्रिया का उल्लेख किया है। क्या हमारे पास कोई विशिष्ट मानक है?

लियू ज़ियुआन: उदाहरण के लिए, यदि मैं आपको 100 आईक्यू परीक्षण प्रश्न देता हूं, तो आप कितने अंक प्राप्त कर सकते हैं? इसकी कंप्यूटिंग शक्ति कितनी होगी? जब आप ये 100 परीक्षण प्रश्न करते हैं, तो गणना में आपके पास कितने न्यूरॉन शामिल होते हैं? आप गणनाओं में जितने कम न्यूरॉन्स शामिल करेंगे, आपका आईक्यू उतना ही अधिक होगा, क्योंकि आप इन कार्यों को कम न्यूरॉन्स के साथ पूरा कर सकते हैं। यह ज्ञान घनत्व की मूल अवधारणा है।

इसके दो तत्व हैं एक तत्व इस मॉडल की क्षमता है। दूसरा तत्व इस क्षमता के लिए आवश्यक न्यूरॉन्स की संख्या या संबंधित कंप्यूटिंग पावर खपत है।

संपादक का नोट: लियू ज़ियुआन ने प्रस्तावित किया कि मॉडल का ज्ञान घनत्व (ज्ञान घनत्व = मॉडल क्षमता/अनुमान कंप्यूटिंग बिजली की खपत) औसतन हर आठ महीने में दोगुना हो जाएगा।

एपीपीएसओ: आपको क्या लगता है कि वर्तमान बड़े मॉडल द्वारा प्रस्तुत सामान्य कृत्रिम बुद्धिमत्ता किस स्तर पर है?

लियू ज़ियुआन: हम भौतिकी में टाइकोनिक काल में हैं। टाइको ने आकाशीय पिंडों की गति पर बड़ी मात्रा में डेटा एकत्र किया, लेकिन उन्हें इन खगोलीय पिंडों की गति के वास्तविक नियम नहीं मिले। इसके बाद ही केप्लर का नियम अस्तित्व में आया और उसके बाद ही न्यूटन का सार्वभौमिक गुरुत्वाकर्षण का नियम अस्तित्व में आया।

यदि हम सार्वभौमिक गुरुत्वाकर्षण का नियम पा सकते हैं जो बड़े मॉडलों के विकास से संबंधित है, तो हम इस नियम का उपयोग दुनिया में सबसे अच्छी लिथोग्राफी मशीन बनाने के लिए कर सकते हैं।

एप्सो: क्या ओपनएआई भी ऐसा कर रहा है?

लियू ज़ियुआन: ओपनएआई निश्चित रूप से ऐसा कर रहा है, क्योंकि इसने वास्तव में कुछ साल पहले पूर्वानुमानित स्केलिंग के साथ एक गहन शिक्षण स्टैक का प्रस्ताव दिया था, यह एक मॉडल पवन सुरंग की अवधारणा के समान है। यह अब कई लोगों की सहमति होनी चाहिए। यह सिर्फ इतना है कि ओपनएआई पिछले साल से खुला नहीं है, ज्यादातर लोग वास्तव में केवल स्केलिंग कानून को जानते हैं, और यह नहीं जानते कि यह वास्तव में बाद में क्या कर रहा है .

एपीपीएसओ: आप इस समय जल्दी से व्यावसायिक मूल्य कैसे लाया जाए, इसके बारे में सोचने के बजाय निचले स्तर की चीजों की तलाश करना चाहते हैं

लियू झियुआन : भविष्य में सच्चे व्यावसायीकरण के लिए बड़े मॉडलों का वैज्ञानिकीकरण एक पूर्व शर्त होनी चाहिए । आजकल, जब हर कोई बड़े मॉडलों और एजीआई का पीछा कर रहा है, तो उनके पास दो विकल्प हैं।

एक विकल्प यह है कि आप उसी प्रक्रिया, या उससे भी बदतर प्रक्रिया का उपयोग करें, और फिर आप एक बहुत बड़े मॉडल, बड़े और बड़े मॉडल को प्रशिक्षित करें, और फिर जीपीटी-4 स्तर तक पहुंचें, लेकिन क्या इसका कोई मतलब है?

हमने महसूस किया है कि पिछले साल की दूसरी छमाही से यह मामला अविश्वसनीय था। क्योंकि यदि आपकी विनिर्माण प्रक्रिया पर्याप्त मजबूत नहीं है, तो वास्तव में आपके पास कोई प्रतिस्पर्धात्मकता नहीं है। हमारे और ओपनएआई के बीच का अंतर मॉडल के पैरामीटर पैमाने में नहीं है, बल्कि विनिर्माण प्रक्रिया में है।

तो वास्तव में, आप पाएंगे कि इस वर्ष की पहली छमाही में, सभी ने इस एपीआई की कीमत में वृद्धि करना शुरू कर दिया, यह मामला थोड़ा महत्व रखता है, लेकिन यह हर किसी को पैसा कमाने में असमर्थ बनाता है।

कल्पना कीजिए कि आप एक विशाल मॉडल को प्रशिक्षित करने के लिए लाखों खर्च करते हैं, और फिर इस मॉडल की एपीआई प्रदान करते हैं, तो 1 मिलियन टोकन की लागत केवल कुछ सेंट हो सकती है, भले ही एक महीने में दसियों अरबों का उपयोग हो, संबंधित आय को कवर किया जाएगा लागत। । क्या आपको नहीं लगता कि यह बहुत निराशाजनक पैटर्न है? यह उस समय के हंड्रेड रेजिमेंट वॉर से भी अधिक पागलपन भरा है।

एजीआई युग में स्मार्ट टर्मिनल

एपीपीएसओ: हाल ही में आप हुआवेई क्लाउड के पहले बड़े पैमाने के क्लाइंट-साइड मॉडल पार्टनर भी बने हैं। क्या यह आपके भविष्य के व्यावसायीकरण की दिशा है?

लियू ज़ियुआन: हम अगले 2 से 3 वर्षों में और अधिक निर्माताओं के साथ सहयोग करेंगे। मुझे लगता है कि भविष्य में एजीआई युग से संबंधित स्मार्ट टर्मिनल होंगे, जो मोबाइल फोन या कार नहीं हो सकते हैं।

एपीपीएसओ: एजीआई युग में आपका आदर्श टर्मिनल फॉर्म क्या है?

लियू झियुआन: मोबाइल फोन का वर्तमान स्वरूप वास्तव में ऐप्पल द्वारा शुरू की गई मल्टी-टच इंटरैक्शन पद्धति है। लेकिन अगर भविष्य में AI काफी स्मार्ट हो जाता है, तो क्या हमें अभी भी क्लिक-एंड-टच इंटरैक्शन की आवश्यकता होगी? भविष्य में, एजीआई से संबंधित एक प्राकृतिक भाषा संपर्क पद्धति होनी चाहिए, जो हमारी मानवीय विशेषताओं के अनुरूप हो। यह भी कहा जाता है कि एक दिन जब मस्तिष्क-कंप्यूटर इंटरफ़ेस कनेक्ट हो जाएगा, तो मुझे बोलना भी नहीं पड़ेगा, इसलिए, एजीआई से संबंधित स्मार्ट टर्मिनल मोबाइल फोन नहीं हो सकता है, या मोबाइल फोन अपना रूप बदल देगा बिंदु।

और जब हमारे पास बातचीत करने का अधिक स्वाभाविक तरीका है, तो हमें ऐप की आवश्यकता क्यों है ? अगर एप्पल जैसे प्रमुख मोबाइल फोन निर्माता इस दिशा में काम नहीं करेंगे तो कोई और जरूर करेगा।

एपीपीएसओ : आपको क्या लगता है इसमें वॉल फेस का किरदार क्या होगा?

लियू झियुआन: हमारे जैसी स्टार्ट-अप कंपनी के लिए, हमारा लाभ नवाचार, अत्यधिक नवाचार है। हमारा पहला लक्ष्य यह पता लगाना है कि एजीआई का उपयोग कैसे किया जाए। हम ऐसा करने के लिए पैदा हुए हैं, और यह हमारा लाभ है।

यहां तक ​​कि प्रमुख निर्माता भी यदि नवप्रवर्तन नहीं करते हैं तो इतिहास के पहिये से कुचल दिए जाएंगे, ठीक उस समय नोकिया की तरह।

एपीपीएसओ: आप हुआवेई के साथ अपने सहयोग का वर्णन कैसे करेंगे?

लियू झियुआन: हम हुआवेई जैसी कंपनियों के साथ साझेदारी बनाने की उम्मीद करते हैं जो डिवाइस-क्लाउड सहयोग के लिए एक उद्योग मॉडल के रूप में काम कर सकती है।

एप्सो: हुआवेई ने एक शुद्ध-रक्त होंगमेंग लॉन्च किया है, जिसमें एआई फ्रेमवर्क और बड़े मॉडल बहुत महत्वपूर्ण हैं। क्या भविष्य में आपका अधिक सहयोग होगा?

लियू ज़ियुआन: स्मार्ट चिप्स, स्मार्ट ऑपरेटिंग सिस्टम और यहां तक ​​कि मॉडल स्तर पर भी निश्चित रूप से सहयोग होगा।

एपीपीएसओ: क्या आप इन हार्डवेयर निर्माताओं द्वारा अपने स्वयं के डिवाइस-साइड मॉडल बनाने से चिंतित हैं?

लियू झियुआन: यह चीनी और अमेरिकी बाजारों के बीच एक बड़ा अंतर है। अमेरिकी औद्योगिक शृंखला में एक-दूसरे के बीच सुरक्षा की प्रबल भावना है और हर कोई एक साथ व्यापार कर सकता है। लेकिन ऐसा लगता है कि चीन चाहता है कि हर कंपनी खुद ही सब कुछ करे, अगर कोई ऐसा काम है जो खुद नहीं किया जाता है, तो वह बहुत असुरक्षित महसूस करेगी। अगर हम रचनात्मक रूप से एक बहुत ही स्थिर सहयोग बना सकते हैं, तो मेरा मानना ​​है कि वह देने में सक्षम होगी हर किसी के काम के लिए पूर्ण खेल, लेकिन इस बाजार पर बेहतर कब्जा कर सकते हैं।

एपीपीएसओ: वॉलफेस ऐसा क्या कर सकता है जो अन्य हार्डवेयर निर्माता नहीं कर सकते?

लियू झियुआन: सबसे पहले, बड़े मॉडल एल्गोरिदम के नजरिए से, वास्तव में, इसकी तकनीक तेजी से डी-डिफ्यूज हो रही है। हम ऐसी मॉडल प्रशिक्षण तकनीक का अनुसरण नहीं कर रहे हैं जिसमें अन्य निर्माता कभी महारत हासिल नहीं कर पाएंगे।

कम से कम अभी के लिए, अंत में, कंप्यूटिंग शक्ति और मेमोरी ऊर्जा खपत की सीमाओं के कारण, वास्तव में मॉडल की निर्माण प्रक्रिया के लिए इसकी उच्च आवश्यकताएं हैं। यह मॉडल को अधिक चरम तरीके से छोटे पैरामीटर स्केल में डालने में सक्षम होना चाहिए, और साथ ही इसमें मजबूत क्षमताएं भी होनी चाहिए।

उदाहरण के लिए, चिप निर्माण प्रक्रिया में, अंतिम-परीक्षण चिप्स बनाने के लिए सबसे उन्नत प्रक्रिया का उपयोग किया जाना चाहिए। क्योंकि एंड-टू-एंड परीक्षण के लिए स्थान छोटा है और ऊर्जा खपत के प्रति अधिक संवेदनशील है, यहां तक ​​कि एंड-टू-एंड परीक्षण मॉडल के लिए एक उच्च मॉडल प्रक्रिया की आवश्यकता होगी, जो क्लाउड मॉडल की तुलना में अधिक कठोर है।

क्लाउड परीक्षण में, जब तक आपके कंप्यूटिंग पावर संसाधन पर्याप्त हैं, आपके पास पैंतरेबाज़ी के लिए अधिक जगह हो सकती है लेकिन अंतिम परीक्षण में सीमाएं इसकी चिप, इसकी मेमोरी और इसकी बैटरी द्वारा सीमित हैं। इसलिए आपको एक बेहद छोटे मॉडल को प्रशिक्षित करना होगा। इस दृष्टिकोण से, अब बाज़ार में बड़ी मॉडल कंपनियों को तो छोड़ ही दें, उदाहरण के लिए, Google ने हमसे दो महीने बाद समान स्तर के मॉडलों को प्रशिक्षित किया, और अभी भी हमसे लगभग 10% पीछे था।

एपीपीएसओ: आपने पहले भी भविष्यवाणी की है। आपको लगता है कि भविष्य में अधिकांश एप्लिकेशन डिवाइस साइड पर होंगे। आपके अनुसार ऐसा करना किस हद तक संभव है?

लियू ज़ियुआन: वास्तव में, आपकी सेवा के लिए अंतिम परीक्षक का आइंस्टीन होना आवश्यक है। मेरा अनुमान है कि यदि एंड-साइड चिप्स का ज्ञान घनत्व उसी दर से बढ़ता है, तो अगले दो वर्षों में, हम GPT-4 स्तर को एंड-साइड परीक्षण में डाल सकते हैं, और फिर 80% से अधिक आवश्यकताएं पूरी हो जाएंगी अंत की ओर.

एपीपीएसओ: आपकी भविष्यवाणी काफी क्रांतिकारी है।

लियू ज़ियुआन: क्या यह कट्टरपंथी है? हम इंतजार कर सकते हैं और देख सकते हैं.

एजीआई के प्रति लक्ष्य मानव स्वभाव से परे होना चाहिए

एपीपीएसओ: बड़े मॉडलों के फैलने के बाद से, सभी बड़े मॉडल निर्माता टीपीएफ टेक्नोलॉजी-प्रॉब्लम फिट) के बारे में बात कर रहे हैं, वॉल-फेसिंग इंटेलिजेंस आंतरिक रूप से प्रौद्योगिकी और उत्पादों पर आम सहमति कैसे बनाता है, और टी और पी को कैसे जोड़ता है?

लियू ज़ियुआन: हमारा दीर्घकालिक दृष्टिकोण है हम एजीआई युग में एक सुपर ऐप बनना चाहते हैं।

लेकिन हमें अल्पावधि में जीवित रहना होगा और बाजार में अपनी तकनीक का मूल्य साबित करना होगा। इसलिए, हम कुछ निर्माताओं के साथ रणनीतिक सहयोग के माध्यम से प्रौद्योगिकी का सत्यापन पूरा करेंगे, जैसे कि शेन्ज़ेन इंटरमीडिएट पीपुल्स कोर्ट को कृत्रिम बुद्धिमत्ता-सहायता परीक्षण प्रणाली शुरू करने में मदद करना। ये अन्वेषण हमारी दीर्घकालिक दृष्टि को साकार करने में हमारे अल्पकालिक लक्ष्य हैं।

एप्सो: सुपर एप्लिकेशन भी एक बहुत गर्म विषय है। Baidu रॉबिन ली ने कहा कि जब हम अब सुपर एप्लिकेशन के बारे में बात करते हैं, तो यह एक जाल या गलत प्रस्ताव हो सकता है। सुपर एप्लिकेशन क्या है इसकी फिलहाल कोई आम तौर पर स्वीकृत परिभाषा नहीं है आप क्या सोचते हैं?

लियू ज़ियुआन: 2000 के बाद, मुझे कम से कम दो बहुत महत्वपूर्ण तकनीकी तरंगें समझ में आईं। एक थी सर्च टेक्नोलॉजी, जिसने गूगल जैसी बड़ी कंपनियों को जन्म दिया। दूसरी बार वैयक्तिकृत अनुशंसा तकनीक है। इससे डॉयिन जैसे महत्वपूर्ण एप्लिकेशन सामने आए हैं।

वास्तव में, ये प्रौद्योगिकियाँ स्वयं उस समय बहुत निश्चित थीं। हर कोई जानता है कि यह एक बहुत बड़ी सफलता है. यह सिर्फ इस बारे में है कि इसका उपयोग कैसे किया जाए और यह किस प्रकार का उत्पाद बनाता है। यह मामला अनिश्चित है और इसमें प्रतिस्पर्धा की आवश्यकता है।

हमारे लिए, पहला है सबसे अत्याधुनिक तकनीक में महारत हासिल करना, और दूसरा है पर्याप्त संवेदनशील होना। जब कोई सुपर ऐप सामने आता है, तो हमें यह महसूस करने में सक्षम होना चाहिए कि यह एक सुपर ऐप है।

एप्सो: तो क्या आपको लगता है कि अब एक सुपर ऐप को परिभाषित करना मुश्किल है?

लियू ज़ियुआन: इतिहास पर नज़र डालें तो, जब Google और टुटियाओ सामने आए, तो कितने लोगों को एहसास हुआ कि वे सुपर एप्लिकेशन थे। उस समय, याहू न्यूज़ ने एक विशेष ऐप बनाया था जो आपको हर दिन केवल दस समाचार भेजता था।

आप देखिए, भले ही आज की सुर्खियाँ उनके सामने पहले से ही हों, फिर भी वह वे निर्णय लेंगे। और तो और, सुपर ऐप अभी तक सामने नहीं आया है, अगर आता भी है, तो ज्यादातर लोग इस पर नहीं आएंगे।

एप्सो: सुपर ऐप्स कैसे खोजें?

लियू ज़ियुआन: मैं हमेशा अपने छात्रों से कहता हूं कि कभी भी निहित स्वार्थ वाला व्यक्ति न बनेंयह स्वीकार करने के लिए तैयार न हों कि आपमें क्रांति सिर्फ इसलिए आई है क्योंकि आपको पहले कई फायदे थे।

बहुत से लोग यह स्वीकार करने को तैयार नहीं हैं कि उनमें क्रांति ला दी गयी है। सांख्यिकीय मशीनी अनुवाद करते समय, वह तंत्रिका मशीनी अनुवाद के उद्भव को देखने के लिए तैयार नहीं थे। तंत्रिका मशीन अनुवाद करते समय, वह बड़े मॉडलों के उद्भव को नहीं देखना चाहता। क्योंकि उसे लगता था कि जिन चीज़ों में वह अच्छा था वे सब निरर्थक थीं, और वह इसे स्वीकार नहीं करना चाहता था।

एपीपीएसओ: यह मानव स्वभाव है।

लियू ज़ियुआन: 99% लोग इंसान हैं। मेरा मानना ​​है कि इसे पूरा करने के लिए आपके अंदर मिशन की भावना होनी चाहिए, आपका लक्ष्य आपकी मानवता से परे होना चाहिए।

यदि आपका मिशन आपकी मानवता से कमतर है, तो आप इसे पूरा करने में सक्षम नहीं होंगे। उदाहरण के लिए, यदि कोई संस्थापक सोचता है कि उसके लिए सबसे महत्वपूर्ण बात कंपनी को बनाए रखना है, तो मुझे लगता है कि इस बात की बहुत अधिक संभावना है कि वह सुपर एप्लिकेशन को अच्छी तरह से नहीं पकड़ पाएगा इसे अच्छे ढंग से करो?

एपीपीएसओ: केवल कुछ हद तक आदर्शवादी व्यक्ति ही ऐसी बात कहेगा।

लियू ज़ियुआन: आदर्शवाद के बिना, मैंने इस कंपनी की स्थापना नहीं की होती।

एपीपीएसओ: कुछ लोग कहते हैं कि एक बड़े मॉडल से एक बुद्धिमान एजेंट तक की कठिनाई बहुत अधिक है। क्या यह सच है?

लियू ज़ियुआन: मुझे नहीं लगता कि बुद्धिमत्ता का कोई मानक उत्तर है, लेकिन कुंजी इस बात पर निर्भर करती है कि आप इसमें क्या डालते हैं। मैं इस बारे में अधिक आशावादी हूं कि बुद्धिमान एजेंट कई चीजों से सुसज्जित हो सकता है, जैसे उसकी योजना, निर्णय लेने और अन्वेषण क्षमताएं। यदि आप इन सभी को एजीआई का हिस्सा मानते हैं, तो मुझे वास्तव में लगता है कि भविष्य में इंटरनेट एजेंटों पर अधिक ध्यान देने योग्य बात है।

यह इन एजेंटों से बने इंटरनेट के समतुल्य है जिसे हम इंटेलिजेंस का इंटरनेट कहते हैं। मुझे लगता है कि यह आगे देखने लायक है। आप कल्पना कर सकते हैं कि हमारे मानव समाज की तरह, यह एक अत्यधिक परस्पर जुड़ा हुआ समुदाय है। हर कोई पूर्ण सहयोग से कोई न कोई काम पूरा करता है। कई क्षेत्रों, विशेष रूप से जटिल क्षेत्रों में वास्तव में हर किसी के पास अपनी पेशेवर पृष्ठभूमि और विशेषज्ञता की आवश्यकता होती है, और इसे पूरा करने के लिए उन्हें मिलकर काम करने की आवश्यकता होती है।

एप्सो: क्या अब एजीआई के बारे में बात करना बहुत दूर की बात है?

लियू ज़ियुआन: मुझे नहीं लगता कि यह बहुत दूर है। 2022 के अंत में चैटजीपीटी के आने से पहले, मुझे हमेशा लगता था कि एजीआई में अभी भी एक अनसुलझी समस्या है, जो सामान्य ज्ञान की समस्या है, यानी आप दुनिया के बारे में सामान्य ज्ञान कैसे स्थापित करते हैं।

उदाहरण के लिए, एक बत्तख का एक सिर, दो पैर और दो पंख होते हैं, यह बुनियादी सामान्य ज्ञान है। GPT-3.5 के उद्भव से पहले, मैंने सोचा था कि डेटा से यह ज्ञान सीखना कठिन था। इसमें शारीरिक समस्याएं शामिल हैं, जैसे कि जब आप मेज से फर्श पर कप झाड़ते हैं तो क्या होता है, आदि। जब आप बड़े मॉडलों के बारे में सामान्य ज्ञान के प्रश्न पूछते हैं, तो वह उनका उत्तर नहीं दे पाता।

चैटजीपीटी के उद्भव के बाद, हमने पाया कि यह सामान्य ज्ञान मॉडल द्वारा डेटा-संचालित तरीके से सीखा जा सकता है। यह सिर्फ इतना है कि हम पहले नहीं जानते थे कि इसे कैसे कॉल करें, और ChatGPT ने हमें बताया कि इसे कैसे कॉल करें। मुझे लगता है कि यह तकनीकी मार्ग बहुत सहज है। आपको बस इस मॉडल को सीखने के लिए उस ज्ञान के अनुरूप डेटा सौंपने की आवश्यकता है जिसे सीखने की आवश्यकता है।

एपीपीएसओ: क्या बड़े मॉडल वास्तव में दुनिया को इंसानों की तरह समझ सकते हैं?

लियू ज़ियुआन: यह इस मॉडल से जुड़ा है और इन ऐप्स को संचालित करने की आपकी दैनिक आदतों को सीखता है, ऐसा कोई कारण नहीं है कि यह आपकी प्राथमिकताओं को नहीं सीख सकता है। उदाहरण के लिए, यदि मैं एक उड़ान बुक करना चाहता हूं, और आप उसे बताएं कि मैं इसे कब बुक करना चाहता हूं, तो वह बस ऐसा करेगा।
इसलिए मेरी राय में, इस तकनीक की दिशा बहुत निर्धारित की गई है। डेटा, आर्किटेक्चर और विकास विधियों के तीन तत्वों को कैसे हल किया जाए, इसके बारे में बात करते हुए, मुझे लगता है कि हमें इस समस्या को अधिक आशावादी रूप से देखना चाहिए।

OpenAI का कहना है कि यह छह वर्षों में एक सुपरइंटेलिजेंस कंपनी बन जाएगी, जो मुझे लगता है कि एक बहुत ही व्यवहार्य लक्ष्य है

# Aifaner के आधिकारिक WeChat सार्वजनिक खाते का अनुसरण करने के लिए आपका स्वागत है: Aifaner (WeChat ID: ifanr) आपको जल्द से जल्द अधिक रोमांचक सामग्री प्रदान की जाएगी।

ऐ फ़ैनर | मूल लिंक · टिप्पणियाँ देखें · सिना वीबो