मैंने इस लेख को एआई के साथ समाप्त किया, और प्रधान संपादक ने कहा कि अच्छा किया, मैं कल इसका उपयोग नहीं करूंगा

अधिकांश साहित्यिक और कलात्मक कार्यकर्ता, जैसे कि जो लिखते हैं, आकर्षित करते हैं और रचना करते हैं, उन्हें बेरोजगारी का खतरा बढ़ जाता है – इस लेख में सभी चित्र एआई द्वारा बनाए गए हैं। लेकिन पाठ मेरे द्वारा लिखा गया है, जैसे नकली प्रतिस्थापन।

ओपन एआई के डैल-ई 2 द्वारा बनाई गई खूबसूरत पेंटिंग्स की एक हालिया श्रृंखला, साथ ही माइक्रोसॉफ्ट फ्लोरेंस और ओपनएआई के जीपीटी -3 मॉडल के संयोजन में लिखे गए टेक्स्ट साबित करते हैं कि एआई कभी-कभी इंसानों से बेहतर दिख सकता है। इस वर्ष को एआई साहित्यिक और कलात्मक निर्माण का पहला वर्ष कहना बहुत अधिक नहीं है। किसी दिए गए पाठ या छवि के साथ, एआई ऐसे कार्यों का निर्माण कर सकता है जो कल्पना से परे, बोल्ड, दिलचस्प और उचित हैं। वास्तव में "युग" की कोई कमी नहीं है। -मेकिंग" महत्व।

डल-ई 2 का अंतरिक्ष यात्री अंतरिक्ष ड्राइविंग मानचित्र

इन प्रगतियों को एक विशाल "आधारशिला मॉडल" पर बनाया गया है जो एआई क्षमताओं को प्रदान करता है जिसे इसके निर्माता नहीं सोच सकते थे। अतीत के कृत्रिम बुद्धिमत्ता मॉडल में एक मैनुअल कार्यशाला का "खुरदरापन" था। लंबी अवधि के समायोजन के माध्यम से, "आधारशिला मॉडल" की संभावित क्षमताएं नग्न आंखों के लिए दृश्यमान विकास प्रवृत्ति बन गई हैं।

आर्टिफिशियल इंटेलिजेंस औद्योगिक बड़े पैमाने पर उत्पादन के युग में प्रवेश करने वाला है।

बड़े मॉडल, काम से निकाले गए कर्मचारी मशीन बनाते हैं

मई में, एआई ड्राइंग टूल मिडजॉर्नी का बीटा संस्करण जारी किया गया था, और यहां तक ​​​​कि "द इकोनॉमिस्ट" पत्रिका भी मदद नहीं कर सकती थी, लेकिन "इसे जल्दी आज़माएं"। अर्थशास्त्री रिपोर्ट के लिए मिडजर्नी का चित्रण प्रेरणा से भरा लगता है और इसकी एक मजबूत आधुनिकतावादी शैली है – मत भूलो, चित्र एक बहुत ही अमूर्त अवधारणा पर आधारित है, आखिरकार, लेख की सामग्री "एक बिल्ली को पकड़े हुए एक महिला" नहीं है। विशिष्ट आख्यान है।

द इकोनॉमिस्ट रिपोर्ट के लिए मिडजर्नी द्वारा चित्रण

मिडजॉर्नी के डेवलपर्स में से एक सोमनाई है, जो डिस्को डिफ्यूजन के निर्माता हैं जिन्होंने YouTuber क्विक-आइड स्काई विकसित किया है। ये सभी एप्लिकेशन "आप कहते हैं कि मैं आकर्षित करता हूं", या कीवर्ड दर्ज करते हैं और चित्र उत्पन्न करते हैं। डिस्को डिफ्यूजन बहुत लोकप्रिय है, लेकिन DALL-E और मिडजॉर्नी की तुलना में, इसकी थोड़ी "दहलीज" है। आपको कोड और मापदंडों को स्वयं समायोजित करना होगा। अधिक लोकप्रिय एप्लिकेशन "मूर्ख" प्रकार हैं, बस कुछ शब्द लिखें।

सोमनाई द्वारा डिस्को डिफ्यूजन के साथ बनाया गया एक वीडियो

"यू से आई ड्रा" बजाना व्यसनी है। ट्विटर पर मस्क, ट्रम्प, स्कारलेट जोहानसन और मर्लिन मुनरो सभी "टूटे हुए" होंगे, उन सभी के पास "नाइटमेयर स्ट्रीट" दिखता है। घरेलू डिमो समुदाय के बाल दिवस पर "डोमो मास्टर पेंटर" लॉन्च किया गया, जब मैंने जानबूझकर "चीजों को मुश्किल बना दिया", दी गई तस्वीर अभी भी बहुत दिलचस्प है।

मैंने डोमो से अर्थशास्त्र में 2008 के नोबेल पुरस्कार विजेता पॉल क्रुगमैन से एक उद्धरण लेने के लिए कहा, "एक बाजार अर्थव्यवस्था में, आपका खर्च मेरी आय है"

आउटपुट कितनी अच्छी तरह काम करता है यह पूरी तरह से AI मॉडल पर निर्भर करता है। एआई मॉडल बनाना एक लग्जरी हथियारों की दौड़ के बराबर है।

वर्तमान में उपलब्ध "आधारशिला मॉडल" में OpenAI का GPT-3, 200 बिलियन के करीब पैरामीटर और 10 मिलियन अमेरिकी डॉलर से अधिक की लागत शामिल है; Google का स्विच ट्रांसफार्मर, GPT-3 से अधिक मापदंडों के साथ; Microsoft और Nvidia में MT-NLG मॉडल हैं, 500 बिलियन से अधिक मापदंडों के साथ; हुआवेई के पंगु मॉडल को चीनी भाषा के पूर्व-प्रशिक्षण मॉडल के रूप में तैनात किया गया है, और पैरामीटर स्केल भी 100 बिलियन तक पहुंच जाता है।

जब जीपीटी -3 पहली बार 2020 में "जन्म" हुआ था, तो इसे "लेड-ऑफ वर्कर मैन्युफैक्चरिंग मशीन" नाम दिया गया था। इसने आर्टिफिशियल इंटेलिजेंस की बॉटम-लाइन टेस्ट – "ट्यूरिंग टेस्ट" को आसानी से पास कर लिया और सभी सवालों के जवाब आसानी से दिए गए। GPT-3 मॉडल के आधार पर विकसित टेक्स्ट, अनुवाद, डिज़ाइन, गणना और अन्य अनुप्रयोग मानव संचालन को प्रतिस्थापित कर सकते हैं।

एक व्यक्ति भी है जो चाहता है कि GPT-3 "द इंपोर्टेंस ऑफ़ ब्रशिंग ट्विटर" पर एक छोटा पेपर लिखे। GPT-3 ने इसे सहज और स्वाभाविक रूप से उसके लिए लिखा, और लेखक के उन्नत ऑपरेशन "स्प्रिंग एंड ऑटम ब्रशवर्क" का भी इस्तेमाल किया, जो यिन और यांग अजीब है। इसने कहा कि ट्विटर "हर किसी का सोशल सॉफ्टवेयर है जो व्यक्तिगत हमलों से भरा है"।

"लंच ऑन द ग्रास" (मोनेट) की यह मूल तस्वीर प्राप्त करें, दल-ई 2 समान शैलियों और तदनुसार अलग-अलग विवरणों के साथ कई चित्र बनाएगा।

"लंच ऑन द ग्रास" के एआई पुन: निर्माण में सैद्धांतिक रूप से असीमित फ्रेम हो सकते हैं

आधारशिला मॉडल के फायदे स्पष्ट हैं। सबसे पहले, बड़े पैरामीटर और बड़ी मात्रा में प्रशिक्षण डेटा न केवल सीमांत लाभ को कम करेगा, बल्कि एआई की अपनी क्षमताओं और कंप्यूटिंग में सफलताओं में काफी सुधार करेगा। दूसरा छोटा नमूना सीखने की विधि है जिसका उपयोग किया जाता है। एआई को बार-बार "स्क्रैच से सीखने" की आवश्यकता नहीं होती है, लेकिन यह उस डेटा को खंडित और चुन सकता है जिसे इसे स्वचालित रूप से निष्पादित करने की आवश्यकता होती है।

आधारशिला मॉडल "सार्वभौमिक प्रौद्योगिकी" के बराबर है। 1990 के दशक में, आर्थिक इतिहासकारों ने उत्पादकता के दीर्घकालिक विकास को चलाने वाले प्रमुख कारकों के रूप में भाप इंजन, प्रिंटिंग प्रेस, इलेक्ट्रिक मोटर आदि जैसे "सामान्य प्रयोजन प्रौद्योगिकियों" की पहचान की। "सामान्य प्रौद्योगिकी" में मुख्य प्रौद्योगिकियों के तेजी से पुनरावृत्ति, सभी क्षेत्रों में व्यापक प्रयोज्यता, और स्पिलओवर प्रभाव जैसी विशेषताएं शामिल हैं, जिससे उत्पादों, सेवाओं और व्यवसाय मॉडल में निरंतर नवाचार को प्रोत्साहित किया जाता है।

आज के आधारशिला मॉडल में पहले से ही समान विशेषताएं हैं।

तंत्रिका नेटवर्क + स्व-पर्यवेक्षित शिक्षण, अद्भुत कौशल

आज, 80% से अधिक AI अनुसंधान आधारशिला मॉडल पर केंद्रित है। जैसे टेस्ला भी ऑटोनॉमस ड्राइविंग के लिए एक विशाल आधारशिला मॉडल बना रही है।

यह समझने के लिए कि स्टैनफोर्ड यूनिवर्सिटी के इंस्टीट्यूट ऑफ आर्टिफिशियल इंटेलिजेंस के डीन ली फीफी ने "कृत्रिम बुद्धिमत्ता में चरणबद्ध परिवर्तन" कहा है, हमें यह जानना चाहिए कि आधारशिला मॉडल पिछले कृत्रिम बुद्धिमत्ता मॉडल से कैसे अलग है।

आज के सभी मशीन लर्निंग मॉडल "तंत्रिका नेटवर्क" पर आधारित हैं – प्रोग्रामिंग जो मस्तिष्क कोशिकाओं के इंटरैक्ट करने के तरीके की नकल करती है। उनके पैरामीटर वर्चुअल न्यूरॉन्स के बीच कनेक्शन के वजन का वर्णन करते हैं, और मॉडल को विशिष्ट सामग्री को आउटपुट करने के लिए "प्रशिक्षित" किया जाता है, जिसे डेवलपर चाहता है, वजन पर परीक्षण और त्रुटि के माध्यम से।

डल-ई और डल-ई 2 की तीक्ष्णता तुलना

पिछले कुछ दशकों से, तंत्रिका नेटवर्क प्रायोगिक चरण में हैं, और कुछ भी लागू नहीं किया गया है। 2000 के दशक के अंत और 2010 की शुरुआत तक सुपर कंप्यूटर की कंप्यूटिंग शक्ति में वृद्धि नहीं हुई थी, और इंटरनेट ने पर्याप्त प्रशिक्षण डेटा प्रदान किया था। हार्डवेयर और डेटा के आशीर्वाद से, तंत्रिका नेटवर्क ने टेक्स्ट ट्रांसलेशन, वॉयस कमांड इंटरप्रिटेशन और मान्यता को पूरा करना शुरू कर दिया था। विभिन्न चित्रों में एक ही छवि। चेहरा और अन्य "असंभव कार्य" पहले।

खासकर 2010 के दशक में मशीन लर्निंग और माइनिंग मशीन में भी GPU का इस्तेमाल होता था। GPU की विशेषता यह है कि इसमें हजारों स्ट्रीम प्रोसेसर होते हैं, जो बड़ी संख्या में बार-बार सामान्य ऑपरेशन कर सकते हैं, और यह महंगा नहीं है, जो एक बार सुपर कंप्यूटर शुरू करने की तुलना में बहुत सस्ता है।

सफलता 2017 में आई। उस समय, Google के BERT मॉडल ने एक नए आर्किटेक्चर का उपयोग किया, जो अब "पारंपरिक रूप से" और क्रमिक रूप से संसाधित डेटा नहीं है, बल्कि एक ही समय में सभी डेटा को "देखने" के लिए एक तंत्र को अपनाया है।

विशेष रूप से, BERT जैसे मॉडल पूर्व-लेबल वाले डेटाबेस से प्रशिक्षित नहीं होते हैं, लेकिन "स्व-पर्यवेक्षित शिक्षण" तकनीक का उपयोग करते हैं। जैसे-जैसे मॉडल अनगिनत बाइट्स के माध्यम से खोदता है, यह अपने आप में छिपे हुए शब्दों को ढूंढ सकता है, या संदर्भ के आधार पर अर्थ का अनुमान लगा सकता है—बिल्कुल उन परीक्षा प्रश्नों की तरह जो हम बड़े हुए हैं! पूरी नई विधि मानव मस्तिष्क के सीखने के तंत्र के बहुत करीब है, और आप शब्द दर शब्द को संसाधित और पचाने के बिना, एक नज़र में अपनी रुचि का पता लगा सकते हैं।

Dall-E 2 बाईं तस्वीर के आधार पर एक गुलाबी रबर बतख जोड़ता है (कोई PS निशान नहीं)

अरबों अनुमान-तुलना-सुधार-अनुमान चक्रों के बाद, मॉडल आम तौर पर शानदार और प्रतिभाशाली होते हैं।

पाठ तक सीमित नहीं, तंत्रिका नेटवर्क और स्व-पर्यवेक्षित शिक्षण तकनीकों को भाषा और पाठ से परे लागू किया जा सकता है, जिसमें चित्र, वीडियो और यहां तक ​​​​कि मैक्रोमोलेक्यूलर डेटाबेस भी शामिल हैं। DALL-E ग्राफिक्स मॉडल की तरह, अनुमान अगला अक्षर संयोजन नहीं है, बल्कि अगला पिक्सेल क्लस्टर है।

बड़े मॉडलों के आधार पर विकसित अनुप्रयोग भी विविध हैं। ऊपर वर्णित साहित्यिक और कलात्मक निर्माण अनुप्रयोगों की श्रृंखला के अलावा, Google के डीपमाइंड ने गैटो लॉन्च किया है, जो वीडियो गेम खेल सकता है, रोबोटिक हथियारों को नियंत्रित कर सकता है और लिख सकता है। मेटा का "विश्व मॉडल" फंसे हुए प्रतीत होता है, मूल रूप से मेटावर्स के लिए संदर्भ प्रदान करने का इरादा है।

शांत सामान या ट्यूरिंग ट्रैप

आधारशिला मॉडल में उछाल निश्चित रूप से चिप निर्माताओं के लिए अच्छी खबर है। एनवीडिया, जो सक्रिय रूप से आधारशिला मॉडल बनाने में शामिल है, पहले से ही दुनिया के सबसे मूल्यवान अर्धचालक डिजाइनरों में से एक है, जिसका बाजार मूल्य $ 468 बिलियन है।

स्टार्टअप्स को भी इसका फायदा उठाने की उम्मीद है। बिर्च एआई स्वचालित रूप से स्वास्थ्य संबंधी कॉल रिकॉर्ड करता है; वायबल इसका उपयोग ग्राहकों की प्रतिक्रिया के माध्यम से करने के लिए करता है; फैबल स्टूडियो इंटरैक्टिव कहानियों को बनाने के लिए एआई का उपयोग करता है; और एलिसिट पर, लोग अकादमिक पेपर से अपने शोध प्रश्नों को खोजने के लिए एआई टूल पर भरोसा करते हैं।

मिडजर्नी एक कोलाज शैली का उपयोग करता है

बड़ी कंपनियों के खेलने का अपना तरीका होता है। आईबीएम के अधिकारी ने कहा कि आधारशिला मॉडल बड़ी मात्रा में उद्यम डेटा का विश्लेषण कर सकता है और यहां तक ​​कि दुकान के फर्श पर सेंसर रीडिंग से खपत लागत के बारे में सुराग भी ढूंढ सकता है। एक्सेंचर के आर्टिफिशियल इंटेलिजेंस प्रोजेक्ट के प्रमुख ने भविष्यवाणी की है कि "औद्योगिक आधारशिला मॉडल" जल्द ही सामने आएंगे, जो बैंकों और वाहन निर्माताओं जैसे पारंपरिक ग्राहकों के लिए अधिक सटीक विश्लेषण सेवाएं प्रदान करेंगे।

हालांकि भविष्य उज्ज्वल है, और एआई पेंटिंग ने भी जनता के उत्साह को प्रेरित किया है, कई शोधकर्ता अभी भी "एक कदम पीछे हटने" की सलाह देते हैं। कुछ लोगों का मानना ​​है कि बड़ा डेटा जिस पर बड़ा मॉडल निर्भर करता है वह पूरी तरह कार्यात्मक नहीं है, और इसका एक हिस्सा सिर्फ "यादृच्छिक दोहराव" है; साथ ही, कुछ पक्षपाती मुद्दे मॉडल के "भ्रम" का कारण बनेंगे। पिछले साल की शुरुआत में, जब जीपीटी -3 ने क्लोज प्रश्न का उत्तर दिया "दो XXX (धार्मिक लोग) चले गए …", "मुस्लिम" भरने की संभावना 60% से अधिक थी।

"डिमो कम्युनिटी" में, जब "डोमो मास्टर पेंटर" को अपडेट किया जाता है, तो होम पेज कभी-कभी उपयोगकर्ताओं को एआई को अश्लील निर्देश भेजते हुए देखता है। सीईओ लिन जेहाओ ने एफ़ानर को बताया कि आम तौर पर पृष्ठभूमि की खोजशब्द स्क्रीनिंग और मैनुअल स्क्रीनिंग एक ही समय में की जाएगी। समुदाय के स्वस्थ कामकाज को सुनिश्चित करने के लिए। एआई पेंटिंग टूल्स जैसे कि डैल-ई 2 भी उसी स्थिति का सामना कर रहे हैं-पिछले माइक्रोसॉफ्ट ज़ियाओबिंग "मुंह सुगंधित" के समान भाग्य।

महिला और बिल्ली, इस मध्य यात्रा में किस प्रसिद्ध चित्रकार की शैली का उपयोग किया गया था? कृपया टिप्पणी क्षेत्र में एक संदेश छोड़ दें, और आपको सही उत्तरों के लिए पुरस्कृत किया जाएगा

स्टैनफोर्ड यूनिवर्सिटी के एक अर्थशास्त्री एरिक ब्रायनजॉल्फसन को चिंता है कि मानव जैसी क्षमताओं वाले बड़े मॉडलों के साथ सामूहिक जुनून आसानी से पूरे समाज को "ट्यूरिंग ट्रैप" में ले जा सकता है। कंप्यूटर ने बहुत कुछ किया है जो मनुष्य नहीं कर सकता, और अब वह करें जो मनुष्य कर सकता है – मनुष्यों से बेहतर, अधिक लोग अपनी नौकरी खो रहे हैं, धन और शक्ति अधिक केंद्रित होगी, और असमानता बढ़ेगी। बड़ी।

उनकी चिंता जायज थी। बड़े पैमाने के मॉडल में बहुत पैसा खर्च होता है, और आम लोग उनमें निवेश करने का जोखिम नहीं उठा सकते हैं। उनके पीछे समर्थक या तो प्रौद्योगिकी दिग्गज या देश हैं। आधारशिला मॉडल सेवाओं की एक श्रृंखला के लिए बुनियादी मंच बन जाएगा, और मंच में "मैथ्यू प्रभाव" भी है: विजेता सभी लेता है, भले ही सभी नहीं, दूसरों के लिए कुछ भी नहीं बचा है।

नेटिज़न्स विज्ञान-फाई शैली से भरपूर, मिडजर्नी द्वारा बनाई गई तस्वीरों का उपयोग करते हैं

कलाकार वास्तव में इन "शांत चीजों" से प्यार करते हैं। ब्रिटिश संगीतकार रीप्स वन (हैरी येफ़) मॉडल को घंटों तक एक मेट्रोनोम लय खिलाते हैं, और मॉडल उसकी आवाज़ के लिए लयबद्ध रूप से प्रतिक्रिया करना सीखता है। वह भविष्यवाणी करता है कि "कई कलाकार अपने काम को बेहतर तरीके से करने के लिए इस उपकरण का उपयोग करेंगे"।

एक रिपोर्टर के रूप में, मुझे वास्तव में iFLYTEK का वॉयस ट्रांसक्रिप्शन एप्लिकेशन भी पसंद है। अतीत में, लोगों के साथ साक्षात्कार की दो घंटे की ऑडियो रिकॉर्डिंग संकलित करना मानसिक रूप से स्वस्थ वयस्क को मौके पर ही गिरने का कारण बनने के लिए पर्याप्त था। अब आपको केवल एक टेक्स्ट दस्तावेज़ बनाने के लिए सॉफ़्टवेयर की प्रतीक्षा करने की आवश्यकता है, आप इसे सीधे "बातचीत" के रूप में उपयोग नहीं कर सकते हैं, लेकिन इसे सामग्री के रूप में देखने के लिए पर्याप्त है।

हाल ही में मैं अपने स्वयं के लेखन मॉडल को प्रशिक्षित करने के लिए GPT-3 का उपयोग करने के तरीके पर भी शोध कर रहा हूं। हो सकता है कि अगले गुरुवार का "नियर फ्यूचर" कॉलम my AI द्वारा लिखा जाएगा।

#Aifaner के आधिकारिक WeChat खाते पर ध्यान देने के लिए आपका स्वागत है: Aifaner (WeChat: ifanr), अधिक रोमांचक सामग्री जल्द से जल्द आपके लिए लाई जाएगी।

लव फैनर | मूल लिंक · टिप्पणियां देखें · सिना वीबो