अंत में मुहर उठा ली गई है! छवि पहचान समारोह का समर्थन करने के लिए बिंग ने चैटजीपीटी में नेतृत्व किया, न केवल मेम्स को समझ सकता है, वेब पेज लिख सकता है, बल्कि “एक डॉक्टर को भी देख सकता है”

इस वर्ष मार्च में GPT-4 जारी करते समय OpenAI द्वारा उल्लेखित मल्टीमॉडल क्षमताओं को याद रखें?

▲ GPT-4 उत्तर डेमो, मशीन द्वारा अनुवादित

GPT-4 छवि इनपुट का समर्थन करता है, और मेम्स, भौतिकी की समस्याओं और कागजात को समझ सकता है। एक बार रिलीज़ होने के बाद, इसने सभी को चौंका दिया। यह GPT-3.5 की तुलना में GPT-4 का सबसे बड़ा अपग्रेड पॉइंट भी है।

दुर्भाग्य से, OpenAI का कहना है कि छवि इनपुट सुविधा अभी भी एक शोध पूर्वावलोकन है और अभी तक जनता के लिए उपलब्ध नहीं है।

▲ एक चित्र पहचान चिह्न जोड़ा गया इससे चित्र: Reddit

हालाँकि, हाल ही में एक Reddit netizens ने पाया कि उसके बिंग चैट खाते ने चुपचाप चित्र अपलोड करने के लिए एक प्रविष्टि जोड़ दी थी।

Microsoft ने पहले खुलासा किया था कि बिंग चैट GPT-4 मॉडल का उपयोग करता है, और पिछले महीने बड़े अपडेट लॉग में उल्लेख किया गया था कि यह बिंग के लिए बहु-मोडल समर्थन जोड़ देगा। कुल मिलाकर, बिंग चैट को धीरे-धीरे उपयोगकर्ताओं के ओपन मैप के लिए विकसित किए जाने की संभावना है मान्यता समारोह परीक्षण।

इस नेटीजन ने बिंग चैट पर बहुत सारे परीक्षण किए हैं, देखते हैं कि "लंबी आंखों" वाला बिंग चैट कितना शक्तिशाली है।

पहला GPT-4 मेम्स देखने का सबसे अद्भुत कार्य है। GPT-4 न केवल तस्वीर की सामग्री को समझ सकता है, बल्कि इंसानों की तरह मीम के चुटकुलों का विश्लेषण भी कर सकता है।

उदाहरण के लिए, इस मेम में, GPT-4 देख सकता है कि चित्र यह व्यक्त करना चाहता है कि iPhone को चार्ज करने के लिए पुराने VGA-आकार के इंटरफ़ेस का उपयोग करना बेतुका है, और हंसी का परिचय देना बेतुका है।

▲ मशीन द्वारा अनुवादित

नेटिज़ेंस ने परीक्षण के लिए बिंग चैट पर समान मेम अपलोड किए, और एक अजीब बात हुई: बिंग चैट ने यह नहीं पहचाना कि यह एक वीजीए इंटरफ़ेस था, इसलिए यह मजाक "प्राप्त" नहीं कर सका, लेकिन बिंग चैट ने अभी भी 151 शिडी ने तस्वीरों को डिक्रिप्ट किया , यहां तक ​​कि केबल का ब्रांड भी बताया, और अधिक विस्तृत जानकारी दी।

यह बिंग चैट की आकस्मिक त्रुटि हो सकती है, या यह हो सकता है कि Microsoft ने GPT-4 के वास्तविक अनुप्रयोग में अधिक प्रतिबंध समायोजन किए हैं, जिसके परिणामस्वरूप उत्तर में विचलन हुआ है।

नेटिज़न्स ने मशीन लर्निंग के बारे में एक और मीम कार्टून अपलोड किया, और इस बार बिंग चैट तस्वीर में सामग्री और चुटकुलों का अधिक सटीक उत्तर देने में सक्षम था।

कार में कपड़े इस्त्री करने के एक और मीम का बिंग चैट का विश्लेषण भी सही है।

▲ यहाँ अनुवाद गलत है, मूल पाठ है: दीदी काँग, पायरा, पिकाचु, जीरो सूट सैमस, गधा काँग, सोनिक द हेजहोग, नेस, क्लाउड स्ट्राइफ़, और इनकिनेरोर

बिंग चैट की छवि पहचान कितनी सटीक है? उन्होंने "निंटेंडो स्मैश ब्रोस" के पात्रों की एक तस्वीर अपलोड की। एक ही तस्वीर पर बहुत सारे पात्र व्यवस्थित हैं, और बिंग चैट को सभी पात्रों को एक-एक करके पहचानने के लिए कहा।

परिणामस्वरूप, बिंग चैट ने 12 में से 7 वर्णों को पहचान लिया, और ऐसा लगता है कि द्वि-आयामी समस्या अभी भी उसके लिए थोड़ी कठिन है।

जब OpenAI जारी किया गया था, तो उसने हाथ से एक तस्वीर लेकर एक वेबपेज की प्रोग्रामिंग करने का मामला भी दिखाया। नेटीजन ने बिंग का परीक्षण करने के लिए हाथ से एक तस्वीर भी खींची।

आइए लंबे कोड लिंक को छोड़ दें और सीधे इस पेज के चलने के प्रभाव को देखें। यह देखा जा सकता है कि मूल वेब पेज का प्रोटोटाइप अभी भी बना हुआ है।

पिक्चर रिकग्निशन फंक्शन को जोड़ने से बिंग चैट में बहुत सारे उपयोग जुड़ जाते हैं। आखिरकार, वास्तविकता में कई सामग्री (जैसे सूत्र और चार्ट) को शब्दों में स्पष्ट रूप से व्यक्त करना मुश्किल होता है। इस समय, पाने के लिए बस एआई को एक तस्वीर फेंक दें उत्तर।

उदाहरण के लिए, अर्धसूत्रीविभाजन के दौरान गुणसूत्रों के पार होने की प्रक्रिया की व्याख्या करें।

इसे जीव विज्ञान शिक्षक की भूमिका निभाने दें और विश्लेषण करें कि नेफ्रॉन निस्पंदन कैसे काम करता है।

यहां तक ​​कि इसे त्वचा रोगों के निदान के लिए एक ऑनलाइन डॉक्टर के रूप में भी इस्तेमाल किया जा सकता है।

इससे पहले, चैटजीपीटी को अपनी उत्कृष्ट पाठ समझ और अभिव्यक्ति कौशल के कारण विदेशी भाषाओं को सीखने और मौखिक अंग्रेजी का अभ्यास करने के लिए विकसित किया गया था।

दृश्य पहचान जोड़ने के बाद, बिंग चैट छात्रों को जटिल गणितीय, भौतिक और रासायनिक समस्याओं का उत्तर देने में मदद करने के लिए एक मिडिल स्कूल, हाई स्कूल या यहां तक ​​कि विश्वविद्यालय के शिक्षक की भूमिका भी निभा सकता है। यदि भविष्य में छवि पहचान समारोह को बढ़ावा दिया जा सकता है, तो यह हल हो सकता है कुछ हद तक शिक्षा की समस्या असंतुलित संसाधनों की समस्या।

उपयोगकर्ता इसका उपयोग बुनियादी चिकित्सा निदान के लिए भी कर सकते हैं, चिकित्सा उपचार के लिए आवश्यक धन और समय की बचत, आम जनता के लिए एआई के मूल्य को दर्शाते हैं।

बेशक, हालांकि बिंग चैट मूल रूप से वास्तविक दुनिया की सामग्री को समझ सकता है, इसके जवाबों को आखिरकार केवल एक संदर्भ के रूप में इस्तेमाल किया जा सकता है, और इसे पेशेवर सलाह के रूप में नहीं माना जा सकता है।

इसलिए, यदि मानचित्र पहचान फ़ंक्शन को पूरी तरह से जनता के लिए खोला जाना है, तो Microsoft को यह सुनिश्चित करने के लिए बहुत सारे प्रतिबंध और डिबगिंग करने की आवश्यकता है कि AI के उत्तर पर अविश्वास करने के कारण जनता को सुरक्षा समस्या नहीं होगी।

अल्पावधि में, बिंग चैट छवि पहचान केवल कुछ उपयोगकर्ताओं के लिए उपलब्ध एक परीक्षण फ़ंक्शन होना चाहिए। यदि आप रुचि रखते हैं, तो आप तुरंत अपने Microsoft खाते में लॉग इन कर सकते हैं यह देखने के लिए कि बिंग के चैट बार पर एक और है या नहीं चैट चित्र आइकन।

वर्तमान में Bing चैट सभी Microsoft खातों के लिए खुला है, आइए और यह देखने के लिए ब्लाइंड बॉक्स खोलें कि आपने परीक्षण योग्यता प्राप्त की है या नहीं ⬇

https://www.bing.com/new

बकवास काटो।

#Aifaner के आधिकारिक WeChat सार्वजनिक खाते पर ध्यान देने के लिए आपका स्वागत है: Aifaner (WeChat ID: ifanr), जितनी जल्दी हो सके आपके लिए अधिक रोमांचक सामग्री प्रस्तुत की जाएगी।

ऐ फैनर | मूल लिंक · टिप्पणियाँ देखें · सिना वीबो