लाइव चैट में एआई ट्यूरिंग टेस्ट पास कर सकता है, और इसका नवीनतम परिणाम चौंकाने वाला है। यूसी सैन डिएगो के एक अध्ययन में, जीपीटी-4.5 ने जजों को यह विश्वास दिलाने में वास्तविक प्रतिभागियों से बेहतर प्रदर्शन किया कि दूसरी तरफ एक व्यक्ति मौजूद है।
यह व्यवस्था सामान्य मानकों की तुलना में अधिक जटिल थी। न्यायाधीश स्थिर संकेतों के बजाय वास्तविक समय के आदान-प्रदान पर प्रतिक्रिया देते थे, और फिर केवल बातचीत के आधार पर त्वरित निर्णय लेते थे।
सबसे परेशान करने वाली बात यह है कि यह कौशल कितना जाना-पहचाना लगता है। मॉडल को शरीर, आवाज या जीवनी की आवश्यकता नहीं थी। उसे केवल किसी व्यक्ति की तरह आवाज निकालनी थी।
एआई ने मानव परीक्षण को कैसे मात दी?
इस अध्ययन में परीक्षण के तीन-पक्षीय संस्करण का उपयोग किया गया। जजों ने एक व्यक्ति और एक एआई मॉडल दोनों से बातचीत की, फिर यह चुना कि उन्हें कौन सा वास्तविक लगा।
जब GPT-4.5 को एक व्यक्तित्व संकेत दिया गया, तो उसे 73% बार मानव के रूप में पहचाना गया। LLaMa-3.1-405B ने भी उल्लेखनीय रूप से अच्छा प्रदर्शन किया और व्यक्तित्व संकेत दिए जाने पर 56% बार मानव के रूप में चुना गया।
ये आंकड़े इस निष्कर्ष को और भी पुख्ता बनाते हैं। मॉडल ने न केवल पहचान से बचने में कामयाबी हासिल की, बल्कि उसने जजों को इतने सामाजिक संकेत भी दिए कि वे चैट में मौजूद व्यक्ति को उसी के रूप में पहचान सकें।
यह परीक्षण अभी भी क्यों महत्वपूर्ण है?
ट्यूरिंग टेस्ट दशकों पुराना एक तरीका है यह जांचने का कि क्या कोई मशीन किसी व्यक्ति को धोखा देने के लिए मानव बातचीत की नकल कर सकती है। इसके पारंपरिक संस्करण में, एक मूल्यांकनकर्ता प्रतिभागियों को देखे बिना उनसे बातचीत करता है, फिर मशीन और इंसान के बीच अंतर करने की कोशिश करता है।
यह हमेशा से एक सटीक माप से कहीं अधिक सांस्कृतिक प्रतीक रहा है। फिर भी, यह वह कसौटी बनी हुई है जिसे लोग तब पहचानते हैं जब वे यह जानना चाहते हैं कि कोई सॉफ्टवेयर हमारे जैसा काम कर सकता है या नहीं।
इससे नया परिणाम अधिक सटीक लगता है। किसी चैटबॉट को यह आभास देने के लिए चेतना, भावना या आत्म-जागरूकता की आवश्यकता नहीं होती कि कोई वास्तविक व्यक्ति जवाब दे रहा है। उसे केवल उस क्षण में विश्वसनीय होना चाहिए।
यह जोखिम आम जगहों पर भी दिखाई देता है। ग्राहक सहायता, डेटिंग ऐप्स, सोशल प्लेटफॉर्म, शिक्षा और राजनीतिक संदेश, ये सभी पहचान, इरादे और प्रामाणिकता के बारे में त्वरित निर्णयों पर निर्भर करते हैं।
अब हमें आगे क्या देखना चाहिए?
यह अध्ययन इस बात का दावा करने से बचता है कि चैटबॉट इंसानों को समझते हैं। इसका अधिक व्यावहारिक निष्कर्ष यह है कि कुछ मॉडल अब संक्षिप्त बातचीत में व्यक्ति की तरह व्यवहार करने में बेहद सक्षम हैं।
स्पष्ट जानकारी देना अगला महत्वपूर्ण मुद्दा होना चाहिए। जब कोई बॉट सामान्य बातचीत में घुलमिल जाता है, तो उपयोगकर्ताओं को यह स्पष्ट संकेत मिलना चाहिए कि वे किसी सॉफ़्टवेयर से निपट रहे हैं, खासकर उन जगहों पर जहां बातचीत में अनुनय या भावनात्मक संवेदनशीलता हावी होती है।
अगला विवाद चैट में लेबलिंग को लेकर है, जहां लोग भरोसे के बारे में तुरंत निर्णय लेते हैं।