शोध से पता चलता है कि शैक्षणिक संस्थानों को एआई टेक्स्ट डिटेक्टरों पर बहुत अधिक भरोसा नहीं करना चाहिए।

छात्रों और शोधकर्ताओं द्वारा प्रस्तुत सामग्री की निगरानी के लिए एआई डिटेक्टरों का उपयोग करने वाले प्रत्येक शैक्षणिक संस्थान के लिए एक असहज विचार यह है: ये उपकरण उतने विश्वसनीय रूप से काम नहीं करते जितना संस्थान मानते हैं।

इस सप्ताह आयोजित 2026 आईईईई सिम्पोजियम ऑन सिक्योरिटी एंड प्राइवेसी में फ्लोरिडा विश्वविद्यालय के शोधकर्ताओं द्वारा प्रस्तुत एक शोध पत्र में यह निष्कर्ष निकाला गया है कि व्यावसायिक रूप से उपलब्ध एआई-जनित टेक्स्ट डिटेक्टर "शैक्षणिक या उच्च जोखिम वाले संदर्भों में तैनाती के लिए उपयुक्त नहीं हैं।"

इसका मतलब यह है कि विश्वविद्यालय ऐसे उपकरणों के परिणामों के आधार पर करियर बदलने वाले निर्णय ले रहे हैं जो मूल रूप से अविश्वसनीय हैं।

शोध में वास्तव में क्या पाया गया?

पैट्रिक ट्रेनर, पीएचडी, प्रोफेसर और यूएफ के कंप्यूटर और सूचना विज्ञान एवं इंजीनियरिंग विभाग के अंतरिम अध्यक्ष, ने एक टीम का नेतृत्व किया जिसने व्यावसायिक रूप से उपलब्ध पांच सबसे लोकप्रिय एआई टेक्स्ट डिटेक्टरों का परीक्षण किया।

ChatGPT के आने से पहले ही शीर्ष स्तरीय सुरक्षा सम्मेलनों में प्रस्तुत किए गए लगभग 6,000 शोध पत्रों का उपयोग करते हुए, उन्होंने एलएलएम से उन्हीं पत्रों की प्रतियां तैयार करवाईं, और फिर दोनों सेटों को एआई डिटेक्टरों के माध्यम से चलाया।

परिणामों से पता चला कि गलत सकारात्मक दरें 0.05% से 68.6% तक थीं, और इससे भी अधिक आश्चर्यजनक रूप से, गलत नकारात्मक दरें 0.3% से 99.6% के बीच थीं। ऊपरी आंकड़ा 100% के करीब है, जिसका अर्थ है कि सबसे खराब प्रदर्शन करने वाले डिटेक्टर ने लगभग सभी एआई-जनित टेक्स्ट को पहचानने में चूक की।

हालांकि पांच में से दो डिटेक्टरों ने शुरू में अच्छा प्रदर्शन किया, लेकिन शोधकर्ताओं द्वारा एलएलएम को अधिक जटिल शब्दावली का उपयोग करके अपने आउटपुट को फिर से लिखने के लिए कहने के बाद वे काफी हद तक बेकार हो गए (पेपर इसे लेक्सिकल कॉम्प्लेक्सिटी अटैक कहता है)।

शैक्षणिक ईमानदारी के अलावा यह बात क्यों मायने रखती है?

ट्रेनर ने साफ शब्दों में कहा: “हम वास्तव में इन फैसलों की सुनवाई के लिए इनका इस्तेमाल नहीं कर सकते। लोगों का करियर दांव पर लगा है।” किसी शोध पत्र में कृत्रिम बुद्धिमत्ता से लिखे गए लेख का आरोप किसी शोधकर्ता की प्रतिष्ठा को स्थायी रूप से नुकसान पहुंचा सकता है, लेकिन हम ऐसे आरोप लगाने वाले उपकरणों पर आँख बंद करके भरोसा नहीं कर सकते।

तर्क यह है कि अकादमिक लेखन में एआई के व्यापक उपयोग के बारे में मौजूद सबूत खुद ही अविश्वसनीय हैं। ट्रेयनोर ने आगे कहा, "जितने भी अध्ययन यह दावा करते हैं कि अकादमिक कार्यों का एक निश्चित प्रतिशत एआई द्वारा निर्मित है, वास्तव में हमारे पास इसे मापने के लिए कोई उपकरण नहीं हैं।"

उनका शोध केवल उपकरणों की आलोचना ही नहीं करता; यह उन सभी संस्थानों द्वारा उचित सावधानी बरतने में हुई प्रणालीगत विफलता को उजागर करता है जिन्होंने इन उपकरणों को अपनाने से पहले यह जानने के लिए सबूत नहीं मांगे कि वे सटीक हैं या नहीं।