एआई मॉडल के नामकरण की रहस्यमय दुनिया में, "इंस्टेंट" और "लाइट" जैसे प्रत्ययों के साथ लंबे समय से सस्तेपन का एक अस्पष्ट भाव जुड़ा हुआ है।
इसके पीछे एक कारण है। अतीत में, इस प्रकार के मॉडलों को आम तौर पर तेज़ लेकिन धीमी सोच वाला माना जाता था, जो पाठ का सारांश बनाने के लिए मुश्किल से ही पर्याप्त थे, और थोड़े अधिक जटिल तर्क कार्यों का सामना करने पर निरर्थक बातें करने की प्रवृत्ति रखते थे।
समय के साथ, हल्के मॉडल लगभग "बस काम चलाऊ" होने के पर्याय बन गए हैं।

अभी हाल ही में, OpenAI और Google एक बार फिर आमने-सामने आ गए, अपने-अपने हल्के मॉडल जारी किए और अपनी दमदार क्षमता से इस धारणा को बदलने की कोशिश की। यहाँ इसका एक सरलीकृत संस्करण दिया गया है:
- GPT-5.3 इंस्टेंट: एक अधिक "मानवीय" बुद्धिमान सहायक जो भ्रम की संभावना को काफी हद तक कम करता है, कृत्रिम बुद्धिमत्ता के लहजे को न्यूनतम करता है और विस्तृत लेखन क्षमताओं को बढ़ाता है। संचार अधिक स्वाभाविक और सटीक होता है, जिससे यह उच्च गुणवत्ता वाली सामग्री की आवश्यकता वाले परिदृश्यों (लेखन, पेशेवर प्रश्नोत्तर, उच्च जोखिम वाले क्षेत्र) के लिए उपयुक्त है।
- जेमिनी 3.1 फ्लैश-लाइट: सस्ता, तेज और कुशल होने के साथ-साथ, यह "सोच के स्तर" के समायोजन का भी समर्थन करता है, जिससे गहन तार्किक तर्क को समायोजित करते हुए उच्च थ्रूपुट बनाए रखा जा सकता है, जो इसे बड़े पैमाने पर, उच्च वास्तविक समय बैच कार्यों (सामग्री मॉडरेशन, यूआई जनरेशन, एनपीसी संवाद) के लिए उपयुक्त बनाता है।
GPT-5.3 Instant: मैंने आखिरकार एक सामान्य व्यक्ति की तरह चैट करना सीख लिया है।
ChatGPT का नियमित रूप से उपयोग करने वाले लोगों ने शायद इस निराशा का अनुभव किया होगा: आप बस यूं ही एक छोटा सा प्रश्न पूछते हैं, और यह आपको एक लंबा स्पष्टीकरण देने पर अड़ा रहता है, जैसे, "एक कृत्रिम बुद्धिमत्ता होने के नाते, मुझे आपको याद दिलाना होगा…"
लोगों को काम करने का तरीका सिखाने की कोशिश करने वाला यह "एआई-शैली" वाला तरीका वाकई बहुत परेशान करने वाला है। सौभाग्य से, इस बार ओपनएआई ने हमारी बात सुनी है।
हाल ही में जारी किए गए GPT-5.3 Instant ने इस "समस्या" को ठीक करने में काफी मेहनत की है। इसने लंबे-चौड़े स्पष्टीकरण देने के बजाय सीधे जवाब देना सीख लिया है।

कम शब्दों का प्रयोग करने के अलावा, यह अधिक विश्वसनीय भी हो गया है। पुराना संस्करण, वेब पर खोज करने के बाद, अक्सर आपको ढेर सारे लिंक और अप्रासंगिक जानकारी प्रस्तुत करता था।
अपनी उन्नत खोज क्षमताओं के बदौलत, GPT-5.3 Instant वेबपेज की सामग्री को अपने स्वयं के पृष्ठभूमि ज्ञान के साथ सक्रिय रूप से जोड़ता है, पहले यह पता लगाता है कि आप वास्तव में क्या पूछना चाहते हैं और फिर एक केंद्रित उत्तर प्रदान करता है, बजाय इसके कि खोज इंजन का काम आपको सौंप दिया जाए।

ओपनएआई के आंतरिक मूल्यांकन से पता चलता है कि इंटरनेट से कनेक्ट होने पर मतिभ्रम की दर में 26.8% की कमी आई और केवल आंतरिक ज्ञान पर निर्भर रहने पर 19.7% की कमी आई। आधिकारिक रिपोर्ट में विशेष रूप से स्वास्थ्य सेवा, कानून और वित्त जैसे उच्च जोखिम वाले क्षेत्रों का उल्लेख किया गया है, जहां नया मॉडल सावधानी और सटीकता दोनों में महत्वपूर्ण सुधार दिखाता है।
सबसे आश्चर्यजनक बात तो वास्तव में इसकी लेखन शैली में आया बदलाव है।
ओपनएआई ने एक कविता के उदाहरण से इसे समझाया: दोनों संस्करण फिलाडेल्फिया के एक डाकिया के सेवानिवृत्ति के अंतिम दिन का वर्णन करते हैं। पुराने संस्करण में "अपने डाक बैग में शहर को ढोना" जैसे भावुक वाक्यांशों का प्रयोग किया गया है, जबकि नए संस्करण में "टूटी-फूटी नीली रेलिंग" और "वह द्वार जहाँ हमेशा एक कुत्ता इंतज़ार करता है" का वर्णन है। भावनाओं को जबरदस्ती प्रकट करने की आवश्यकता नहीं है; वे स्वाभाविक रूप से प्रवाहित होती हैं।

लहजे को समायोजित करना भी इस अपडेट के मुख्य लक्ष्यों में से एक है।
"रुको। गहरी सांस लो।" जैसे वाक्यांश, जो बातचीत के प्रवाह को बाधित करते हैं, उन्हें जानबूझकर कम कर दिया गया है, जिसके परिणामस्वरूप समग्र शैली अधिक सीधी और अनावश्यक "एआई टोन" से रहित हो गई है। उपयोगकर्ता अभी भी सेटिंग्स में जाकर उत्तरों की गर्माहट और उत्साह को अनुकूलित कर सकते हैं ताकि वे अपनी पसंदीदा बातचीत शैली पा सकें।

आज से ChatGPT के सभी उपयोगकर्ताओं के लिए GPT-5.3 Instant उपलब्ध है, जिसका API नाम "gpt-5.3-chat-latest" है। सशुल्क उपयोगकर्ता पुराने मॉडलों में GPT-5.2 Instant का उपयोग जारी रख सकते हैं, लेकिन इसे इस वर्ष 3 जून को आधिकारिक तौर पर बंद कर दिया जाएगा।

▲ बोनस समय
जेमिनी 3.1 फ्लैश-लाइट: सस्ता, तेज और काफी स्मार्ट।
जीपीटी-5.3 इंस्टेंट के सीधे-सादे दृष्टिकोण की तुलना में, जेमिनी 3.1 फ्लैश-लाइट पूरी तरह से व्यावहारिक दृष्टिकोण अपनाता है, जिसका एक बहुत ही स्पष्ट लक्ष्य है: तेज और सस्ता होना।

मूल्य निर्धारण के संदर्भ में, जेमिनी 3.1 फ्लैश-लाइट की इनपुट कीमत 0.25 डॉलर प्रति मिलियन टोकन और आउटपुट कीमत 1.50 डॉलर प्रति मिलियन टोकन है।
इसका क्या मतलब है? यदि आप एक डेवलपर हैं, तो इसका मतलब है कि आप एआई से पांच पूरी हैरी पॉटर किताबों के बराबर सामग्री को 2 आरएमबी से भी कम में पढ़वा सकते हैं।
क्या आपको लगता है कि सस्ती चीजें अच्छी नहीं होतीं? यह एक संकीर्ण सोच को दर्शाता है।
आर्टिफिशियल एनालिसिस के बेंचमार्क परीक्षणों के अनुसार, पिछली पीढ़ी के जेमिनी 2.5 फ्लैश की तुलना में, 3.1 फ्लैश-लाइट का फर्स्ट-वर्ड रिस्पॉन्स टाइम (टीटीएफटी) 2.5 गुना तेज है और कुल आउटपुट गति 45% तेज है। जिन उत्पादों को रीयल-टाइम रिस्पॉन्स की आवश्यकता होती है, उनके उपयोगकर्ताओं को यह विलंबता अंतर स्पष्ट रूप से दिखाई देगा।

इसका मतलब यह है कि जब आप पलक झपका रहे होते हैं, तब तक इसका जवाब आधा तैयार हो चुका होता है। ऐसे एप्लिकेशन के लिए जिन्हें रीयल-टाइम फीडबैक की आवश्यकता होती है—जैसे कि तुरंत अनुवाद, गेम में NPC संवाद और तुरंत UI जनरेशन—यह कम लेटेंसी बेहद ज़रूरी है।
इसके अलावा, जेमिनी 3.1 फ्लैश-लाइट में "सोचने" की क्षमता भी है।
एआई स्टूडियो और वर्टेक्स एआई में, गूगल ने इस लाइट मॉडल को "थिंकिंग लेवल्स" के विकल्प से लैस किया है। डेवलपर्स कार्य की जटिलता के आधार पर यह समायोजित कर सकते हैं कि मॉडल कितनी गहराई तक "सोचता" है।

बैच कंटेंट ट्रांसलेशन और कंटेंट मॉडरेशन जैसे सरल, उच्च-थ्रूपुट कार्यों को सबसे हल्के कॉन्फ़िगरेशन के साथ जल्दी से पूरा किया जा सकता है; इंटरफ़ेस जनरेशन या सिमुलेशन निर्माण जैसे निर्देशों का कड़ाई से पालन करने वाले कार्यों के लिए, मॉडल परिणामों को पुष्ट करने के लिए अनुमान लगाने में अधिक समय व्यतीत कर सकता है।
इस "सब कुछ हासिल करने" की क्षमता ने प्रभावशाली परिणाम दिए हैं। Arena.ai के लीडरबोर्ड पर, इसने 1432 का एलो स्कोर और 86.9% की GPQA डायमंड (स्नातक स्तरीय प्रश्न उत्तर) सटीकता दर प्राप्त की है।
इसने अकादमिक मानक GPQA डायमंड पर 86.9% और मल्टीमॉडल अंडरस्टैंडिंग MMMU प्रो पर 76.8% अंक प्राप्त किए। ये आंकड़े न केवल "समान मूल्य सीमा में अच्छे" हैं, बल्कि सीधे तौर पर बड़े आकार के जेमिनी 2.5 फ्लैश को भी पीछे छोड़ देते हैं।

ध्यान दें कि यहां तुलना जेमिनी 2.5 फ्लैश से की जा रही है, न कि जेमिनी 3 फ्लैश से, जो स्पष्ट रूप से दर्शाता है कि गूगल, चालाकी से, इस मॉडल पर भी ज्यादा भरोसा नहीं करता था।

वर्तमान में, फ्लैश-लाइट 3.1 डेवलपर्स के लिए Google AI Studio और Gemini API के माध्यम से पूर्वावलोकन रूप में उपलब्ध है, जबकि उद्यम उपयोगकर्ता इसे Vertex AI के माध्यम से एक्सेस कर सकते हैं। Latitude, Cartwheel और Wheling जैसे शुरुआती भागीदारों ने उत्पादन परीक्षण पूरा कर लिया है और बड़े पैमाने पर कॉल के तहत इसकी स्थिरता और निर्देश अनुपालन को स्वीकार किया है।
यदि आप इन दोनों मॉडलों को साथ-साथ देखें, तो आपको पता चलेगा कि "इंस्टेंट" और "लाइट" अपने लिए सबसे उपयुक्त स्थान पा रहे हैं।
हाल ही में लोकप्रिय हुए ओपनक्लॉ को ही उदाहरण के तौर पर लें। इसका मूल उद्देश्य उपयोगकर्ताओं को ईमेल प्रोसेस करने और शेड्यूल मैनेज करने में मदद करना है। संक्षेप में, यह एक ऐसा एजेंट है जिसे स्वायत्त रूप से कार्य करने की आवश्यकता होती है।
इस प्रकार के उत्पाद में मॉडलों की आवश्यकताएं सामान्य चैटबॉट से पूरी तरह से अलग होती हैं: इसमें मॉडल को बहुत बुद्धिमान होने की आवश्यकता नहीं होती है, बल्कि इसमें मॉडल को एक इंसान की तरह बोलने, गलतियाँ न करने और उच्च आवृत्ति वाली कॉलों को सहन करने में सक्षम होने की आवश्यकता होती है।

GPT-5.3 Instant मतिभ्रम की दर को काफी कम कर देता है, जिसका अर्थ है कि एजेंट स्वायत्त रूप से कार्य करते समय कम गलतियाँ करता है; "एआई आवाज" में कमी का मतलब है कि उत्पन्न ईमेल और दस्तावेज़ वास्तविक लोगों की पढ़ने की आदतों की तरह अधिक पढ़े जाते हैं।
जेमिनी 3.1 फ्लैश-लाइट तीसरी, सबसे महत्वपूर्ण आवश्यकता को बेहतर ढंग से पूरा करता है। जब एजेंट बैकग्राउंड में चल रहा होता है, तो उसे अक्सर समानांतर रूप से बड़ी संख्या में उप-कार्यों को संसाधित करने की आवश्यकता होती है, जिससे यह प्रतिक्रिया गति और एपीआई लागत के प्रति अत्यधिक संवेदनशील हो जाता है।
फ्लैश-लाइट की बेहद तेज प्रतिक्रिया गति और किफायती लागत, साथ ही इसकी "सोचने की क्षमता" जो कंप्यूटिंग शक्ति के लचीले आवंटन की अनुमति देती है, इस अत्यधिक लचीली वास्तुकला को उच्च-समवर्ती स्वचालित कार्यों के लिए वरदान बनाती है।
यद्यपि दोनों मॉडलों की दीर्घकालिक स्थिरता का अभी अवलोकन किया जाना बाकी है, फिर भी सामान्य दिशा स्पष्ट है: एक मॉडल का उद्देश्य अंतःक्रिया को अधिक मानवीय बनाना है, जबकि दूसरा गति और लागत-प्रभावशीलता पर केंद्रित है। भविष्य में जब हर किसी के पास "लॉबस्टर" होगा, तब हल्का मॉडल अधिक स्वाभाविक और व्यावहारिक विकल्प बन जाएगा।
संदर्भ पता संलग्न है:
https://openai.com/index/gpt-5-3-instant/
https://gemini.google.com/u/4/app/e0bea96b8f62bd1f
#iFanr के आधिकारिक वीचैट अकाउंट को फॉलो करने के लिए आपका स्वागत है: iFanr (वीचैट आईडी: ifanr), जहां आपको जल्द से जल्द और भी रोमांचक सामग्री प्रस्तुत की जाएगी।