गूगल ने सर्च बॉक्स का स्वरूप बदल दिया है, जिससे 5 अरब लोगों की ऑनलाइन आदतों में बदलाव आया है।

एंड्रॉइड शो के "प्रस्तावना" का आनंद लेने के बाद, असली मुख्य कार्यक्रम, गूगल आई/ओ 2026, आधिकारिक तौर पर शुरू हो गया।

जैसा कि उम्मीद थी, लगभग दो घंटे के इस आयोजन के दौरान मिथुन राशि ने बिल्कुल मध्य स्थान पर कब्जा जमाए रखा।

छवि | गूगल

बुनियादी मॉडल और परिधीय क्षमताओं को अपडेट करने के अलावा, जेमिनी को Google Apps सूट में और अधिक गहराई से एकीकृत किया गया है, और इसने iOS और macOS के लिए भी कुछ अपडेट लाए हैं।

दुर्भाग्यवश, पिछले सप्ताह अनावरण किए गए Googlebook और Android 17, दोनों का ही इस वर्ष के I/O के उद्घाटन कार्यक्रम में उल्लेख नहीं किया गया।

हमने जो एकमात्र हार्डवेयर उत्पाद देखा, वह सैमसंग के साथ मिलकर विकसित किया गया स्मार्ट ग्लास था:

छवि | गूगल

संक्षेप में, इस आई/ओ सम्मेलन में गूगल का संदेश बिल्कुल स्पष्ट है:

जेमिनी की क्षमताएं और मजबूत होंगी और इसकी उपस्थिति अधिक प्रमुख होगी, और दुनिया भर में अरबों गूगल उत्पाद उपयोगकर्ताओं के "भौतिक जीवन" के साथ इसका एकीकरण तेजी से घनिष्ठ होता जाएगा।

इसे नाटकीय ढंग से कहें तो—जेमिनी ग्रह लगभग एक मानवरूपी रोबोट के आने से लोगों के दैनिक कार्यों को अपने हाथ में लेने से बस एक कदम दूर है।

अंतर्निहित मॉडल अपडेट

इस पूरे आयोजन का सबसे महत्वपूर्ण हिस्सा जेमिनी के लिए कई अंतर्निहित मॉडलों का अद्यतन था।

सबसे पहले, जेमिनी 3.5 का आधिकारिक संस्करण जारी किया गया, और उपयोगकर्ता जिस पहले संस्करण का अनुभव कर सकते हैं वह जेमिनी 3.5 फ्लैश है।

यह फ्लैश सीरीज की गति को बनाए रखते हुए, कई आयामों में पिछले 2.5 प्रो के समान क्षमताओं का प्रदर्शन करता है:

छवि | गूगल

गति और प्रदर्शन के बीच संतुलन बनाए रखने के कारण, जेमिनी 3.5 फ्लैश के सर्वोत्तम अनुप्रयोगों में से एक महत्वपूर्ण टोकन ओवरहेड की बचत करते हुए दीर्घकालिक, बड़े पैमाने पर बुद्धिमान कार्यों को संभालना है।

इसी बीच, नवीनतम एंटीग्रेविटी इंटीग्रेशन जेमिनी 3.5 फ्लैश को आउटपुट विकल्पों की एक विस्तृत श्रृंखला भी प्रदान करता है।

वर्गीकरण कोड निष्पादित करें, अकादमिक शोध पत्रों पर आधारित गेम लिखें, प्राचीन कोडबेस को परिवर्तित करें, 3डी दृश्य बनाएं, इंटरैक्टिव वेब इंटरफेस बनाएं, और भी बहुत कुछ।

पुराने कोडबेस को Next.js में परिवर्तित करना | Google

इसके अतिरिक्त, सबसे बड़ा "विश्व मॉडल" जेमिनी ओम्नी है, जिसे गूगल के व्यापक दृष्टिकोण के संदर्भ में इस प्रकार वर्णित किया जा सकता है:

यह किसी भी इनपुट के आधार पर आपकी इच्छानुसार कुछ भी आउटपुट कर सकता है।

ओम्नी का पहला मॉडल उत्पाद जेमिनी ओम्नी फ्लैश है, जो जेमिनी ऐप के अलावा, गूगल फ्लो और यूट्यूब शॉर्ट्स में भी एकीकृत है, जिससे उपयोगकर्ता प्राकृतिक भाषा का उपयोग करके "सबसे यथार्थवादी" वीडियो बना सकते हैं।

छवि | गूगल

इसी के अनुरूप, Google ने अपने Google One सदस्यता मॉडल में भी बदलाव किया है, और मूल शीर्ष-स्तरीय AI Ultra प्लान में $100 प्रति माह का विकल्प जोड़ा है।

यह नई सदस्यता भी एआई अल्ट्रा श्रेणी का हिस्सा है और इसमें जेमिनी 3.5 फ्लैश, एंटीग्रेविटी 2.0 और अन्य नई सुविधाओं तक प्राथमिकता के आधार पर पहुंच शामिल है।

बेशक, इसमें पारंपरिक 20TB क्लाउड स्टोरेज और YouTube प्रीमियम एक्सेस भी शामिल हैं, जो मुख्य रूप से डेवलपर्स और उन्नत रचनाकारों को लक्षित करते हैं।

छवि | गूगल

इसी बीच, शीर्ष श्रेणी की एआई अल्ट्रा सदस्यता, जिसकी मूल कीमत 250 डॉलर थी, को घटाकर केवल 200 डॉलर प्रति माह कर दिया गया है, जिसमें एआई प्रो की तुलना में 20 गुना तक उपयोग क्रेडिट सहित कई विशेषाधिकार शामिल हैं।

मूल्य निर्धारण मॉडल में एक और बड़ा बदलाव जेमिनी ऐप में ही हुआ है।

चित्र | गूगल आई/ओ

एक प्रेस विज्ञप्ति में, गूगल ने घोषणा की कि वह जेमिनी की दैनिक सीमा को "कीवर्ड सीमा" से बदलकर "उपयोग-आधारित" कर देगा।

इस गणना से पता चलता है कि अधिक छवियों, वीडियो और कोड का उपयोग होता है, जबकि कम टेक्स्ट कार्यों का उपयोग होता है, जिसके परिणामस्वरूप कुल मिलाकर अधिक लचीला कंप्यूटिंग पावर बिलिंग मॉडल बनता है।

वास्तविक व्यावसायिक कार्यान्वयन

ओपनएआई और एंथ्रोपिक जैसी कंपनियों के विपरीत, गूगल का सबसे बड़ा फायदा यह है कि उसके पास वास्तव में एक ऐसा उत्पाद पारिस्थितिकी तंत्र है जो दुनिया भर में अरबों उपयोगकर्ताओं तक सीधे पहुंच सकता है।

उपर्युक्त बुनियादी मॉडलों के अलावा, जैसा कि इस बार प्रदर्शित हुआ है, Google की रणनीति इन "अमूर्त" एआई मॉडल क्षमताओं को उन ऐप्स में एकीकृत करने पर केंद्रित है जिनका उपयोग आम जनता हर दिन करती है।

छवि | स्लैशगियर

इस एकीकरण को मोटे तौर पर तीन चरणों में विभाजित किया जा सकता है: पारंपरिक खोज व्यवसाय का रूपांतरण , मोबाइल फोन प्रणालियों का बुद्धिमत्तापूर्णकरण और दृश्य बुद्धिमत्ता का विलय

गूगल के मूल व्यवसाय, "सर्च इंजन" में इस वर्ष के आई/ओ में एआई का पूर्ण रूपांतरण हुआ, जिसे गूगल "एआई सर्च का एक नया युग" कहता है।

इस व्यावसायिक बदलाव के पीछे का तर्क सरल है: 20 साल पहले की तुलना में जब लोग केवल खोज बॉक्स में शब्द या वाक्यांश दर्ज करते थे, अब लोग जटिल संयुक्त कमांड दर्ज करने के आदी हो गए हैं।

छवि | गूगल

दूसरे शब्दों में कहें तो, गूगल ने पारंपरिक सर्च बॉक्स को एक सार्वभौमिक चैटबॉक्स में बदल दिया है।

खोज करने के अलावा, उपयोगकर्ता ऐप के भीतर किसी भी प्रकार की सामग्री का अनुरोध कर सकते हैं।

यह इस आई/ओ इवेंट के लिए एक महत्वपूर्ण अपडेट भी है – एजेंट क्षमताओं के साथ खोज।

सबसे पहले, एआई मोड के बेसिक मॉडल को जेमिनी 3.5 में अपग्रेड किया जाएगा, और आपका सर्च बॉक्स आपके द्वारा दर्ज की गई सामग्री को स्वचालित रूप से सुझाएगा और पूरा करेगा, जिससे आपके कीवर्ड अधिक विस्तृत या व्यापक हो जाएंगे।

छवि | गूगल

इसके अलावा, एक बिल्कुल नया जनरेटिव यूआई आंसर फीचर भी है, जिसमें गूगल आपके द्वारा पूछे गए प्रश्न के आधार पर बुद्धिमानी से सबसे उपयुक्त उत्तर उत्पन्न करता है।

उदाहरण के लिए, जब स्टॉक ट्रेंड्स की खोज की जाती है, तो उत्तरों में न केवल टेक्स्ट शामिल होता है बल्कि लाइन चार्ट भी उत्पन्न होते हैं; जब इंटीरियर डिजाइन प्रेरणा के लिए पूछा जाता है, तो उत्तरों में चित्र उत्पन्न होते हैं…

यदि आप भौतिकी के प्रश्न खोजते हैं, तो यह एंटीग्रेविटी का उपयोग करके तुरंत एक इंटरैक्टिव वेब डेमो बना सकता है:

छवि | गूगल

इतने वर्षों तक "मल्टीमॉडल सर्च" का उपयोग करने के बाद, हम अंततः "मल्टीमॉडल रिस्पॉन्स" के युग में प्रवेश कर चुके हैं।

गूगल सर्च की एंटीग्रेविटी के साथ जुड़ने की क्षमता इससे कहीं आगे जाती है; यह और भी आगे जा सकती है, सर्च बॉक्स में आपके द्वारा टाइप किए गए टेक्स्ट के आधार पर वास्तविक समय में वेब-आधारित डैशबोर्ड या ट्रैकर तैयार कर सकती है।

सरल शब्दों में कहें तो, इसका मतलब यह है कि Google का सर्च बॉक्स सीधे आपकी विशिष्ट आवश्यकताओं के लिए एक समर्पित ऐप बनाता है।

यह मल्टीमॉडल क्षमता भयावह है; यह लोगों द्वारा जानकारी प्राप्त करने के तरीके को पूरी तरह से बदल भी सकती है।

आखिरकार, हम ज्यादातर चीजों को इसलिए खोजते हैं ताकि खोज परिणामों का उपयोग अन्य कार्यों के लिए कर सकें, और नई गूगल खोज सीधे आपको अगला कदम पूरा करने में मदद कर सकती है।

छवि | गूगल

इस "एजेंसी सेवा" की विशिष्ट विधि जेमिनी स्पार्क है।

सरल शब्दों में कहें तो, जेमिनी स्पार्क मूल रूप से एक "सिमेंटिक अंडरस्टैंडिंग-ऑटोमैटिक एग्जीक्यूशन" फ़ंक्शन है जो ओपनक्लॉ के समान है, जो एक गूगल क्लॉ है

जेमिनी स्पार्क नवीनतम जेमिनी 3.5 मॉडल पर आधारित है और 24/7 निर्बाध संचालन का समर्थन करता है।

इसके अलावा, चूंकि यह गूगल क्लाउड पर चलता है, इसलिए यह क्रॉस-प्लेटफ़ॉर्म प्रॉक्सी ऑपरेशन भी कर सकता है – मोबाइल फोन पर कार्य सौंपना और कंप्यूटर पर परिणाम प्राप्त करना।

छवि | गूगल

जेमिनी स्पार्क वर्तमान में सभी गूगल सूट ऐप्स का समर्थन करता है, और भविष्य में एमसीपी प्लेटफॉर्म का विस्तार करके इसे तृतीय-पक्ष ऐप्स के आंतरिक कार्यों के साथ संगत बनाएगा, साथ ही उपयोगकर्ताओं को अपने स्वयं के कौशल अपलोड करने की सुविधा भी प्रदान करेगा।

गूगल ने यह भी घोषणा की कि जेमिनी स्पार्क को भविष्य में क्रोम और एंड्रॉइड हेलो में एकीकृत किया जाएगा, जिससे बुद्धिमान एजेंटों को ब्राउज़र और मोबाइल फोन पर संचालन को स्वचालित करने की क्षमता मिलेगी।

एंड्रॉइड हेलो | गूगल

अंतिम चरण मिथुन राशि को दृश्य बुद्धि के साथ एकीकृत करना है।

इस आई/ओ इवेंट में, गूगल ने सैमसंग के साथ मिलकर विकसित किए गए अपने पहले "प्योर ऑडियो स्मार्ट ग्लासेस" उत्पाद का अनावरण किया, जिसमें क्रमशः जेंटल मॉन्स्टर और वारबी पार्कर फ्रेम का उपयोग किया गया है।

छवि | गूगल

कार्यक्षमता की दृष्टि से, ये केवल ऑडियो वाले चश्मे बाज़ार में मौजूद स्मार्ट चश्मों से बहुत अलग नहीं हैं। इनका मुख्य लाभ यह है कि ये जेमिनी के मल्टीमॉडल कार्यों को सीधे कॉल करके पहले बताई गई अन्य जटिल क्षमताओं तक पहुँच सकते हैं।

दूसरी ओर, XREAL के प्रोजेक्ट ऑरा, जो Google के सहयोग से विकसित स्क्रीन वाले स्मार्ट ग्लास हैं, को इस इवेंट में एक अपडेट मिला।

परिचय के अनुसार, प्रोजेक्ट ऑरा XREAL द्वारा स्वयं विकसित X1S स्थानिक कंप्यूटिंग चिप से सुसज्जित है और आरामदायक पहनने के लिए स्प्लिट डिज़ाइन को अपनाता है।

दूसरे शब्दों में, प्रोजेक्ट ऑरा के चश्मे वाला हिस्सा केवल डिस्प्ले के लिए जिम्मेदार है; वास्तविक प्रोसेसिंग चिप, बैटरी पैक और टचपैड को डेटा केबल के माध्यम से एक बाहरी पोर्टेबल यूनिट से कनेक्ट करने की आवश्यकता होती है।

छवि | द वर्ज

रोजमर्रा के व्यावहारिक कार्यों की बात करें तो, प्रोजेक्ट ऑरा गूगल मैप्स इमर्सिव नेविगेशन, विशाल स्क्रीन/विंडोड वीडियो प्लेबैक, यूट्यूब वीआर वीडियो, वेबएक्सआर 3डी पेंटिंग, डीपी एक्सटेंडेड लैपटॉप स्क्रीन और बहुत कुछ का समर्थन करेगा।

छवि | तकनीकी ब्लॉग

कुल मिलाकर, एंड्रॉइड XR एक दृश्य ऑपरेटिंग सिस्टम है जो पूरी तरह से स्थानिक कंप्यूटिंग पर आधारित है। जेमिनी की क्षमताओं के साथ मिलकर, यह हमें स्मार्ट ग्लास के भविष्य के लिए एक रोडमैप प्रदान करता है।

इससे भी महत्वपूर्ण बात यह है कि हालांकि एंड्रॉइड एक्सआर और एंड्रॉइड 17 वर्तमान में दो पूरी तरह से स्वतंत्र सिस्टम हैं, ठीक उसी तरह जैसे एंड्रॉइड और क्रोमओएस का विलय हुआ था, वे भविष्य में एक में विलय हो जाएंगे, और एक तरह का "विजुअल इंटेलिजेंस सिस्टम" बन जाएंगे।

क्या मिथुन राशि वाले सब कुछ अपने हाथ में ले सकते हैं?

पूरी रात जागकर गूगल आई/ओ देखने के बाद, जेमिनी 3.5 और उसके साथियों द्वारा लाए गए आश्चर्य के अलावा, हम बुनियादी मानवीय व्यवहार में एआई द्वारा लाई जा रही क्रांति से चकित हुए बिना नहीं रह सके।

चाहे वह जेमिनी 3.5 फ्लैश हो, एंटीग्रेविटी हो या जेमिनी स्पार्क, ये सभी एक साधारण "खोज संवाद बॉक्स" के पीछे छिपे हुए हैं, जो खोज करने की प्रक्रिया को "जानकारी प्राप्त करने" से "कार्य पूरा करने" में बदल देता है।

छवि | गूगल खोज

यह कहना मुश्किल है कि इस विकास का इंटरनेट और कृत्रिम बुद्धिमत्ता के हमारे उपयोग पर दीर्घकालिक प्रभाव क्या होगा, लेकिन हम कम से कम इसमें Google की महत्वाकांक्षा को देख सकते हैं।

एक शक्तिशाली एआई मॉडल को अभूतपूर्व कार्यक्षमता से लैस करना और इन कार्यों को अपने नेटवर्क उत्पादों में एकीकृत करना, जो दुनिया भर में अरबों उपयोगकर्ताओं तक पहुंचते हैं, जिससे इन अरबों लोगों की कार्यकुशलता में सुधार होता है।

जेमिनी द्वारा एक साथ इन सभी नेटवर्क उत्पादों में प्रवेश करने का एक दुष्प्रभाव यह है कि "अनुप्रयोग" की अवधारणा तेजी से कमजोर होती जा रही है।

एजेंट जितना अधिक सक्षम होगा, एप्लिकेशन के भीतर और खोज परिणाम पृष्ठों पर उसका मूल्य उतना ही कम हो जाएगा।

जहां तक ​​इस बात का सवाल है कि बुद्धिमत्ता की यह परत कितने पुराने नियमों को फिर से लिखेगी, इसका जवाब अभी कोई नहीं दे सकता, यहां तक ​​कि खुद गूगल भी नहीं।

#iFanr के आधिकारिक वीचैट अकाउंट को फॉलो करने के लिए आपका स्वागत है: iFanr (वीचैट आईडी: ifanr), जहां आपको जल्द से जल्द और भी रोमांचक सामग्री प्रस्तुत की जाएगी।