यह Google I/O 2024 की एकमात्र AI सुविधा है जिसका मैं उपयोग करने के लिए इंतजार नहीं कर सकता

Google Pixel 8 Pro पर Google फ़ोटो ऐप।
जो मारिंग/डिजिटल ट्रेंड्स

Google का मुख्य I/O 2024 मुख्य वक्ता ढेर सारे नए AI फीचर्स से भरा हुआ था, जो जेमिनी की बदौलत डेस्कटॉप और मोबाइल पर आ रहे हैं। वीडियो और मल्टीमॉडल प्रॉम्प्ट अनुरोधों के माध्यम से Google पर खोज करने के नए तरीके होंगे, जबकि स्मार्टफोन अंततः प्रोजेक्ट एस्ट्रा के साथ कैमरे के माध्यम से एआई सुपरपावर प्राप्त करेंगे।

लेकिन एक ऐसी सुविधा है जो वास्तव में मुझे पसंद आई: Google फ़ोटो में जेमिनी के साथ फ़ोटो पूछें

सबसे पहले, मिथुन क्या है?

स्मार्टफोन और पीसी पर चलने वाले AI के साथ Google का जेमिनी लोगो।
गूगल

सबसे पहले, मिथुन क्या है? यह मूल रूप से Google के AI मॉडल का परिवार है, जिसमें जेमिनी नैनो, जेमिनी प्रो और जेमिनी अल्ट्रा शामिल हैं। संक्षेप में, यह Google का OpenAI का संस्करण और ChatGPT की तरह उसका अपना GPT मॉडल है।

जेमिनी अन्य बड़े भाषा मॉडल (एलएलएम) जैसे ओपनएआई के जीपीटी की तरह टेक्स्ट को समझ और उत्पन्न कर सकता है। हालाँकि, जेमिनी कुछ और भी कर सकता है – यह छवियों, वीडियो, ऑडियो और यहां तक ​​कि कोड जैसी जानकारी के अन्य रूपों को समझता है, संचालित करता है और संयोजित करता है।

एंड्रॉइड स्मार्टफोन के लिए, यह जेमिनी नैनो का उपयोग करता है, जो डिवाइस पर ही स्थानीय रूप से संचालित होता है। जेमिनी नैनो मॉडल के लिए धन्यवाद, सर्किल टू सर्च जैसी मौजूदा सुविधाएं छात्रों को भौतिकी और गणित के होमवर्क में मदद करने की क्षमता के साथ और भी बेहतर हो जाएंगी।

यह आपकी स्क्रीन पर वर्तमान में क्या है, इसके बारे में और भी अधिक संदर्भ-जागरूक होगा, क्योंकि आप दर्जनों पृष्ठों को स्क्रॉल करने के बजाय मिथुन से उस वीडियो के बारे में प्रश्न पूछ सकेंगे जो आप देख रहे हैं या एक लंबी पीडीएफ जिसे आप ब्राउज़ कर रहे हैं। जेमिनी नैनो आपके स्मार्टफोन में मल्टीमॉडल क्षमताएं भी लाएगा, जैसे एक में कई अनुरोधों के साथ खोज क्वेरी।

Google का आस्क फ़ोटो पदार्पण।
गूगल

आस्क फोटोज विद जेमिनी, I/O 2024 में घोषित कई नई जेमिनी सुविधाओं में से एक है, और यह इस साल के अंत में Google Photos में होगी। संक्षेप में, आप कीवर्ड के बजाय अधिक संवादी दृष्टिकोण के साथ अपनी विशाल फोटो लाइब्रेरी में खोज कर सकते हैं।

Google I/O डेमो में, Google ने दिखाया कि आप बस पूछ सकते हैं, "मेरी लाइसेंस प्लेट फिर से क्या है?" या "मेरी बेटी ने तैरना कब सीखा?" उन अनुरोधों का उत्तर देने वाली तस्वीरें लाने के लिए।

यह "मुझे दिखाओ कि मेरी बेटी की तैराकी कैसे आगे बढ़ी है" जैसे अनुरोधों के साथ एक कदम आगे बढ़ जाती है। इस तरह के प्रश्न मिथुन को उचित परिणाम के लिए तिथि और संदर्भ के अनुसार आपकी तस्वीरों को देखने पर मजबूर करते हैं।

जैसे ही जेमिनी के साथ आस्क फोटोज को मंच पर दिखाया गया, मैं उत्साहित था, और मैं इस पर अपना हाथ रखने के लिए इंतजार नहीं कर सकता।

माता-पिता का एआई साथी

सैमसंग गैलेक्सी S24 मार्बल ग्रे रंग में Google फ़ोटो दिखा रहा है।
क्रिस्टीन रोमेरो-चान/डिजिटल रुझान

मैं केवल दो साल से कुछ अधिक समय से माँ बनी हूँ। लेकिन उस समय में, मैंने पहले से कहीं अधिक तस्वीरें ली हैं क्योंकि मुझे अपनी बेटी के सभी छोटे-छोटे पलों को कैद करना पसंद है, चाहे वह सिर्फ उसका प्यारा और मूर्खतापूर्ण होना हो या वे महत्वपूर्ण मील के पत्थर हों जिन्हें मैं एक फोटो या वीडियो में कैद करना चाहता हूं। 1टीबी आईफोन 15 प्रो और मेरे द्वारा परीक्षण किए गए अनगिनत एंड्रॉइड फोन के साथ, मैं हमेशा अपनी बेटी की तस्वीरें लेता रहता हूं।

आप सोच सकते हैं कि यह अति है – शायद यह है। लेकिन मेरे पास अपने माता-पिता के बचपन की बहुत सारी तस्वीरें, वीडियो तो दूर की बात है, नहीं हैं। उन्होंने वास्तव में मेरे सभी विशेष क्षणों को कैद नहीं किया, और मेरे पास केवल अस्पष्ट यादें हैं, कुछ भी अति विस्तृत या विशिष्ट नहीं है। अब हमारे पास जो भी तकनीक है, उससे मुझे यह सुनिश्चित करने में मदद मिली है कि मेरी बेटी के पास उसके बचपन के दृश्य साक्ष्य होंगे।

हालाँकि मैं परिवार के सदस्यों और चुनिंदा दोस्तों के साथ साझा करने के लिए तस्वीरें और वीडियो लेता हूं, लेकिन मैं ज्यादातर इन क्षणों को कैद करता हूं क्योंकि मैं बाद में उन्हें वापस देखना चाहता हूं। चाहे मैं बस अपने चेहरे पर मुस्कान लाने के लिए किसी त्वरित पिक-अप की तलाश में हूं या जब मैं एक वृद्ध महिला हूं और स्मृति लेन पर चलने की जरूरत है, तो मैं अपनी दृश्य स्मृतियों से काफी गुजरती हूं।

मोटो जी 5जी (2024) सेज ग्रीन में गूगल फोटो दिखा रहा है।
क्रिस्टीन रोमेरो-चान/डिजिटल रुझान

जेमिनी के साथ आस्क फोटोज के साथ, मैं विभिन्न जीवन घटनाओं के साथ अपनी बेटी की प्रगति दिखाने के लिए पूछने का इंतजार नहीं कर सकता। उदाहरण के लिए, हम उसे इस अगस्त में प्रीस्कूल में शुरू कर रहे हैं। मुझे जेमिनी से यह पूछना अच्छा लगेगा कि वह मुझे पूरे स्कूल में अपनी प्रगति दिखाए या बस प्रत्येक स्कूल वर्ष के लिए अपने सभी "पहले दिन" दिखाए। या जब वह बाइक चलाना सीखती है, तो मैं उसकी प्रगति को प्रशिक्षण पहियों से पूर्ण साइकिल पर परिवर्तित होते हुए देख सकता हूँ। अरे, जेमिनी मुझे तब भी दिखा सकता है जब मेरी बेटी हर साल अपने जन्मदिन के केक पर मोमबत्तियाँ बुझाती है।

मेरे लिए आस्क फोटोज का उपयोग करने की बहुत सारी संभावनाएं हैं, लेकिन ये केवल कुछ विचार हैं जो दिमाग में आते हैं। और जबकि यह माता-पिता के लिए उनके बच्चों के विकास के लिए बहुत अच्छा है, यह अन्य चीजों के लिए भी बहुत अच्छा है। मैं स्वयं को अपनी वर्षगाँठों, छुट्टियों और यहाँ तक कि अपने पालतू जानवरों के लिए भी इसका उपयोग करते हुए देख सकता हूँ।

निश्चित रूप से, मैं अब अपनी सभी तस्वीरें देख सकता हूं और चेहरों और कीवर्ड के साथ खोज सकता हूं। लेकिन जेमिनी के साथ आस्क फोटोज ऐसा करने का एक बहुत ही सरल, तेज और अधिक प्राकृतिक तरीका लगता है। और जब आपके पास 50,000 से अधिक फ़ोटो और वीडियो की फोटो लाइब्रेरी हो, तो मैं उसमें खोज करने का एक आसान तरीका उपयोग कर सकता हूं।

मैं इसका उपयोग करने के लिए इंतजार नहीं कर सकता

फ़ोन पर प्रोजेक्ट एस्ट्रा का प्रदर्शन।
गूगल

आस्क फोटोज एकमात्र जेमिनी एआई फीचर नहीं है जिसे Google ने Google I/O 2024 में दिखाया था। और जबकि यह वह है जिसके बारे में मैं इसकी व्यावहारिकता के कारण सबसे अधिक उत्साहित हूं, अन्य रोमांचक चीजें भी हैं जिन्हें मैं देखना चाहता हूं।

उदाहरण के लिए, प्रोजेक्ट एस्ट्रा दिलचस्प लग रहा था। मैं अक्सर अपने फ़ोन का उपयोग किसी ऐसी चीज़ की फ़ोटो खींचने के लिए करता हूँ जिसे मैं बाद के लिए सहेजना चाहता हूँ और जिसके बारे में अधिक जानना चाहता हूँ, जैसे पौधे और फूल। लेकिन एस्ट्रा के साथ, आपके पास कैमरे में ही एआई की खूबी होगी, और यह आपको बता सकता है कि आप वास्तविक समय में क्या देख रहे हैं। और यद्यपि Google ने किसी स्मार्ट चश्मे की घोषणा नहीं की , प्रोजेक्ट एस्ट्रा ने दिखाया कि किसी बिंदु पर स्मार्ट चश्मे में यह एक अविश्वसनीय सुविधा होगी।

मैं जेमिनी से संचालित Google खोज में मल्टीमॉडल प्रॉम्प्ट अनुरोधों को देखने के लिए भी काफी उत्सुक हूं। मैं उस तरह का व्यक्ति नहीं हूं जिसे किसी भी चीज की योजना बनाने में आनंद आता हो, इसलिए यदि Google मेरे लिए काम कर सकता है, तो मैं इसके लिए तैयार हूं। और हालांकि मुझे नहीं लगता कि रियल-टाइम स्कैम अलर्ट मेरे लिए बहुत उपयोगी होंगे (वैसे भी मैं कभी फोन का जवाब नहीं देता), यह दूसरों के लिए बहुत उपयोगी सुविधा होने जा रही है।

आस्क फोटोज विद जेमिनी इस गर्मी के अंत में Google Photos में आ जाएगा, और मैं इसे आज़माने के लिए इंतज़ार नहीं कर सकता।