एप्पल ने जेमिनी पर अपने एआई भविष्य की बाजी लगाई है। जानिए कैसे यह आपके लिए आईफोन को नए सिरे से परिभाषित कर सकता है।

तकनीकी जगत की सबसे बड़ी घोषणाओं में से एक – और दुनिया की दो सबसे बड़ी तकनीकी कंपनियों के बीच – सौ शब्दों से भी कम के एक संक्षिप्त संयुक्त बयान में समाहित कर दी गई। एप्पल ने घोषणा की कि जेमिनी, सिरी असिस्टेंट के पुनर्जन्म और आईफोन और मैक पर एआई सॉफ्टवेयर अनुभवों को शक्ति प्रदान करने वाले फ्रेमवर्क को शक्ति प्रदान करेगा।

कंपनी ने कहा, "ये मॉडल भविष्य में आने वाले Apple इंटेलिजेंस फीचर्स को शक्ति प्रदान करने में मदद करेंगे, जिनमें इस साल आने वाली अधिक वैयक्तिकृत सिरी भी शामिल है।" यह Google के लिए एक बड़ी जीत है, Apple डिवाइस उपयोगकर्ताओं के लिए अच्छी खबर है , और यह Apple की इस बात की स्वीकारोक्ति है कि वह Google, Meta या OpenAI की तरह AI की दौड़ में अग्रणी नहीं बन सकता।

इसके संकेत काफी समय से मिल रहे थे । एक समय ऐसा भी था जब Apple कथित तौर पर Siri को पावर देने के लिए Anthropic के Claude और OpenAI के GPT मॉडल का इस्तेमाल करने की कोशिश कर रहा था। लेकिन आखिरकार कंपनी ने Google को चुना, जो Gemini की क्षमताओं का एक बड़ा प्रमाण है। आइए जानते हैं कि आप और मेरे जैसे लाखों iPhone उपयोगकर्ताओं के लिए आगे क्या होने की संभावना है

तो, अह, निजता?

कृत्रिम बुद्धिमत्ता (एआई) के साथ एक बड़ी दुविधा है जिसे नज़रअंदाज़ करना मुश्किल है। एआई चैटबॉट हमारे जीवन में सोशल मीडिया से कहीं अधिक गहराई तक प्रवेश करते हैं। चैटबॉट हमारे ईमेल, कैलेंडर, गैलरी, फाइलों और, ज़ाहिर है, हमारे रोज़मर्रा के विचारों तक पहुँच रखते हैं। विशेषज्ञ पहले से ही मानव और एआई के बीच बढ़ते गहरे भावनात्मक जुड़ाव की समस्या से जूझ रहे हैं।

लेकिन बात यहीं खत्म नहीं होती। जब भी हम किसी AI चैटबॉट को बुलाते हैं, तो डेटा प्रोसेसिंग के लिए कंपनी के सर्वर पर भेजा जाता है। कुछ मामलों में, इसे मॉडल ट्रेनिंग या सुरक्षा के लिए स्टोर किया जाता है, और आप इससे बच नहीं सकते। इसका समाधान क्या है? ऑन-डिवाइस AI। उदाहरण के लिए, जेमिनी नैनो एक ऑन-डिवाइस तकनीक है जो आपके फोन या पीसी के लोकल सिलिकॉन पर चलती है।

आपके फ़ोन से कोई डेटा बाहर नहीं जाता। लेकिन यह धीमा है और इसकी क्षमता उतनी नहीं है। मीडिया से जुड़े कामों या अन्य जटिल कार्यों के लिए क्लाउड प्रोसेसिंग अनिवार्य है। तो, क्या आप इसके लिए तैयार हैं, खासकर Google के इतिहास को देखते हुए, क्योंकि अब Google आपके iPhone और Mac पर AI अनुभव प्रदान कर रहा है? खैर, Apple के पास पहले से ही इसका समाधान है, और Gemini के AI अनुभव प्रदान करने के साथ ही गोपनीयता को लेकर Apple काफी स्पष्ट है।

कंपनी का कहना है, “Apple Intelligence, Apple के उद्योग-अग्रणी गोपनीयता मानकों को बनाए रखते हुए, Apple उपकरणों और प्राइवेट क्लाउड कंप्यूट पर चलता रहेगा।” इसका मतलब है कि आपका डेटा और AI से जुड़ी गतिविधियाँ केवल प्राइवेट क्लाउड कंप्यूट सर्वरों के माध्यम से ही भेजी जाएँगी, जो विशेष रूप से Apple सिलिकॉन और कंपनी के सुरक्षा-प्रथम ऑपरेटिंग सिस्टम पर आधारित हैं।

“हमारा मानना ​​है कि PCC बड़े पैमाने पर क्लाउड AI कंप्यूटिंग के लिए अब तक तैनात की गई सबसे उन्नत सुरक्षा प्रणाली है,” Apple का दावा है। PCC के साथ, डेटा आपके फ़ोन से निकलते ही एन्क्रिप्ट हो जाता है। और एक बार निर्धारित कार्य पूरा हो जाने पर, उपयोगकर्ता का अनुरोध और साझा की गई सामग्री सर्वर से हटा दी जाती है।

उपयोगकर्ता का कोई भी डेटा सहेजा नहीं जाता है, और क्लाउड सर्वरों पर जो कुछ भी पहुंचता है, वह Apple के लिए उपलब्ध नहीं होता है। जेमिनी केवल आपके टेक्स्ट या वॉइस कमांड को प्रोसेस करने के लिए आवश्यक इंटेलिजेंस प्रदान करता है। इसके बाद का सारा काम Google के पास जाने के बजाय Apple के सुरक्षित सर्वरों पर सुरक्षित रूप से किया जाता है।

आगे क्या?

अगर आपने कभी जेमिनी का इस्तेमाल किया है और फिर सिरी से वही काम करने को कहा है (और उसे नाकाम होते देखा है), तो आपको फर्क पता होगा । गूगल और एप्पल की हालिया साझेदारी इस अंतर को कम कर रही है। और इससे भी महत्वपूर्ण बात यह है कि यह एप्पल को अपने खुद के अनूठे एआई अनुभव पेश करने का मौका दे रही है।

सामान्य तौर पर, जेमिनी एआई फ्रेमवर्क सिरी और एप्पल इंटेलिजेंस को बेहतर बनाएगा। लेकिन कैसे? यह अभी स्पष्ट नहीं है, क्योंकि एप्पल इसे हूबहू कॉपी-पेस्ट नहीं करेगा। इन अगली पीढ़ी के एआई फीचर्स को आपके आईफोन पर पेश करते समय आपको शायद ही कोई स्पष्ट जेमिनी ब्रांडिंग देखने को मिलेगी।

एप्पल सिर्फ दिमाग उधार ले रहा है। शरीर और व्यवहार तो हमेशा की तरह एप्पल के ही होंगे।

फिर भी, अगर आप जेमिनी की उन क्षमताओं की तुलना करें जो एंड्रॉयड फोन पर पहले से ही मौजूद हैं और जो सिरी नहीं कर सकती, तो आपको अपने आईफोन, आईपैड और मैक में आने वाली प्रगति का अंदाजा लग जाएगा। दरअसल, एप्पल सिर्फ एप्पल इंटेलिजेंस और सिरी के लिए जेमिनी की अंतर्निहित एआई तकनीक का उपयोग नहीं कर रहा है। यह इससे कहीं अधिक व्यापक है।

अगली पीढ़ी के एप्पल फाउंडेशन मॉडल के लिए एप्पल गूगल के एआई टूलकिट का उपयोग करेगा। इन मॉडलों को एप्पल इंटेलिजेंस की उन खास खूबियों के रूप में समझें जो सारांश, लेखन उपकरण, छवि निर्माण और यहां तक ​​कि क्रॉस-ऐप क्रियाओं को सक्षम बनाती हैं।

ये मॉडल, जिन्हें 2024 में पेश किया गया था, या तो किसी डिवाइस पर स्थानीय रूप से (इंटरनेट कनेक्शन की आवश्यकता के बिना) या Apple के क्लाउड सर्वरों पर चल सकते हैं। एक साल बाद, Apple ने अपडेटेड वर्जन पेश किए जो तेज़ थे, मीडिया प्रोसेसिंग में अधिक सक्षम थे, बेहतर भाषा समझ रखते थे और अधिक भाषाओं के लिए समर्थन प्रदान करते थे।

सबसे बड़ा आकर्षण यह था कि फाउंडेशन मॉडल्स फ्रेमवर्क डेवलपर्स को डिवाइस पर मौजूद एआई की क्षमताओं का लाभ उठाने और उपयोगकर्ता अनुभव को बेहतर बनाने में मदद करेगा। कल्पना कीजिए कि आप स्पॉटिफाई खोलते हैं, और मैन्युअल काम करने के बजाय, आप सिरी को बुलाते हैं और उसे "इस महीने मेरे सबसे ज्यादा सुने गए गानों की प्लेलिस्ट बनाओ" जैसा कमांड देते हैं।

यह सुविधा फिलहाल आईफोन पर उपलब्ध नहीं है।

सिरी की एक और कमजोरी इसकी अंतर्निहित बुद्धिमत्ता है। जब भी आप बुनियादी सवालों से परे कोई प्रश्न पूछते हैं, तो यह उन्हें चैटजीपीटी को भेज देता है। गूगल पिक्सल 10 प्रो जैसे एंड्रॉइड डिवाइस पर जेमिनी के साथ, उत्तर तुरंत मिलते हैं और अन्य ऐप्स में कार्यों को निर्बाध रूप से निष्पादित किया जा सकता है।

उदाहरण के लिए, मैं जेमिनी को कह सकता हूँ कि "व्हाट्सएप पर सबा को एक मैसेज भेजो, जिसमें उससे आज की क्लास की स्थिति पूछी जाए," और यह मेरी बहन को मैसेजिंग ऐप में मैसेज भेजकर मेरी बात मान लेगा। Google के वर्कस्पेस ऐप्स और सेवाएं पहले से ही अच्छी तरह से एकीकृत हैं, जिससे उपयोगकर्ता जीमेल, कैलेंडर, ड्राइव और ऐसी अन्य सेवाओं पर वॉइस कमांड से काम कर सकते हैं।

मेरे इनबॉक्स से यात्रा बुकिंग की जानकारी ढूंढना, किसी फ़ाइल की सामग्री देखना, या बस कैलेंडर शेड्यूल की जाँच करना, जेमिनी यह सब कर सकता है। सिरी इस स्तर की सुविधा के आसपास भी नहीं है। और यहीं पर जेमिनी एप्पल के लिए भी मददगार साबित होता है।

एक नई शुरुआत

एप्पल ने स्पष्ट रूप से कहा है कि जेमिनी "एप्पल फाउंडेशन मॉडल्स की अगली पीढ़ी" को शक्ति प्रदान करेगा। इसका मतलब है कि सिरी अपनी वर्तमान रोबोटिक स्थिति की तुलना में प्राकृतिक भाषा के आदेशों को अधिक सहजता से समझ पाएगी और आईफोन पर कार्यों को संभाल पाएगी। जेमिनी के इस नवाचार से कई लाभ मिल सकते हैं।

iPhone या Mac पर मौजूद यूनिवर्सल सर्च सिस्टम को बेहतर बनाया जाएगा और यह अधिक संवादात्मक हो जाएगा। Apple उत्पादों में Notes, Music, Mail आदि जैसे कार्यों को उन ऐप्स को खोले बिना ही वॉइस या टेक्स्ट कमांड से पूरा किया जा सकेगा। और सबसे महत्वपूर्ण बात, यह सुविधा अन्य ऐप्स में भी उपलब्ध होगी।

ऐप इंटेंट्स के साथ, कंपनी के पास पहले से ही थर्ड-पार्टी ऐप्स पर काम करने के लिए तैयार ढांचा मौजूद है। हालांकि, यह अभी तक पूरी तरह से लोकप्रिय नहीं हो पाया है, शायद इसलिए क्योंकि डेवलपर्स ने उपलब्ध एआई मॉडल्स को उतना स्मार्ट नहीं माना। जेमिनी द्वारा ऑन-डिवाइस एआई क्रियाओं को शक्ति प्रदान करने के साथ, अधिक डेवलपर्स आत्मविश्वास से अपने ऐप्स में संवादात्मक एआई-संचालित क्रियाओं को अपनाएंगे।

कल्पना कीजिए कि Siri बिना ऐप्स खोले ही आपके लिए सभी ऐप्स पर काम कर रही है। iPhone पर आप इसका अनुभव कर सकते हैं । ChatGPT ऐप खोलें, ऐप कनेक्टर्स को सक्षम करें और सामान्य भाषा के निर्देशों का उपयोग करके आप Apple Music सहित दर्जनों ऐप्स पर कार्य कर सकते हैं।

लेकिन इसमें एक बात ध्यान रखने वाली है। आप ChatGPT को किसी अन्य ऐप से (लॉगिन के ज़रिए) जोड़ रहे हैं, जिसका मतलब है कि OpenAI आपके बारे में ज़्यादा जानकारी हासिल कर लेता है। जब यही काम ऑपरेटिंग सिस्टम के बिल्ट-इन फ्रेमवर्क का इस्तेमाल करके किया जाता है, तो गोपनीयता का जोखिम सैद्धांतिक रूप से कम होता है। साथ ही, पूरी कार्यप्रणाली ज़्यादा सुगम होगी।

एप्पल कई अन्य तरीकों से गूगल की जेमिनी रणनीति की नकल कर सकता है। उसे बस अपने ऐप्स में सिरी को तैनात करना है, लेकिन कोपायलट, एलेक्सा+ और जेमिनी के साथ हमने जो अंधाधुंध तरीके से सिरी को थोपा है, उससे कहीं अधिक कम दखलंदाजी वाले और सोच-समझकर तरीके से। एप्पल इस मामले में माहिर है, और मैं इस साल के अंत तक कंपनी के एआई विजन को साकार होते देखने के लिए काफी उत्साहित हूं।

एंड्रॉइड और गूगल सेवाओं के माध्यम से वेब पर जेमिनी के प्रदर्शन से एप्पल बहुत कुछ सीख सकता है। और अब जब जेमिनी की तकनीक उसके हाथ में है, तो वह इसे अपने ऐप्स और सेवाओं में संशोधित और एकीकृत कर सकता है – एप्पल के विशिष्ट अंदाज में।

सबसे बड़ा सवाल यह है कि Apple इंटेलिजेंस के केंद्र में मौजूद ChatGPT का क्या होगा? आने वाले महीनों में, और संभवतः जून में Apple के अगले डेवलपर सम्मेलन में, हमें इसके बारे में और अधिक जानकारी मिलेगी। लेकिन फिलहाल, Siri (और Apple हार्डवेयर पर AI) का भविष्य मेरे और आपके जैसे आम उपयोगकर्ता के लिए पहले से कहीं अधिक उज्ज्वल दिख रहा है!

Apple ने Gemini पर अपने AI भविष्य की बाजी लगाई है। जानिए यह आपके लिए iPhone को किस तरह से नया रूप दे सकता है। यह लेख सबसे पहले Digital Trends पर प्रकाशित हुआ था।