भव्यता पर सादगी की विजय! गूगल का सबसे शक्तिशाली लघु मॉडल अभी-अभी लॉन्च हुआ है, और यह मोबाइल फोन पर भी चलता है।

"ओपन" और "ओपन सोर्स" सिर्फ अलग-अलग शब्द नहीं हैं।

गूगल की जेम्मा सीरीज़ दो साल पहले रिलीज़ हुई थी। डेवलपर इसे डाउनलोड करके स्थानीय रूप से चला सकते हैं, लेकिन इसका उपयोग सीमित है, पुनर्वितरण प्रतिबंधित है, और इसमें किए गए बदलावों को स्वतंत्र रूप से वितरित नहीं किया जा सकता है। इसे ज़्यादा से ज़्यादा "ओपन" कहा जा सकता है, और यह एआई समुदाय के "ओपन सोर्स" मानक को पूरा नहीं करता है।

▲ गूगल डीपमाइंड के सीईओ डेमिस हसाबिस

हाल ही में, Google ने Gemma 4 सीरीज़ के चार मॉडल लॉन्च किए हैं, जो पूरी तरह से ओपन सोर्स हैं और Apache 2.0 को सपोर्ट करते हैं। इसका सबसे छोटा वर्जन Raspberry Pi पर पूरी तरह से ऑफलाइन चल सकता है। Gemma मिनी मॉडल अब सचमुच सभी के लिए सुलभ हो गया है।

छोटा, नन्हा…

जेम्मा 4 को चार आकारों में जारी किया गया था, जो जेमिनी 3 के समान अंतर्निहित तकनीक साझा करता है, और एज डिवाइस से लेकर उच्च-प्रदर्शन वर्कस्टेशन तक के हार्डवेयर को कवर करता है:

E2B / E4B: मोबाइल फोन और IoT उपकरणों के लिए विशेष रूप से डिज़ाइन किया गया, Google Pixel टीम, Qualcomm और MediaTek के साथ गहन सहयोग से अनुकूलित किया गया। इन्फ़रेंसिंग के दौरान, मेमोरी और बिजली की खपत को कम करने के लिए क्रमशः केवल 2B और 4B पैरामीटर ही सक्रिय किए जाते हैं।

यह 128K कॉन्टेक्स्ट विंडो को सपोर्ट करता है, इमेज, वीडियो और नेटिव ऑडियो इनपुट क्षमताएं प्रदान करता है, और Pixel फोन, Raspberry Pi और Jetson Orin Nano पर लगभग शून्य लेटेंसी के साथ पूरी तरह से ऑफलाइन चलता है। Android डेवलपर अब AICore डेवलपर प्रीव्यू के माध्यम से एजेंट मोड का अनुभव पहले ही कर सकते हैं।

26B MoE: एक हाइब्रिड विशेषज्ञ आर्किटेक्चर जो अनुमान प्रक्रिया के दौरान सभी मापदंडों में से केवल 3.8 बिलियन को ही सक्रिय करता है, उच्च गुणवत्ता बनाए रखते हुए अत्यंत तीव्र अनुमान गति सुनिश्चित करता है। इसने एरेना एआई पर 1441 का टेक्स्ट स्कोर प्राप्त किया, जो ओपन-सोर्स मॉडलों में छठा स्थान है।

31B Dense: बेहतरीन रॉ परफॉर्मेंस हासिल करने के उद्देश्य से, Arena AI ने 1452 का टेक्स्ट स्कोर प्राप्त किया, जो ओपन-सोर्स मॉडलों में तीसरे स्थान पर है। अनक्वांटाइज़्ड bfloat16 वेट्स एक सिंगल 80GB NVIDIA H100 पर चल सकते हैं, जबकि क्वांटाइज़्ड वर्जन कंज्यूमर-ग्रेड GPU को सपोर्ट करता है, जिससे लोकल फाइन-ट्यूनिंग के लिए एक मजबूत आधार मिलता है।

क्षमताओं के मामले में, चारों मॉडल अत्यधिक सुसंगत हैं: सभी बहु-चरणीय अनुमान और जटिल तर्क का समर्थन करते हैं; मूल रूप से फ़ंक्शन कॉल, JSON संरचित आउटपुट और सिस्टम कमांड का समर्थन करते हैं, जिससे स्वायत्त एजेंटों का निर्माण संभव होता है जो बाहरी उपकरणों और API के साथ बातचीत कर सकते हैं; छवि और वीडियो इनपुट का समर्थन करते हैं, और OCR और चार्ट समझ जैसे दृश्य कार्यों में उत्कृष्ट हैं; और 140 से अधिक भाषाओं में पूर्व-प्रशिक्षित हैं।

संस्करण 26B और 31B के लिए संदर्भ विंडो को 256K तक और विस्तारित किया गया है, जिससे एक ही प्रॉम्प्ट में संपूर्ण कोडबेस या एक लंबा दस्तावेज़ पास करना संभव हो जाता है।

बेंचमार्क परीक्षण के आंकड़े इस पीढ़ी में किए गए उन्नयन की सीमा को अधिक सहज रूप से दर्शा सकते हैं।

अपने पूर्ववर्ती, जेम्मा 3 27बी की तुलना में, जेम्मा 4 31बी ने गणितीय तर्क बेंचमार्क एआईएमई 2026 पर 20.8% से 89.2% तक की छलांग लगाई, कोडिंग क्षमता बेंचमार्क लाइवकोडबेंच v6 पर 29.1% से 80.0% तक का सुधार किया, और τ2-बेंच पर 6.6% से 86.4% तक उल्लेखनीय वृद्धि दर्ज की, जो एजेंट की टूल आह्वान क्षमताओं को मापता है।

ये तीनों डेटा बिंदु विशेष रूप से महत्वपूर्ण हैं क्योंकि ये आज के तीन सबसे मुख्य अनुप्रयोग परिदृश्यों से सीधे मेल खाते हैं: तर्क, प्रोग्रामिंग और एजेंट।

पैरामीटर दक्षता एक और महत्वपूर्ण आयाम है। "मॉडल प्रदर्शन बनाम पैरामीटर मात्रा" के स्कैटर प्लॉट को देखने पर, जेम्मा 4 ने केवल 26 और 31 पैरामीटर के साथ ऐसे एलो स्कोर प्राप्त किए हैं जिनके लिए आमतौर पर सैकड़ों अरबों या यहां तक ​​कि खरबों पैरामीटर की आवश्यकता होती है।

26B MoE का एरेना AI स्कोर Qwen3.5-397B-A17B के लगभग बराबर है, जिसमें लगभग 15 गुना अधिक पैरामीटर हैं, जबकि 31B Dense का स्कोर GLM-5 के समान स्तर पर है, जिसमें 600 से अधिक पैरामीटर हैं। Google इसे "प्रति यूनिट पैरामीटर अभूतपूर्व बुद्धिमत्ता घनत्व" के रूप में सारांशित करता है, और कम से कम आंकड़े तो तर्कसंगत प्रतीत होते हैं।

एज मॉडल पर भी ध्यान देना चाहिए।

E2B ने बहुभाषी प्रश्न-उत्तर बेंचमार्क MMMLU पर 60.0% और वैज्ञानिक ज्ञान बेंचमार्क GPQA डायमंड पर 43.4% अंक प्राप्त किए। यह ध्यान देने योग्य है कि यह केवल एक ऐसा मॉडल है जो 2B पैरामीटर को सक्रिय करता है और मोबाइल डिवाइस पर चलता है। तुलनात्मक रूप से, Gemma 3 27B ने GPQA डायमंड पर 42.4% अंक प्राप्त किए, जिससे दोनों लगभग समान हो जाते हैं।

दूसरे शब्दों में कहें तो, मोबाइल फोन पर मौजूद 2B मॉडल ने 27 अरब पैरामीटर के साथ डेस्कटॉप मॉडल की पिछली पीढ़ी की बराबरी कर ली है।

हार्डवेयर इकोसिस्टम स्तर पर, NVIDIA और Google ने RTX GPUs पर Gemma 4 के इन्फरेंस ऑप्टिमाइजेशन, DGX Spark पर्सनल AI सुपरकंप्यूटर और Jetson Orin Nano पर सहयोग किया है।

NVIDIA टेन्सर कोर और CUDA सॉफ़्टवेयर स्टैक Gemma 4 को उच्च थ्रूपुट और कम विलंबता की सुविधा प्रदान करते हैं। स्थानीय एजेंट एप्लिकेशन OpenClaw भी नवीनतम मॉडल के अनुरूप है, जो स्थानीय उपयोगकर्ता फ़ाइलों और एप्लिकेशन संदर्भ को कॉल करके स्वचालित कार्य निष्पादन को सक्षम बनाता है।

"ओपन" से "ओपन सोर्स" की ओर, एक और संभावना खुल जाती है।

इस रिलीज़ को समझने के लिए, जेम्मा और जेमिनी के बीच संबंध को स्पष्ट करना आवश्यक है। दोनों एक ही शोध और प्रौद्योगिकी प्रणाली पर आधारित हैं, लेकिन अंतर यह है कि जेमिनी एक सदस्यता-आधारित क्लोज्ड-सोर्स उत्पाद है, जबकि जेम्मा एक ओपन-सोर्स मॉडल है जिसे मुफ्त में डाउनलोड किया जा सकता है और स्थानीय रूप से चलाया जा सकता है।

जेम्मा श्रृंखला हमेशा से Google की स्वामित्व वाली सेवा शर्तों का उपयोग करती रही है।

हालांकि डेवलपर इसे डाउनलोड करके स्थानीय रूप से चला सकते हैं, लेकिन इसके उपयोग और पुनर्वितरण पर प्रतिबंध हैं, इसलिए सख्ती से कहें तो इसे केवल "ओपन" कहा जा सकता है, "ओपन सोर्स" नहीं। गूगल के पास अभी भी इसका पूरा नियंत्रण है।

Gemma 4 को आधिकारिक तौर पर Apache 2.0 लाइसेंस में बदल दिया गया है। इस लाइसेंस के तहत, डेवलपर्स रॉयल्टी का भुगतान किए बिना, बिना किसी उपयोग प्रतिबंध के, व्यक्तिगत, व्यावसायिक और उद्यम उपयोग सहित किसी भी उद्देश्य के लिए मॉडल का उपयोग कर सकते हैं, और इसे संशोधित और पुनर्वितरित करने के लिए भी पूरी तरह से स्वतंत्र हैं।

अपाचे 2.0 में एक अंतर्निहित पेटेंट सुरक्षा तंत्र भी शामिल है: योगदानकर्ताओं के पेटेंट स्वचालित रूप से उपयोगकर्ताओं को लाइसेंस प्राप्त होते हैं, और यदि कोई उपयोगकर्ता पेटेंट उल्लंघन के लिए किसी अन्य पक्ष पर मुकदमा करता है, तो लाइसेंस स्वतः ही रद्द हो जाता है। यह दोतरफा प्रावधान उद्यम उपयोगकर्ताओं को अतिरिक्त कानूनी सुरक्षा प्रदान करता है।

इस ओपन-सोर्स रिलीज़ का असली महत्व यह है कि जेम्मा 4 को अब कानूनी तौर पर उत्पादों, सेवाओं और हार्डवेयर उपकरणों के हिस्से के रूप में पैकेज करके वितरित किया जा सकता है। स्वास्थ्य सेवा और वित्त जैसे डेटा संप्रभुता या अनुपालन आवश्यकताओं वाले उद्योगों में उपयोगकर्ताओं के लिए, पूरी तरह से स्थानीय संचालन का मतलब है कि डेटा को क्लाउड पर अपलोड करने की आवश्यकता नहीं है, फिर भी अत्याधुनिक एआई क्षमताओं तक पहुंच प्राप्त होती है।

हगिंग फेस के सह-संस्थापक और सीईओ क्लेमेंट डेलैंग्यू ने लाइसेंसिंग में बदलाव को "एक महत्वपूर्ण उपलब्धि" बताया। फरवरी 2024 में अपनी पहली रिलीज़ के बाद से, जेम्मा श्रृंखला को 400 मिलियन से अधिक बार डाउनलोड किया जा चुका है, जिसमें समुदाय द्वारा विकसित 100,000 से अधिक वेरिएंट शामिल हैं।

मॉडल वेट अब हगिंग फेस, कैगल और ओलाम पर उपलब्ध हैं, और ट्रांसफॉर्मर्स, टीआरएल, वीएलएलएम, llama.cpp, एमएलएक्स, अनस्लोथ, एसजीलैंग और केरस जैसे मुख्यधारा के फ्रेमवर्क ने रिलीज के दिन से ही इनके लिए समर्थन प्रदान किया है।

GGUF फॉर्मेट के वेट्स के साथ Ollam या llama.cpp का उपयोग करके लोकल डिप्लॉयमेंट को तुरंत शुरू किया जा सकता है, जबकि Unsloth Studio क्वांटाइजेशन मॉडल को फाइन-ट्यून करने और डिप्लॉय करने के लिए एक साथ सपोर्ट प्रदान करता है। क्लाउड विस्तार के लिए, Google Vertex AI, Cloud Run और GKE भी उपलब्ध हैं।

जेम्मा 4 जैसे छोटे मॉडल अधिक महत्व रखते हैं क्योंकि वे एक मूलभूत प्रश्न का पुनः उत्तर देते हैं: एआई को कहाँ संचालित होना चाहिए?

पिछले दो वर्षों से, इस प्रश्न का उत्तर लगभग हमेशा डिफ़ॉल्ट ही रहा है:

डेटा केंद्र। उपयोगकर्ता नेटवर्क इंटरफेस के माध्यम से क्लाउड मॉडल तक पहुँच प्राप्त करते हैं, जिसके लिए डेटा अपलोड करना और निर्भर कनेक्शनों का उपयोग करना आवश्यक होता है, और लागत सेवा प्रदाता द्वारा निर्धारित की जाती है। यह मॉडल उपभोक्ता परिदृश्यों में काफी अच्छी तरह से काम करता है, लेकिन स्वास्थ्य सेवा, वित्त और विनिर्माण जैसे मजबूत डेटा संप्रभुता आवश्यकताओं वाले उद्योगों के लिए, यह एक महत्वपूर्ण बाधा बना हुआ है।

जेम्मा 4 एक और संभावना प्रस्तुत करती है।

मोबाइल फोन, रास्पबेरी पाई और फैक्ट्री टर्मिनल, जिनमें बाहरी नेटवर्क की सुविधा नहीं है, सभी स्थानीय स्तर पर मॉडल इन्फरेंस का काम पूरा कर सकते हैं। डेटा डिवाइस से बाहर नहीं जाता और निर्णय क्लाउड के माध्यम से नहीं भेजे जाते। अपाचे 2.0 लाइसेंस इसके अनुप्रयोग के दायरे को और भी बढ़ाता है: मॉडल को कानूनी रूप से हार्डवेयर उत्पादों में पैक किया जा सकता है और औद्योगिक उपकरणों पर पहले से इंस्टॉल किया जा सकता है, अब कॉलिंग प्रोटोकॉल और डेटा निर्यात पर अनुपालन संबंधी कोई प्रतिबंध लागू नहीं होता।

प्रदर्शन संबंधी मापदंड भी इस दृष्टिकोण की व्यवहार्यता की पुष्टि करते हैं। GPQA डायमंड वैज्ञानिक ज्ञान बेंचमार्क पर E2B का स्कोर पिछली पीढ़ी के 27 अरब मापदंडों वाले डेस्कटॉप मॉडल के लगभग बराबर है, जबकि यह अनुमान प्रक्रिया के दौरान केवल 2 अरब मापदंडों को सक्रिय करता है और मोबाइल फोन पर पूरी तरह से ऑफ़लाइन चल सकता है।

इस बदलाव को "सस्ता" या "अधिक सुविधाजनक" जैसे शब्दों से वर्णित करना अब पर्याप्त नहीं है; यह कवरेज के विस्तार के अधिक करीब है, जिसमें एआई क्षमताएं उन परिदृश्यों में सही मायने में प्रवेश करना शुरू कर रही हैं जो लंबे समय से इससे बाहर थे।

ऑपरेटिंग सिस्टम के लोकप्रिय होने की प्रक्रिया भी कुछ इसी तरह की रही है: पेशेवर संगठनों द्वारा उपयोग किए जाने वाले विशेष उपकरणों से लेकर धीरे-धीरे हर व्यक्तिगत उपकरण में समाहित हो जाने तक, यहाँ तक कि लोग इसके अस्तित्व को भी महसूस करना बंद कर देते हैं। कृत्रिम बुद्धिमत्ता अभी उस स्तर से बहुत दूर है; इंजीनियरिंग, अंतःक्रिया और विश्वसनीयता से संबंधित मुद्दे अभी पूरी तरह से हल नहीं हुए हैं। हालांकि, किसी भी उपकरण पर चलने की क्षमता निस्संदेह इस दिशा में सबसे मूलभूत और महत्वपूर्ण कदम है।

#iFanr के आधिकारिक WeChat अकाउंट को फॉलो करने के लिए आपका स्वागत है: iFanr (WeChat ID: ifanr), जहां आपको जल्द से जल्द और भी रोमांचक सामग्री प्रस्तुत की जाएगी।