आप ChatGPT को 2GB मेमोरी के साथ चला सकते हैं! यह घरेलू स्तर पर निर्मित “छोटी स्टील तोप” हुआवेई ओवी को उनके एआई अनुभव में बाधाओं को तोड़ने की अनुमति देगी।

एआई की इस लहर में, वॉल-फेसिंग इंटेलिजेंस चीन के कुछ बड़े हेड मॉडल निर्माताओं में से एक है जो ऑल इन एंड-टू-साइड मॉडल को चुनता है।

चूंकि वॉलफेस इंटेलिजेंस ने फरवरी में उच्च प्रदर्शन वाली छोटी स्टील तोप 1.0 जारी की थी, इसलिए इसे लगातार महीनों में अपग्रेड किया गया है, उनमें से बाद में लॉन्च किए गए ओपन सोर्स मॉडल MiniCPM-Llama3-V 2.5 को इसकी मजबूतता के कारण स्टैनफोर्ड एआई टीम द्वारा चोरी कर लिया गया था। ताकत।

अप्रैल में, वॉलफेस इंटेलिजेंस सीटीओ ज़ेंग गुओयांग ने भी भविष्यवाणी की थी कि GPT-3.5 स्तर के मॉडल एक या दो साल के भीतर मोबाइल उपकरणों पर चलने में सक्षम होंगे।

अच्छी खबर यह है कि आपको अगले एक से दो साल तक इंतजार करने की जरूरत नहीं है, क्योंकि आज जारी मिनीसीपीएम 3.0 ने छोटी स्टील तोप की पहली पीढ़ी जारी होने पर ध्वज सेट हासिल कर लिया है: जीपीटी-3.5 स्तर के मॉडल को चलाने की अनुमति देना इस वर्ष के भीतर डिवाइस.

केवल 4बी मापदंडों के साथ, मिनीसीपीएम 3.0 का प्रदर्शन जीपीटी-3.5 से अधिक है। मिनीसीपीएम 3.0 "डिवाइस-साइड चैटजीपीटी" क्षण के आगमन का भी प्रतीक है।

सीधे शब्दों में कहें तो, मिनीसीपीएम 3.0 के लॉन्च का मतलब है कि उपयोगकर्ता भविष्य में क्लाउड प्रोसेसिंग पर भरोसा किए बिना तेज, सुरक्षित और सुविधा संपन्न स्थानीय एआई सेवाओं का अनुभव कर सकते हैं, और एक सहज और अधिक निजी बुद्धिमान इंटरैक्शन अनुभव प्राप्त कर सकते हैं।

अधिकारी द्वारा साझा किए गए बेंचमार्क परीक्षणों से देखते हुए, MiniCPM 3.0 उन बेंचमार्क परीक्षणों में सर्वश्रेष्ठ है जो CMMLU और CEVAL जैसी चीनी दक्षता पर ध्यान केंद्रित करते हैं, Phi-3.5 और GPT-3.5 जैसे मॉडल को आसानी से कुचल देते हैं।

8बी और 9बी जैसे उत्कृष्ट घरेलू बड़े मॉडलों के मुकाबले भी, मिनीसीपीएम 3.0 का प्रदर्शन अभी भी उत्कृष्ट है।

आइए MiniCPM 3.0 की विशेषताओं का संक्षेप में वर्णन करें:

  • असीमित पाठ, सूची प्रदर्शन किमी से आगे है
  • GPT-4o के तुलनीय प्रदर्शन के साथ, अंत की ओर सबसे मजबूत फ़ंक्शन कॉल
  • सुपर शक्तिशाली आरएजी थ्री-पीस प्लग-इन सेट, चीनी खोज, चीनी और अंग्रेजी क्रॉस-भाषा पहले

असीमित पाठ, किमी से परे प्रदर्शन

छोटे लेकिन शक्तिशाली, छोटे लेकिन व्यापक, ये शायद MiniCPM 3.0 के लिए सबसे उपयुक्त विशेषण हैं।

संदर्भ लंबाई एक महत्वपूर्ण विशेषता है जो बड़े मॉडलों की बुनियादी क्षमताओं को मापती है। लंबी संदर्भ लंबाई का मतलब है कि मॉडल अधिक जानकारी संग्रहीत और याद कर सकता है, जिससे मॉडल को भाषा को अधिक सटीक रूप से समझने और उत्पन्न करने में मदद मिलती है।

उदाहरण के लिए, लंबी संदर्भ लंबाई एआई लेखन उपकरण को उपयोगकर्ता द्वारा पहले लिखी गई बातों के आधार पर अधिक प्रासंगिक सुझाव प्रदान करने या अधिक प्रासंगिक जानकारी के आधार पर अधिक जटिल और आकर्षक कहानियां बनाने की अनुमति दे सकती है।

इस उद्देश्य से, फेस वॉल ने LLMxMapReduce लॉन्ग आर्टिकल फ्रेम प्रोसेसिंग तकनीक का प्रस्ताव रखा।

यह लंबे संदर्भ को कई टुकड़ों में काटकर असीम रूप से लंबे पाठ को प्राप्त करने का एक तरीका है, जिससे मॉडल को इसे समानांतर में संसाधित करने, विभिन्न टुकड़ों से मुख्य जानकारी निकालने और अंतिम उत्तर को सारांशित करने की अनुमति मिलती है।

यह बताया गया है कि यह तकनीक आम तौर पर लंबे पाठों को संसाधित करने के लिए मॉडल की क्षमता को बढ़ाती है, और जब पाठ लंबा होता रहता है, तब भी यह स्थिर प्रदर्शन बनाए रखता है और लंबे पाठ के स्कोर हानि को कम करता है क्योंकि यह लंबा होता है।

▲ LLMxMapReduce तकनीकी ढांचा आरेख

32K से 512K तक, MiniCPM 3.0 बड़े मॉडल मेमोरी की सीमाओं को तोड़ सकता है और संदर्भ लंबाई को असीमित और स्थिर रूप से विस्तारित कर सकता है, आधिकारिक वेबसाइट के शब्दों में, यह "जब तक आप चाहें।"

बड़े मॉडल लंबे टेक्स्ट के InfiniteBench बेंचमार्क परीक्षण परिणामों को देखते हुए, जैसे-जैसे टेक्स्ट की लंबाई बढ़ती है, 4B मापदंडों के साथ MiniCPM 3.0 का प्रदर्शन लाभ अधिक से अधिक स्पष्ट हो जाता है।

InfiniteBench Zh.QA मूल्यांकन परिणाम बताते हैं कि 4B मापदंडों के साथ MiniCPM 3.0 का समग्र प्रदर्शन किमी से बेहतर है, जो लंबे टेक्स्ट पर अपेक्षाकृत मजबूत स्थिरता दिखाता है।

GPT-4o के तुलनीय प्रदर्शन के साथ, अंत की ओर सबसे मजबूत फ़ंक्शन कॉल

एपीपीएसओ और अन्य मीडिया के साथ साक्षात्कार में, ज़ेंग गुओयांग ने यह भी कहा कि मिनीसीपीएम 3.0 ने कुछ क्षमताओं में सुधार किया है जिनके बारे में उपयोगकर्ता चिंतित हैं, जैसे संपूर्ण सिस्टम प्रॉम्प्ट फ़ंक्शन कॉलिंग और कोड दुभाषिया क्षमताओं को जोड़ना।

उनमें से, फ़ंक्शन कॉलिंग उपयोगकर्ता के अस्पष्ट इनपुट शब्दार्थ को संरचित निर्देशों में परिवर्तित कर सकती है जिसे मशीन सटीक रूप से समझ और निष्पादित कर सकती है, और बड़े मॉडलों को बाहरी टूल और सिस्टम से कनेक्ट करने की अनुमति देती है।

विशेष रूप से, आवाज के माध्यम से मोबाइल फोन पर कैलेंडर, मौसम, ईमेल, ब्राउज़र इत्यादि या स्थानीय डेटाबेस जैसे फोटो एलबम और फ़ाइलों जैसे ऐप्स को कॉल करने से टर्मिनल डिवाइस एजेंट अनुप्रयोगों के लिए असीमित संभावनाएं खुलती हैं और मानव-कंप्यूटर संपर्क अधिक प्राकृतिक और सुविधाजनक हो जाता है। .

रिपोर्टों के अनुसार, MiniCPM 3.0 डिवाइस के मामले में सबसे मजबूत फ़ंक्शन कॉलिंग प्रदर्शन का दावा करता है, बर्कले फ़ंक्शन-कॉलिंग लीडरबोर्ड सूची में, इसका प्रदर्शन GPT-4o के करीब है और लामा 3.1-8B, Qwen-2-7B और से आगे है। GLM-4-9B और कई अन्य मॉडल।

ज़ेंग गुओयांग ने कहा कि मौजूदा ओपन सोर्स मॉडल इन क्षमताओं को पूरी तरह से कवर नहीं करते हैं। आमतौर पर केवल कुछ बड़े क्लाउड मॉडल ही इन क्षमताओं को पूरी तरह से कवर कर सकते हैं। अब, MiniCPM 3.0 कुछ संबंधित फ़ंक्शन भी लागू करता है।

उदाहरण के लिए, आरएजी (रिट्रीवल ऑगमेंटेड जेनरेशन) को लें, एक ऐसी तकनीक जो सूचना पुनर्प्राप्ति (आईआर) और प्राकृतिक भाषा पीढ़ी (एनएलजी) को जोड़ती है।

यह बड़े पैमाने पर दस्तावेज़ पुस्तकालयों से प्रासंगिक जानकारी प्राप्त करके पाठ निर्माण प्रक्रिया का मार्गदर्शन करता है, जो सवालों के जवाब देने और पाठ उत्पन्न करने जैसे कार्यों में मॉडल की सटीकता और विश्वसनीयता में सुधार कर सकता है, और बड़े मॉडलों की मतिभ्रम की समस्या को कम कर सकता है।

कानून और चिकित्सा जैसे ऊर्ध्वाधर उद्योगों के लिए जो पेशेवर ज्ञान के आधार पर भरोसा करते हैं और बड़े मॉडल भ्रम के लिए बेहद कम सहनशीलता रखते हैं, बड़े मॉडल + आरएजी उद्योग में विशेष रूप से व्यावहारिक है।

मिनीसीपीएम 3.0 ने एक बार में आरएजी थ्री-पीस सेट लॉन्च किया: आरएजी परिदृश्यों के लिए पुनर्प्राप्ति मॉडल, रीऑर्डरिंग मॉडल और लोआरए प्लग-इन।

MiniCPM-एंबेडिंग (पुनर्प्राप्ति मॉडल) ने चीनी और अंग्रेजी क्रॉस-भाषा पुनर्प्राप्ति में SOTA प्रदर्शन हासिल किया है, MTEB पुनर्प्राप्ति सूची में चीनी में पहले और अंग्रेजी में तेरहवें स्थान पर है जो मॉडल की पाठ एम्बेडिंग क्षमताओं का मूल्यांकन करता है।

MiniCPM-Reranker (रीरैंकिंग मॉडल) ने चीनी, अंग्रेजी और चीनी-अंग्रेजी क्रॉस-भाषा परीक्षणों में SOTA प्रदर्शन हासिल किया।

RAG परिदृश्यों के लिए LoRA प्रशिक्षण के बाद, MiniCPM 3.0-RAG-LoRA ओपन डोमेन प्रश्न उत्तर (NQ, TQA, MARCO), मल्टी-हॉप प्रश्न उत्तर (हॉटपॉटQA), संवाद (WoW), तथ्य जाँच (FEVER) और सूचना भरने में अच्छा प्रदर्शन करता है। (टी-आरईएक्स) और अन्य प्रदर्शन कार्य, उद्योग के अग्रणी मॉडल जैसे लामा3-8बी और बाइचुआन2-13बी को पीछे छोड़ते हुए।

मॉडल एप्लीकेशन लागू हो गया है, पहले उसे चलाएं फिर उसके बारे में बात करें

एपीपीएसओ और अन्य मीडिया के साथ एक साक्षात्कार में, वॉल-फेसिंग इंटेलिजेंस के सीईओ ली दहाई ने उल्लेख किया कि चलाने में सक्षम होना और वास्तव में सुचारू रूप से एप्लिकेशन बनाना दो अलग-अलग अवधारणाएं हैं।

अनुकूलित MiniCPM 3.0 में एंड-साइड डिवाइसों के लिए बहुत कम संसाधन आवश्यकताएं हैं, परिमाणीकरण के बाद, इसे केवल 2.2 G मेमोरी की आवश्यकता होती है, iPad एंड-साइड अनुमान 18-20 टोकन/सेकेंड तक भी पहुंच सकता है।

आईपैड जैसे मोबाइल उपकरणों के लिए, प्रति सेकंड 18-20 टोकन संसाधित करने में सक्षम होने का मतलब पहले से ही है कि मॉडल वास्तविक समय में प्राकृतिक भाषा इनपुट को संसाधित कर सकता है।

उदाहरण के लिए, वाक् पहचान या वास्तविक समय अनुवाद अनुप्रयोगों में, उपयोगकर्ताओं को मूल रूप से स्पष्ट देरी का अनुभव नहीं होगा और अपेक्षाकृत सहज इंटरैक्टिव अनुभव का आनंद मिलेगा।

इसके अलावा, क्लाउड मॉडल की तुलना में, एंड-साइड मॉडल के रूप में मिनीसीपीएम श्रृंखला मॉडल में स्वाभाविक रूप से कमजोर नेटवर्क, डिस्कनेक्ट होने पर उपयोगिता, अल्ट्रा-लो विलंबता और डेटा गोपनीयता और सुरक्षा जैसे स्थानीय फायदे भी होते हैं।

गोंगगा स्नो माउंटेन के पास यात्रा करते समय, यदि आप "रिझाओ जिनशान माउंटेन" का आनंद लेने के लिए सबसे अच्छी स्थिति जानना चाहते हैं, यदि आपका नेटवर्क अच्छा नहीं है, तो आप MiniCPM 3.0 से पूछ सकते हैं।

या, यदि आप "समुद्र को पकड़ने" के लिए नए हैं, तो उबड़-खाबड़ तट पर खड़े हैं, लेकिन पूरे सामान के साथ घर लौटना चाहते हैं, तो आप MiniCPM 3.0 द्वारा दिए गए सुझावों का भी पालन कर सकते हैं। जब आप रात के आकाश को देखते हैं और स्टार ट्रेल्स को कैप्चर करने का विचार रखते हैं, तो MiniCPM 3.0 आपको शॉट का विवरण भी बता सकता है।

मिनीसीपीएम छोटी स्टील तोप श्रृंखला की तीव्र प्रगति के पीछे कुशल बड़े मॉडलों का सुसंगत पहला सिद्धांत है।

वॉल-फेसिंग इंटेलिजेंस के मुख्य वैज्ञानिक लियू ज़ियुआन ने एक बार बड़े मॉडलों के युग में "मूर का नियम" प्रस्तावित किया था, यानी बड़े मॉडलों का ज्ञान घनत्व औसतन हर आठ महीने में दोगुना हो जाएगा।

ज्ञान घनत्व = गणना में शामिल मॉडल क्षमता/मॉडल पैरामीटर

विशेष रूप से, जैसे-जैसे मॉडल का ज्ञान घनत्व बढ़ता जा रहा है, 2020 में जीपीटी-3 की 175बी क्षमता 2024 में मिनीसीपीएम 2.4बी मॉडल द्वारा हासिल की जाएगी, और चैटजीपीटी का अंतर्निहित जीपीटी-3.5 अंत में शुरू होगा। 2022, जिसे 2024 में मिनीसीपीएम 3.0 मॉडल द्वारा हासिल किया जाएगा।

इसके आधार पर, यदि मिनीसीपीएम अंतिम अंत-पक्ष प्रदर्शन का अनुसरण करता है, तो मिनीसीपीएम-वी अंतिम मल्टी-मोडल नवाचार प्रदर्शन का अनुसरण करता है। दीवार का सामना करने वाली छोटी स्टील तोप की प्रगति एकतरफा प्रगति नहीं है, बल्कि अंत की एक साथ प्रगति है। -साइड डुअल फ्लैगशिप।

एक या दो साल की तकनीकी खोज के बाद, बड़े एआई मॉडल धीरे-धीरे व्यावहारिक अनुप्रयोग के गहरे पानी के क्षेत्र में प्रवेश कर रहे हैं।

ली दहाई का मानना ​​है कि बड़े मॉडलों के दो सामान्य मूल्य हैं एक दिशा में मूल्य पुरानी दुनिया को उन्नत करना है, और दूसरी दिशा में मूल्य नई दुनिया की खोज करना है।

उदाहरण के लिए, Apple की ChatGPT सेवा का Apple इंटेलिजेंस में एकीकरण एक विशिष्ट उदाहरण है।

डिवाइस-साइड मॉडल के लिए भी यही सच है, मोबाइल फोन, कार और पीसी जैसे परिदृश्यों में, टर्मिनल निर्माताओं को अच्छी तरह से सेवा देना अधिक उपयुक्त है, और फिर टर्मिनल निर्माताओं को डिवाइस-साइड मॉडल का उपयोग करने दें। संपूर्ण सिस्टम-स्तरीय अनुभव को बेहतर ढंग से बदलें।

हालाँकि, प्रौद्योगिकी से उत्पाद तक की रोमांचक छलांग में, निर्माताओं को उपयोगकर्ता की जरूरतों और प्रौद्योगिकी को एकीकृत करने में भी काफी समय निवेश करने की आवश्यकता है।

जैसा कि ली दहाई ने कहा, हालांकि मोबाइल इंटरनेट आईफोन के आगमन के बाद से अस्तित्व में है, वास्तविक बड़े पैमाने पर विकास और सिद्ध एप्लिकेशन कुछ साल बाद तक उभरना शुरू नहीं हुए थे।

वास्तव में, वॉल-फेसिंग इंटेलिजेंस व्यावहारिक अनुप्रयोग परिदृश्यों की खोज कर रहा है।

पहले, वॉल-फेसिंग मिनीसीपीएम एंड-साइड मॉडल वास्तव में पीसी, टैबलेट, मोबाइल फोन और अन्य क्षेत्रों पर चल रहा था।

कुछ समय पहले, वॉल-फेसिंग इंटेलिजेंस भी रोबोट के विकास में तेजी लाने और संपूर्ण "एम्बॉएड इंटेलिजेंस" के लिए एक अग्रणी समाधान बनाने के लिए WAIC में शामिल हुआ था। यह ह्यूमनॉइड रोबोट पर चलने वाले कुशल एंड-साइड मॉडल का उद्योग का पहला प्रदर्शन भी है भौतिक दुनिया को समझने, तर्क करने और उसके साथ बातचीत करने के लिए।

ली दहाई ने एपीपीएसओ और अन्य मीडिया को यह भी बताया कि वॉल-फेसिंग स्मार्ट एंड-टू-साइड मॉडल से लैस उत्पादों को साल के अंत से पहले लॉन्च किए जाने की उम्मीद है।

संक्षेप में, वॉल-फेसिंग इंटेलिजेंस उच्च दक्षता और उच्च प्रदर्शन वाले बड़े मॉडलों को उपयोगकर्ताओं के सबसे करीब रखता है, जिससे बड़े मॉडलों की क्षमताओं को बिजली, सर्वव्यापी, व्यापक और सुरक्षित रूप से उपयोग करने की अनुमति मिलती है।

इस प्रक्रिया में, अधिक लोग जितनी जल्दी हो सके बड़े मॉडलों के मूल्य और कार्य का आनंद ले सकते हैं।

MiniCPM 3.0 खुला स्रोत पता:

गिटहब:
🔗 https://github.com/OpenBMB/MiniCPM
आलिंगन चेहरा:
🔗 https://huggingface.co/openbmb/MiniCPM3-4B

# Aifaner के आधिकारिक WeChat सार्वजनिक खाते का अनुसरण करने के लिए आपका स्वागत है: Aifaner (WeChat ID: ifanr) आपको जल्द से जल्द अधिक रोमांचक सामग्री प्रदान की जाएगी।

ऐ फ़ैनर | मूल लिंक · टिप्पणियाँ देखें · सिना वीबो