एनवीडिया ने अभी-अभी GPT-4 को टक्कर देने के लिए एक ओपन-सोर्स एलएलएम जारी किया है

पृष्ठभूमि के सामने एनवीडिया के सीईओ जेन्सेन।
NVIDIA

एनवीडिया, जो एआई उद्योग में सबसे अधिक मांग वाले जीपीयू का निर्माण करती है, ने घोषणा की है कि उसने एक ओपन-सोर्स बड़ा भाषा मॉडल जारी किया है जो कथित तौर पर ओपनएआई , एंथ्रोपिक , मेटा और Google के प्रमुख मालिकाना मॉडल के बराबर प्रदर्शन करता है।

कंपनी ने हाल ही में जारी श्वेत पत्र में अपना नया एनवीएलएम 1.0 परिवार पेश किया है, और इसका नेतृत्व 72 बिलियन-पैरामीटर एनवीएलएम-डी-72बी मॉडल द्वारा किया गया है। "हम एनवीएलएम 1.0 पेश करते हैं, जो फ्रंटियर-क्लास मल्टीमॉडल बड़े भाषा मॉडल का एक परिवार है, जो दृष्टि-भाषा कार्यों पर अत्याधुनिक परिणाम प्राप्त करता है, जो प्रमुख मालिकाना मॉडल (उदाहरण के लिए, जीपीटी-4ओ) और ओपन-एक्सेस मॉडल को टक्कर देता है। शोधकर्ताओं ने लिखा।

कथित तौर पर नया मॉडल परिवार पहले से ही "प्रोडक्शन-ग्रेड मल्टीमॉडैलिटी" में सक्षम है, जो कि एनवीएलएम परिवार पर आधारित आधार एलएलएम की तुलना में बेहतर पाठ-आधारित प्रतिक्रियाओं के अलावा, विभिन्न दृष्टि और भाषा कार्यों में असाधारण प्रदर्शन के साथ है। शोधकर्ताओं ने बताया, "इसे हासिल करने के लिए, हम मल्टीमॉडल गणित और तर्क डेटा की पर्याप्त मात्रा के साथ-साथ मल्टीमॉडल प्रशिक्षण में एक उच्च-गुणवत्ता वाले टेक्स्ट-ओनली डेटासेट को तैयार और एकीकृत करते हैं, जिससे सभी तौर-तरीकों में गणित और कोडिंग क्षमताओं में वृद्धि होती है।"

परिणाम एक एलएलएम है जो उतनी ही आसानी से समझा सकता है कि एक मीम मज़ेदार क्यों है क्योंकि यह जटिल गणित समीकरणों को चरण दर चरण हल कर सकता है। एनवीडिया अपनी मल्टीमॉडल प्रशिक्षण शैली की बदौलत सामान्य उद्योग बेंचमार्क में मॉडल की केवल-पाठ सटीकता को औसतन 4.3 अंक तक बढ़ाने में कामयाब रही।

एनवीएलएम श्वेत पत्र का स्क्रीनशॉट जिसमें यह समझाने की प्रक्रिया बताई गई है कि मीम मजाकिया क्यों है
NVIDIA

एनवीडिया यह सुनिश्चित करने के बारे में गंभीर प्रतीत होता है कि यह मॉडल ओपन सोर्स पहल की "ओपन सोर्स" की नवीनतम परिभाषा को पूरा करता है, न केवल अपने प्रशिक्षण भार को सार्वजनिक समीक्षा के लिए उपलब्ध कराता है, बल्कि निकट भविष्य में मॉडल के स्रोत कोड को जारी करने का भी वादा करता है। यह ओपनएआई और गूगल जैसे प्रतिद्वंद्वियों के कार्यों से एक स्पष्ट विचलन है, जो ईर्ष्यापूर्वक अपने एलएलएम के वजन और स्रोत कोड के विवरण की रक्षा करते हैं। ऐसा करने में, एनवीडिया ने एनवीएलएम परिवार को चैटजीपीटी-4ओ और जेमिनी 1.5 प्रो के खिलाफ सीधे प्रतिस्पर्धा करने के लिए तैनात नहीं किया है, बल्कि तीसरे पक्ष के डेवलपर्स के लिए अपने स्वयं के चैटबॉट और एआई एप्लिकेशन बनाने के लिए एक आधार के रूप में काम किया है।