देर रात बमबारी! एनवीडिया ने दुनिया की सबसे शक्तिशाली एआई चिप जारी की, जिसका प्रदर्शन 30 गुना बढ़ गया। लाओ हुआंग इस युग के स्टीव जॉब्स हैं

अभी, NVIDIA ने दुनिया की सबसे शक्तिशाली AI चिप जारी की।

जेनरेटिव एआई चरम बिंदु पर पहुंच गया है।

दो घंटे का GTC 2024 सम्मेलन एक बड़े पैमाने के संगीत कार्यक्रम की तरह था। NVIDIA के एक वरिष्ठ वैज्ञानिक जिम फैन ने मजाक में कहा कि "जेन्सेन हुआंग नई टेलर स्विफ्ट हैं।"

यह संभवतः एआई उद्योग में एनवीडिया के जेन-सुन हुआंग की वर्तमान स्थिति है।

पिछले साल, हुआंग रेनक्सुन ने कहा था कि एआई का "आईफोन मोमेंट" आ गया है, जो हमें यह देखने की अनुमति देता है कि एआई द्वारा दैनिक जीवन को कैसे फिर से लिखा जा रहा है, और आज यह दर्शाता है कि इस परिवर्तन की गति तेजी से तेज हो रही है।

पिछले 10 वर्षों में, NVIDIA ने AI को लगभग दस लाख गुना उन्नत किया है, जो मूर के नियम से कहीं अधिक है। दूसरे शब्दों में, NVIDIA अपना स्वयं का पुनरावृत्ति कानून लिख रहा है। चिप कंप्यूटिंग पावर से लेकर एआई कार्यान्वयन तक, ऑटोमोबाइल विनिर्माण से लेकर मेडिकल लॉजिस्टिक्स तक, NVIDIA ने अपनी प्रगति करते हुए विभिन्न उद्योगों के विकास को बढ़ावा दिया है।

मूर का कानून मर चुका है, लेकिन NVIDIA ने एक नए मूर के कानून को जन्म दिया है।

कंप्यूटर ग्राफ़िक्स कार्ड को छोड़कर, सामान्य समय में NVIDIA को हम शायद ही कभी समझ पाते हैं, लेकिन हमारे आस-पास के कई उत्पादों की तकनीकी प्रगति हमेशा उनसे अविभाज्य होती है। GTC 2024 के इस पहले सारांश को पढ़ने के बाद, शायद आप इसके बारे में अधिक स्पष्ट धारणा प्राप्त कर सकते हैं एआईजीसी की लहर.

ओपनएआई के सीईओ सैम अल्टमैन द्वारा कल रात एक्स पर भेजा गया एक ट्वीट उस समय का फुटनोट हो सकता है:

भविष्य के सभी वर्षों को छोड़कर, यह मानव इतिहास का सबसे दिलचस्प वर्ष है
यह मानव इतिहास का सबसे दिलचस्प वर्ष रहा है, लेकिन भविष्य में यह सबसे उबाऊ वर्ष होगा।

दुनिया की सबसे शक्तिशाली एआई चिप का जन्म हुआ है, और इसका प्रदर्शन रॉकेट है

यह आज दुनिया में उत्पादन में सबसे उन्नत GPU है।

सम्मेलन का नायक "ब्लैकवेल बी200" एआई चिप है। हुआंग रेनक्सुन ने कहा कि इस चिप का नाम गणितज्ञ, गेम सिद्धांतकार और संभाव्यता सिद्धांतकार डेविड ब्लैकवेल से आया है।

TSMC की 4NP प्रक्रिया के आधार पर, ब्लैकवेल आर्किटेक्चर के तहत कंप्यूटिंग चिप में 104 बिलियन ट्रांजिस्टर हैं, जो पिछली पीढ़ी GH100 GPU पर 80 बिलियन ट्रांजिस्टर की तुलना में एक और सफलता है।

ब्लैकवेल बी200 पारंपरिक अर्थों में एक एकल जीपीयू नहीं है। यह दो ब्लैकवेल जीपीयू + एक ग्रेस सीपीयू चिप से बना है, और 10 टीबी/एस एनवी-एचबीआई (एनवीडिया हाई बैंडविड्थ इंटरफ़ेस) के माध्यम से जुड़ा हुआ है ताकि यह सुनिश्चित किया जा सके कि प्रत्येक चिप अकेले चल सके। .

इसलिए, B200 में वास्तव में 208 बिलियन ट्रांजिस्टर हैं और FP4 कंप्यूटिंग शक्ति के 20 पेटाफ्लॉप तक प्रदान कर सकते हैं। एक एकल ग्रेस सीपीयू के साथ संयुक्त दो जीपीयू एलएलएम (बड़े भाषा मॉडल) अनुमान के काम को 30 गुना तक बढ़ा सकते हैं। दक्षता।

GB200 के प्रदर्शन में भी काफी सुधार होगा। 175 बिलियन मापदंडों के साथ GPT-3 LLM बेंचमार्क में, GB200 का प्रदर्शन H100 की तुलना में 7 गुना है, और इसकी प्रशिक्षण गति H100 की 4 गुना है।

और तो और, यह H100 की तुलना में लागत और ऊर्जा खपत को 25 गुना कम कर देता है।

पहले, हालांकि NVIDIA का AI प्रोसेसर H100 बहुत लोकप्रिय था, प्रत्येक H100 की अधिकतम बिजली खपत 700 वाट तक थी, जो सामान्य अमेरिकी घरों की औसत बिजली खपत से अधिक थी। विशेषज्ञों का अनुमान है कि चूंकि बड़ी संख्या में H100 तैनात किए गए हैं, उनकी कुल बिजली खपत उतनी ही अधिक होगी जितनी एक बड़े अमेरिकी शहर की तुलना कुछ छोटे यूरोपीय देशों से की जा सकती है, या उससे भी बड़ा हो सकता है।

हुआंग रेनक्सुन ने कहा कि 1.8 ट्रिलियन पैरामीटर मॉडल के प्रशिक्षण के लिए पहले 8,000 हॉपर जीपीयू और 15 मेगावाट बिजली की आवश्यकता होती थी। अब 2,000 ब्लैकवेल जीपीयू केवल 4 मेगावाट बिजली की खपत के साथ ऐसा कर सकते हैं।

ब्लैकवेल बी200 जीपीयू का शक्तिशाली प्रदर्शन ऊर्जा खपत के मामले में भी पूरी तरह से परिलक्षित हो सकता है। B200, जो नवीनतम NVLink इंटरकनेक्ट तकनीक का उपयोग करता है, समान 8GPU आर्किटेक्चर और 400GbE नेटवर्क स्विच का समर्थन करता है। हालांकि इसके प्रदर्शन में काफी सुधार हुआ है, यह पिछली पीढ़ी के H100/H200 के समान चरम ऊर्जा खपत (700W) प्राप्त कर सकता है।

ध्यान देने योग्य एक और बिंदु FP4 की कंप्यूटिंग शक्ति है। हुआंग रेनक्सुन ने कहा कि पिछले आठ वर्षों में, एआई कंप्यूटिंग शक्ति एक हजार गुना बढ़ गई है। सबसे महत्वपूर्ण सुधार दूसरी पीढ़ी का ट्रांसफार्मर इंजन है, जिसने एफपी4 कंप्यूटिंग शक्ति के माध्यम से कंप्यूटिंग, बैंडविड्थ और मॉडल आकार में काफी सुधार किया है।

आमतौर पर AI में उपयोग की जाने वाली FP8 कंप्यूटिंग शक्ति की तुलना में, B200 के दो कंप्यूटिंग चिप्स का प्रदर्शन H100 से 2.5 गुना अधिक है। ब्लैकवेल आर्किटेक्चर के तहत प्रत्येक चिप की कंप्यूटिंग शक्ति पिछली पीढ़ी के हॉपर चिप की तुलना में 25% अधिक है।

NVIDIA के वरिष्ठ वैज्ञानिक जिम फैन नए ब्लैकवेल B200 GPU को "एक नया प्रदर्शन जानवर" कहते हैं।

B200 की कंप्यूटिंग शक्ति एक एकल आर्किटेक्चर के भीतर 1 एक्साफ्लॉप से ​​अधिक है। जेन-ह्सुन हुआंग द्वारा OpenAI को दिए गए पहले DGX का प्रदर्शन 0.17 पेटाफ्लॉप है। GPT-4-1.8T मापदंडों को 90 दिनों के भीतर 2,000 ब्लैकवेल इकाइयों पर प्रशिक्षित किया जा सकता है।

यह कहना कोई अतिश्योक्ति नहीं होगी कि एक नये मूर के नियम का जन्म हुआ।

चूंकि ब्लैकवेल कई अलग-अलग वेरिएंट में उपलब्ध है, एनवीडिया तीन मुख्य विकल्पों के साथ पूर्ण सर्वर नोड के लिए विशिष्टताएं भी प्रदान करता है।

पहला सबसे बड़ा और सबसे शक्तिशाली GB200 NVL72 सिस्टम है, जो 18 1U सर्वर के साथ कॉन्फ़िगर किया गया है, प्रत्येक सर्वर दो GB200 सुपर चिप्स से लैस है। सिस्टम एफपी4 एआई अनुमान प्रदर्शन के 1440 पेटा फ्लॉप्स और एफपी8 एआई प्रशिक्षण प्रदर्शन के 720 पेटा फ्लॉप्स के साथ 72 बी200 जीपीयू प्रदान करता है। यह एक तरल शीतलन समाधान को अपनाएगा। एक एनवीएल72 27 ट्रिलियन पैरामीटर मॉडल (जीपीटी -4) को संभाल सकता है। अधिकतम पैरामीटर नहीं है 1.7 ट्रिलियन पैरामीटर से अधिक)।

एक अन्य विशिष्टता HGX B200 है, जो एक सर्वर नोड में आठ B200 GPU और एक x86 CPU का उपयोग करने पर आधारित है। प्रत्येक B200 GPU को 1000W तक कॉन्फ़िगर किया जा सकता है, और GPU FP4 थ्रूपुट के 18 पेटाफ्लॉप तक प्रदान करता है, जो धीमा है GB200 में GPU की तुलना में 10%।

अंत में, NVIDIA HGX B100 भी लॉन्च करेगा, जिसमें HGX B200 के समान सामान्य विनिर्देश हैं, जो x86 CPU और 8 B100 GPU से सुसज्जित है, लेकिन मौजूदा HGX H100 बुनियादी ढांचे के साथ सीधे संगत होगा और ब्लैकवेल GPU की सबसे तेज़ तैनाती की अनुमति देगा। , प्रत्येक GPU का TDP 700W तक सीमित है।

इससे पहले, एनवीडिया एच100 और एच200 जैसे एआई चिप्स के माध्यम से अमेज़ॅन जैसी अग्रणी कंपनियों को पछाड़कर मल्टी-ट्रिलियन-डॉलर कंपनी बन गई है। आज जारी किए गए नए ब्लैकवेल बी200 जीपीयू और जीबी200 "सुपर चिप" बहुत आशाजनक हैं। इसका विस्तार हो सकता है यह अग्रणी है और यहां तक ​​कि Apple से भी आगे निकल गया है।

हर चीज़ को परिभाषित करने वाले सॉफ़्टवेयर का युग आ रहा है

2012 में, शोधकर्ताओं के एक छोटे समूह ने एलेक्सनेट नामक एक सफल छवि पहचान प्रणाली जारी की, जिसने उस समय कुत्तों और बिल्लियों को वर्गीकृत करने के कार्य में पिछले तरीकों से कहीं बेहतर प्रदर्शन किया, जिससे यह गहन शिक्षण और दृढ़ तंत्रिका नेटवर्क में अग्रणी बन गया। का एक प्रतिष्ठित प्रदर्शन छवि पहचान में (सीएनएन) की क्षमता।

एआई में अवसरों को देखने के बाद ही हुआंग रेनक्सुन ने एआई पर पूरा दांव लगाने का फैसला किया। दिलचस्प बात यह है कि अतीत में, इसका उपयोग उत्पन्न चित्रों को पहचानने और पाठ उत्पन्न करने के लिए किया जाता था, लेकिन अब इसका उपयोग पाठ के माध्यम से चित्र उत्पन्न करने के लिए किया जाता है।

तो जब जेनरेटिव एआई की लहर आती है, तो हम इसके साथ क्या कर सकते हैं? जेन-ह्सुन हुआंग ने कुछ मानक उत्तर दिए।

NVIDIA के मौसम मॉडल कॉर्डिफ़ के साथ संयुक्त पारंपरिक मौसम मॉडल ऐसे पूर्वानुमान प्राप्त कर सकते हैं जो सैकड़ों या हजारों किलोमीटर के क्षेत्रों का पता लगाते हैं, तूफान जैसे प्रभावों की सीमा प्रदान करते हैं, जिससे संपत्ति के नुकसान को कम किया जा सकता है। भविष्य में कॉर्डिफ़ अधिक देशों और क्षेत्रों के लिए भी खुला रहेगा।

जेनरेटिव एआई न केवल डिजिटल क्षमताओं के माध्यम से छवियों और ऑडियो को समझ सकता है, बल्कि नई दवाओं की स्क्रीनिंग के लिए अरबों यौगिकों को स्कैन करने के लिए अपनी विशाल कंप्यूटिंग शक्ति का भी उपयोग कर सकता है।

एआई हथियार डीलर के रूप में, हुआंग रेनक्सुन ने NiMS प्रणाली भी पेश की, जो एआई चिप्स के विकास में सहायता करने में माहिर है। भविष्य में, आपके पास AI सुपर टीम बनाने का अवसर भी हो सकता है। कार्य को उप-कार्यों की श्रृंखला में विभाजित करने के बाद, आप विभिन्न AI को पुनर्प्राप्ति और सॉफ़्टवेयर अनुकूलन जैसे कार्यों को पूरा करने दे सकते हैं।

भविष्य की सुविधाएं, गोदाम और फैक्ट्री भवन सॉफ्टवेयर-परिभाषित होंगे।

चाहे वह ह्यूमनॉइड रोबोट हों, सेल्फ-ड्राइविंग कारें हों, या हथियारों से छेड़छाड़ करने वाले हों, इन स्वायत्त रोबोटों को सॉफ्टवेयर-स्तरीय ऑपरेटिंग सिस्टम की आवश्यकता होती है। उदाहरण के लिए, AI और ओम्निवर्स के संयोजन के माध्यम से, NVIDIA ने 100,000 वर्ग मीटर के क्षेत्र को कवर करने वाला एक रोबोट गोदाम बनाया।

इस भौतिक रूप से सटीक अनुरूपित वातावरण में, 100 छत पर लगे कैमरे NVIDIA मेट्रोपोलिस सॉफ़्टवेयर और स्वायत्त मोबाइल रोबोट (एएमआर) की मार्ग नियोजन क्षमताओं का उपयोग करके वास्तविक समय में गोदाम में सभी गतिविधियों को मैप करते हैं।

इन सिमुलेशन में वास्तविक दुनिया की अप्रत्याशितता के अनुकूल सिस्टम की क्षमता का मूल्यांकन और अनुकूलन करने के लिए एआई एजेंट का सॉफ्टवेयर लूप परीक्षण भी शामिल है।

एक सिम्युलेटेड परिदृश्य में, एएमआर एक फूस लेने के लिए रास्ते में था जब उसे एक ऐसी घटना का सामना करना पड़ा जिसने उसके इच्छित मार्ग को अवरुद्ध कर दिया। एनवीडिया मेट्रोपोलिस ने फिर अद्यतन किया और नियंत्रण प्रणाली को एक वास्तविक समय अधिभोग मानचित्र भेजा, जिसने नए इष्टतम पथ की गणना की।

वेयरहाउस संचालक प्राकृतिक भाषा के माध्यम से दृश्य मॉडल से प्रश्न भी पूछ सकते हैं, और मॉडल विवरण और गतिविधियों को समझ सकता है और परिचालन दक्षता में सुधार के लिए त्वरित प्रतिक्रिया प्रदान कर सकता है।

गौरतलब है कि इस कॉन्फ्रेंस में Apple Vision Pro भी नज़र आया। उद्यम ओमनिवर्स क्लाउड के माध्यम से वास्तविक समय में विज़न प्रो में 3डी अनुप्रयोगों के इंटरैक्टिव यूनिवर्सल सीन विवरण (ओपनयूएसडी) को आसानी से स्ट्रीम कर सकते हैं, जिससे उपयोगकर्ताओं को आभासी दुनिया का पता लगाने में मदद मिलती है जैसा पहले कभी नहीं हुआ था।

प्रेस कॉन्फ्रेंस का अंत परिचित रोबोट खंड था। जैसा कि हुआंग रेनक्सुन ने कहा, जिस क्षण उन्होंने अपने हाथ खोले और अन्य ह्यूमनॉइड रोबोटों के साथ खड़े हुए, इस समय, "कंप्यूटर ग्राफिक्स, भौतिकी और कृत्रिम बुद्धिमत्ता का प्रतिच्छेदन, यह। .. सब कुछ इसी क्षण शुरू होता है।”

▲ छोटा ईस्टर अंडा

दस साल पहले जीटीसी में, जेन-ह्सुन हुआंग ने पहली बार मशीन लर्निंग के महत्व पर जोर दिया था। जबकि कई लोग अभी भी एनवीडिया को "गेम ग्राफिक्स कार्ड" के निर्माता के रूप में मानते थे, वे पहले से ही एआई क्रांति में सबसे आगे थे।

2024 में, जिसे एआई अनुप्रयोगों के पहले वर्ष के रूप में जाना जाता है, एनवीआईडीआईए ने पहले से ही कई क्षेत्रों में विभिन्न उद्योगों को सशक्त बनाने के लिए एआई सॉफ्टवेयर और हार्डवेयर का उपयोग किया है: बड़े भाषा मॉडल, संवादी एआई, एज कंप्यूटिंग, बड़ा डेटा, स्वायत्त ड्राइविंग, बायोनिक रोबोट…

दवा की खोज हमारी विशेषज्ञता नहीं है, कंप्यूटिंग है; कार बनाना हमारी विशेषज्ञता नहीं है, कार बनाने के लिए आवश्यक एआई कंप्यूटर हैं। सच कहूं तो, किसी कंपनी के लिए इन सभी चीजों में अच्छा होना कठिन है, लेकिन हम इसके एआई कंप्यूटिंग हिस्से में बहुत अच्छे हैं।

एकल उद्योग में अग्रणी की तुलना में, NVIDIA "पर्दे के पीछे एक बड़े आदमी" की तरह है। जब तक AI का उल्लेख किया जाता है, NVIDIA एक अपरिहार्य विषय होना चाहिए।

जैसा कि हुआंग ने कहा, एनवीडिया पहले से ही एक प्लेटफ़ॉर्म कंपनी है।

यह अग्रिम तैनाती और ऐतिहासिक विकास की सामान्य प्रवृत्ति थी जिसने एनवीडिया को एआई युग की शुरुआत में एआई चिप बाजार की 70% से अधिक बिक्री पर कब्जा करने में सक्षम बनाया। कंपनी का मूल्यांकन भी 2 ट्रिलियन अमेरिकी डॉलर से अधिक हो गया। काफी समय पहले।

शायद यही कारण है कि Apple ने कई वर्षों तक संघर्ष करने के बाद कार बनाना छोड़ दिया और जेनरेटिव AI में भारी निवेश किया। चाहे वह आर्थिक लाभ हो या तकनीकी रुझान, यह एक जुआ के योग्य है।

ऐसे समय में जब हम अभी भी "एआई" की उपयोगिता पर सवाल उठा रहे हैं, एनवीआईडीआईए ने अपने कार्यों से साबित कर दिया है कि एआई नए युग का एक अनिवार्य हिस्सा बन गया है।

लेखक: ली चाओफ़ान, जिओ फैनबो, मो चोंगयु

# aifaner के आधिकारिक WeChat सार्वजनिक खाते का अनुसरण करने के लिए आपका स्वागत है: aifaner (WeChat ID: ifanr)। जितनी जल्दी हो सके आपको अधिक रोमांचक सामग्री प्रदान की जाएगी।

ऐ फैनर | मूल लिंक · टिप्पणियाँ देखें · सिना वीबो