एनवीडिया सरल टेक्स्ट संकेतों को गेम के लिए तैयार 3डी मॉडल में बदल देता है

एनवीडिया के LATTE3D द्वारा निर्मित छवियों का एक रंगीन कोलाज।
NVIDIA

एनवीडिया ने GTC 2024 के दौरान अपने नए जेनरेटिव AI मॉडल, जिसे Latte3D कहा जाता है, का अनावरण किया। Latte3D अत्यधिक स्टेरॉयड पर ChatGPT प्रतीत होता है। मैं एक टेक्स्ट-टू-3डी मॉडल हूं जो सरल, संक्षिप्त टेक्स्ट संकेतों को स्वीकार करता है और उन्हें एक सेकंड के भीतर 3डी ऑब्जेक्ट और जानवरों में बदल देता है। अपने पुराने समकक्षों की तुलना में बहुत तेज़, Latte3D एक वर्चुअल 3D प्रिंट की तरह काम करता है जो कई उद्योगों में रचनाकारों के काम आ सकता है।

Latte3D को कई प्रकार के रचनाकारों के लिए 3D मॉडल के निर्माण को सरल बनाने के लिए बनाया गया था, जैसे कि वीडियो गेम, डिज़ाइन प्रोजेक्ट, मार्केटिंग, या यहां तक ​​कि रोबोटिक्स के लिए मशीन लर्निंग और प्रशिक्षण पर काम करने वाले। एनवीडिया के मॉडल के डेमो में, इसका उपयोग करना बहुत आसान प्रतीत होता है। एक त्वरित टेक्स्ट प्रॉम्प्ट के बाद, एआई एक 3डी मॉडल तैयार करता है और कुछ ही समय बाद इसे और अधिक विवरण के साथ पूरा करता है। हालांकि अंतिम परिणाम ओपनएआई के सोरा जितना जीवंत नहीं है, लेकिन इसका मतलब यह नहीं है – यह जमीन से ऊपर तक संपत्ति बनाने के बजाय संपत्ति बनाने में तेजी लाने का एक तरीका है।

मॉडल उपयोगकर्ता के चुनने के लिए कई अलग-अलग विकल्प उत्पन्न करता है, और एनवीडिया का कहना है कि इन आकृतियों को "कुछ ही मिनटों में उच्च गुणवत्ता के लिए अनुकूलित किया जा सकता है।" फिर डिज़ाइनों को विभिन्न प्लेटफार्मों पर निर्यात किया जा सकता है, जैसे कि एनवीडिया के ओमनिवर्स, और वांछित अंतिम परिणाम से मेल खाने के लिए इसमें बदलाव किया जा सकता है। एनवीडिया ने अपने Ada A100 Tensor Core GPU का उपयोग करके Latte3D को प्रशिक्षित किया और वास्तविक उपयोगकर्ताओं के साथ बातचीत करने के लिए इसे तैयार करने के लिए ChatGPT संकेतों के साथ प्रशिक्षण का समर्थन किया।

फिलहाल, Latte3D केवल वस्तुएं और जानवर ही उत्पन्न कर सकता है। उस अंत तक, यह विभिन्न जानवरों, बनावट और वस्तु प्रकारों को समझने का ठोस काम करता प्रतीत होता है। एनवीडिया ने अमिगुरुमी (क्रोशेट) सामान्य क्रेन या ओरिगेमी स्फिंक्स बिल्ली जैसी वस्तुओं को प्रस्तुत करके इन क्षमताओं को दिखाया। मॉडल को विभिन्न प्रजातियों को पहचानना सिखाया गया और इस प्रकार यह इतालवी ग्रेहाउंड और शीबा इनु के बीच अंतर बता सकता है।

जो निर्माता Latte3D का उपयोग और अधिक करने के लिए करना चाहते हैं, वे इसे एक अलग डेटासेट पर प्रशिक्षित कर सकते हैं, चाहे वह पौधे हों या घरेलू वस्तुएँ, और बाद में इसे अपने स्वयं के उद्देश्यों के लिए उपयोग कर सकते हैं। एनवीडिया यहां कुछ दिलचस्प उपयोग के मामले पेश करता है, जैसे व्यक्तिगत सहायक रोबोटों को तैनात करने से पहले उन्हें प्रशिक्षित करना। यह कल्पना करना आसान है कि Latte3D गेम डेवलपर्स के लिए काम आएगा, लेकिन इसकी क्षमता सिर्फ गेमिंग परिदृश्यों से कहीं आगे तक जाती है।

एनवीडिया में एआई शोध के उपाध्यक्ष संजा फिडलर ने टिप्पणी की कि लैटे3डी अपने पूर्ववर्तियों की तुलना में कितनी तेज है: “एक साल पहले, एआई मॉडल को इस गुणवत्ता के 3डी दृश्य उत्पन्न करने में एक घंटे का समय लगता था – और कला की वर्तमान स्थिति अब लगभग 10 से 12 सेकंड है। फिडलर ने कहा, ''अब हम तेजी से परिणाम दे सकते हैं।''

गेम विकास में एआई के उपयोग से संबंधित हालिया घोषणाएं काफी अभूतपूर्व हैं, और एनवीडिया का लैटे3डी उन उपकरणों की बढ़ती सूची में शामिल हो गया है जो एक दिन गेम बनाने की प्रक्रिया को पूरी तरह से बदल सकते हैं। उदाहरण के लिए, एनवीडिया ने हाल ही में एआई द्वारा पूरी तरह से उत्पन्न संवाद के साथ गैर-खिलाड़ी पात्रों (एनपीसी) का अनावरण किया । इस बीच, अनरियल इंजन का नवीनतम अपडेट मशीन लर्निंग की मदद से वास्तविक समय में गेम में फिल्म-गुणवत्ता वाले दृश्य उत्पन्न कर सकता है।