मेटा ने विंसेंट 3डी मॉडल “ब्लॉकबस्टर” लॉन्च किया, जो एक सेकंड में 3डी सामग्री तैयार करता है

मेटा कंपनी ने आधिकारिक तौर पर एक शोध पत्र जारी किया, जिसमें मेटा 3डी जेन नामक एक विंसेंट 3डी मॉडल सिस्टम पेश किया गया, जो एक मिनट से भी कम समय में टेक्स्ट से उच्च गुणवत्ता वाली 3डी संपत्तियां उत्पन्न कर सकता है।

तकनीकी मुख्य बातें:

  • उच्च गति पीढ़ी: 3DGen केवल 30 सेकंड में प्रारंभिक 3D संपत्ति उत्पन्न कर सकता है, और बाद के बनावट शोधन चरण में केवल 20 सेकंड लगते हैं, जिससे 3D संपत्ति पीढ़ी की दक्षता में काफी सुधार होता है।

▲ विभिन्न त्वरित शब्दों द्वारा निर्मित 3डी मॉडल

  • भौतिक रूप से आधारित रेंडरिंग (पीबीआर) समर्थन: 3डीजेन पीबीआर का समर्थन करता है, जो वास्तविक दुनिया के अनुप्रयोगों में 3डी संपत्तियों के प्रकाश प्रभाव को पुन: प्रस्तुत करने के लिए महत्वपूर्ण है।

  • उच्च निष्ठा: पेशेवर 3डी कलाकारों द्वारा मूल्यांकन किया गया, 3डीजेन द्वारा तैयार किए गए 3डी मॉडल जटिल पाठ संकेतों के तहत निष्ठा और दृश्य गुणवत्ता के मामले में मौजूदा वाणिज्यिक और गैर-व्यावसायिक तरीकों से बेहतर हैं।

▲ इस तकनीक और अन्य प्रौद्योगिकियों द्वारा उत्पन्न सामग्री के विवरण की तुलना

केवल दो चरणों में यथार्थवादी 3D मॉडल तैयार करें

पेपर बताता है कि मेटा 3डी एसेटजेन पारंपरिक 3डी ऑब्जेक्ट जेनरेशन विधियों की तुलना में 3डी मॉडल तैयार करने के लिए दो-चरणीय डिज़ाइन अपनाता है:

विशेष रूप से:

पहला चरण: टेक्स्ट टू इमेज स्टेज (नीचे चित्र में नीला भाग): टेक्स्ट संकेतों के आधार पर 3डी जाल और बनावट उत्पन्न करें, 6-चैनल छवि की भविष्यवाणी करें जो छाया और अल्बेडो रंगों के साथ ऑब्जेक्ट के 4 दृश्यों को दर्शाती है।

दूसरा चरण: 3डी चरण की छवि में दो चरण होते हैं।
सबसे पहले, 3डी रिकंस्ट्रक्टर (जिसे मेटाआईएलआरएम कहा जाता है) एक त्रि-आयामी एसडीएफ फ़ील्ड आउटपुट करता है, जिसे बनावट वाले पीबीआर सामग्री (नीचे चित्र में नारंगी भाग) के साथ एक जाल में परिवर्तित किया जाता है।

फिर इनपुट दृश्य (नीचे की छवि में हरा) से खोए गए विवरण को पुनर्स्थापित करने के लिए इन सामग्रियों को एक बनावट रिफाइनर के साथ बढ़ाया जाता है, जिससे मॉडल की दृश्य गुणवत्ता और विवरण में सुधार होता है।

सामग्री और प्रकाश की मात्रा निर्धारित करने के लिए एकाधिक सूचकांक

तकनीकी कार्यान्वयन के संदर्भ में, मेटा 3डी एसेटजेन एसडीएफ मूल्यों को प्रस्तुत करने और 3डी बिंदुओं की अस्पष्टता प्राप्त करने के लिए विभिन्न हाइपरपैरामीटर के साथ वोल्एसडीएफ सूत्रों का उपयोग करता है।

प्रशिक्षण के दौरान, मॉडल को मल्टी-व्यू रेंडरिंग हानियों को कम करके अनुकूलित किया जाता है, लेकिन चूंकि भौतिक रूप से सटीक रेंडरिंग बहुत महंगी है, हम अनुमानित समकक्षों की निगरानी के लिए सीधे मूल पीबीआर फ़ील्ड का उपयोग करके जटिल रेंडरिंग समीकरण को बायपास करते हैं।

▲ मेटा की नई तकनीक द्वारा उत्पन्न विभिन्न सामग्रियों और शैलियों के साथ अल्पाका

इस प्रकार का पीबीआर "भौतिक-आधारित प्रतिपादन" को संदर्भित करता है, जो भौतिक रूप से आधारित प्रतिपादन है।

यह किसी वस्तु की सतह पर प्रकाश के भौतिक व्यवहार का अनुकरण करता है, वस्तु की उपस्थिति पर प्रकाश के प्रभाव, भौतिक गुणों और पर्यावरणीय कारकों को ध्यान में रखता है। यह विभिन्न विशेषताओं के आधार पर प्रकाश के प्रतिबिंब, प्रकीर्णन और प्रकीर्णन की गणना कर सकता है वस्तु की सतह, जैसे खुरदरापन, धात्विक अहसास आदि को अवशोषित कर लेती है। अधिक यथार्थवादी और सटीक प्रतिपादन प्रभाव प्राप्त करने के लिए।

मेटा 3डी एसेटजेन में, पीबीआर सामग्रियों का उपयोग 3डी मॉडल के यथार्थवाद को बढ़ाने के लिए किया जाता है। विशेष रूप से, पीबीआर सामग्री में निम्नलिखित प्रमुख गुण शामिल हैं:

  • अल्बेडो: किसी वस्तु की सतह के रंग और चमक को संदर्भित करता है, जो विभिन्न प्रकाश स्थितियों के तहत वस्तु की उपस्थिति निर्धारित करता है।
  • धात्विकता: किसी वस्तु की सतह पर धातु की डिग्री को इंगित करता है। उच्च धात्विक अनुभूति वाली वस्तुओं में अधिक स्पष्ट धात्विक चमक होगी।
  • खुरदरापन (खुरदरापन): किसी वस्तु की सतह की चिकनाई का वर्णन करता है और सतह पर प्रकाश के बिखरने की सीमा को प्रभावित करता है। खुरदरापन जितना अधिक होगा, प्रकाश का बिखराव उतना ही व्यापक होगा और हाइलाइट उतना ही नरम होगा।

▲ प्रॉम्प्ट शब्द "सामग्री से बनी एक बिल्ली" का उपयोग करके मॉडल तैयार किया गया

पीबीआर सामग्रियां वास्तव में एकीकृत होती हैं और एआई-जनित 3डी सामग्री में एक बड़ी प्रगति का प्रतिनिधित्व करती हैं। इसे एआई-निर्मित सामग्री और पेशेवर 3डी वर्कफ़्लो के बीच लंबे समय से चली आ रही समस्या को पाटना संभव माना जाता है, जिससे एआई-निर्मित सामग्री को मौजूदा वर्कफ़्लो में निर्बाध रूप से एकीकृत किया जा सके। उद्योगों में आभासी वातावरण और डिजिटल जुड़वाँ के निर्माण में तेजी लाना संभव है।

▲ टेक्स्ट संकेतों के माध्यम से ड्रैगन अंडे और भालू की उपस्थिति बनावट प्रस्तुत करें

शोधकर्ताओं ने एक सतत नेटवर्क से युक्त मेटा 3डी टेक्सचरजेन तकनीक भी पेश की, जो टेक्स्ट जेनरेशन मॉडल को 2डी स्पेस में 3डी सिमेंटिक स्थितियों के साथ जोड़ती है ताकि उन्हें कम समय में पूर्ण और उच्च-रिज़ॉल्यूशन यूवी बनावट मानचित्र में जोड़ा जा सके जटिल ज्यामिति के लिए.

▲ 3डी बनावट निर्माण प्रौद्योगिकियों की तुलना: सबसे बाईं ओर मेटा की नई विधि अधिक चमकीले रंग और अधिक जटिल विवरण दिखाती है

प्रायोगिक भाग में, शोधकर्ताओं ने प्रशिक्षण के लिए 3डी कलाकारों द्वारा बनाई गई विविध अर्थ श्रेणियों के 140,000 मेश के डेटासेट का उपयोग किया। उद्योग में अन्य पीबीआर-सक्षम टेक्स्ट-टू-3डी विधियों की तुलना में मेटा 3डी एसेटजेन की तुलना करते हुए व्यापक उपयोगकर्ता अनुसंधान भी किया गया, जिसमें दिखाया गया कि मेटा 3डी एसेटजेन दृश्य गुणवत्ता और सामग्री नियंत्रण के मामले में महत्वपूर्ण लाभ प्रदान करता है:

एसेटजेन ने चम्फर दूरी में 17% सुधार, एलपीआईपीएस में 40% सुधार हासिल किया है, और तुलनीय गति पर सर्वश्रेष्ठ श्रेणी के उद्योग प्रतिस्पर्धियों की तुलना में अत्यधिक उपयोगकर्ता-अनुकूल है, जिसमें पीबीआर समर्थन वाले 72% शामिल हैं।

मैजिनेटिव के संस्थापक और प्रधान संपादक क्रिस मैके ने टिप्पणी की:

इस प्रौद्योगिकी के संभावित अनुप्रयोग विशाल हैं। गेम डेवलपर वातावरण और पात्रों को त्वरित रूप से प्रोटोटाइप करने के लिए 3डी जेन का उपयोग कर सकते हैं, जिससे विकास प्रक्रिया काफी तेज हो जाएगी। आर्किटेक्चरल विज़ुअलाइज़ेशन कंपनियां डिज़ाइन प्रक्रिया को सुव्यवस्थित करते हुए, पाठ विवरण से इमारतों और अंदरूनी हिस्सों के विस्तृत 3डी मॉडल तैयार कर सकती हैं। आभासी और संवर्धित वास्तविकता के क्षेत्र में, 3डी जेन इमर्सिव वातावरण और वस्तुओं के तेजी से निर्माण को सक्षम बनाता है, जिससे संभावित रूप से मेटावर्स अनुप्रयोगों के विकास में तेजी आती है।

जाहिर है, मेटा की नई तकनीक विभिन्न प्रकाश परिवेशों के तहत 3डी मॉडल की यथार्थवादी प्रस्तुति की संभावना प्रदान करती है, इसमें 3डी ग्राफिक्स, एनीमेशन, गेम्स और एआर/वीआर के क्षेत्र में काफी संभावनाएं हैं और इसका गेम, फिल्म और टेलीविजन पर काफी प्रभाव पड़ेगा। यहां तक ​​कि उत्पाद विकास में भी मदद।

यह विश्व मॉडलिंग के दूसरे स्तर की ओर पहला कदम हो सकता है।

# Aifaner के आधिकारिक WeChat सार्वजनिक खाते का अनुसरण करने के लिए आपका स्वागत है: Aifaner (WeChat ID: ifanr) आपको जल्द से जल्द अधिक रोमांचक सामग्री प्रदान की जाएगी।

ऐ फ़ैनर | मूल लिंक · टिप्पणियाँ देखें · सिना वीबो