चीनी एआई कंपनी का यह अपनी तरह का पहला वीडियो मॉडल है जो सूक्ष्म स्तर पर वर्णों को सटीक रूप से नियंत्रित कर सकता है WAIC 2024 |

SenseTime ने फिर से कुछ बढ़िया किया है, और यह केवल एक फोटो के साथ एक मिनट का वीडियो तैयार कर सकता है।

4 जुलाई को, सेंसटाइम द्वारा सी-एंड उपयोगकर्ताओं के लिए बनाए गए पहले बड़े नियंत्रणीय कैरेक्टर वीडियो जेनरेशन मॉडल विमी को विश्व आर्टिफिशियल इंटेलिजेंस कॉन्फ्रेंस (डब्ल्यूएआईसी) प्रदर्शनी प्रदर्शन के लिए सर्वोच्च सम्मान "ट्रेजर ऑफ द हॉल" के रूप में चुना गया था सम्मेलन में सबसे नवीन प्रदर्शन।

सेंसटाइम के नए बड़े मॉडल के आधार पर, विमी एक चरित्र वीडियो तैयार कर सकता है जो किसी भी शैली की तस्वीर के माध्यम से लक्ष्य कार्रवाई के अनुरूप है, और विभिन्न ड्राइविंग विधियों का समर्थन करता है, जो मौजूदा चरित्र वीडियो, एनिमेशन, ध्वनि, टेक्स्ट इत्यादि का उपयोग कर सकता है। अनेक तत्वों द्वारा संचालित.

बड़े मॉडलों और जेनेरिक एआई तकनीक के तेजी से विकास के साथ, स्थिर तस्वीरों को "जीवित" बनाना अब मुश्किल नहीं है।

हालाँकि, बाजार में मौजूदा उत्पादों में अभी भी व्यावहारिक अनुप्रयोगों में कई समस्याएं हैं, जैसे गलत आंदोलन और अभिव्यक्ति नियंत्रण, खराब प्रभाव स्थिरता और सीमित वीडियो अवधि, जो वीडियो रचनाकारों के रचनात्मक स्थान को सीमित करती है।

इन बाधाओं को दूर करने के लिए, सेंसटाइम ने एक बड़ा नियंत्रणीय कैरेक्टर वीडियो जेनरेशन मॉडल – विमी लॉन्च किया है।

चित्र अभिव्यक्ति नियंत्रण तकनीक के विपरीत, जो केवल सिर की अभिव्यक्ति की गतिविधियों को नियंत्रित कर सकती है, विमी न केवल पात्रों की सटीक अभिव्यक्ति नियंत्रण प्राप्त कर सकती है, बल्कि आधे शरीर के क्षेत्र में तस्वीरों में पात्रों के प्राकृतिक शारीरिक परिवर्तनों को भी नियंत्रित कर सकती है, और स्वचालित रूप से बाल, बाल उत्पन्न कर सकती है। , और बाल जो पात्रों से मेल खाते हैं, पोशाक और पृष्ठभूमि बदल जाती है।

साथ ही, विमी उचित रूप से प्रकाश और छाया परिवर्तन भी उत्पन्न कर सकती है, जिससे चरित्र की गतिविधियां और दृश्य प्रभाव सहज और प्राकृतिक हो जाते हैं, और चित्र सामंजस्यपूर्ण और सुंदर हो जाता है।

इससे भी महत्वपूर्ण बात यह है कि विमी समय के साथ गिरावट या विरूपण के बिना 1 मिनट तक एकल-शॉट चरित्र वीडियो उत्पन्न कर सकता है, जो मनोरंजन और इंटरैक्शन परिदृश्यों में दीर्घकालिक स्थिर वीडियो की मांग को पूरी तरह से पूरा करता है।

रीरिक्सिन ने आधिकारिक तौर पर कहा कि विमी सी-एंड उपयोगकर्ताओं के लिए पूरी तरह से खुला रहेगा, विशेष रूप से महिला उपयोगकर्ताओं की मनोरंजन और निर्माण आवश्यकताओं को पूरा करने के लिए।

उपयोगकर्ताओं को केवल विभिन्न कोणों से लोगों की उच्च-परिभाषा तस्वीरें अपलोड करने की आवश्यकता है, और विभिन्न शैलियों के डिजिटल अवतार और फोटो वीडियो स्वचालित रूप से उत्पन्न किए जा सकते हैं।

विमी द्वारा तैयार किए गए वीडियो चरित्र अब केवल सुस्त चेहरे की हरकतें नहीं हैं, बल्कि अधिक पूर्ण और एकीकृत चरित्र आंदोलनों को बनाने के लिए इशारों, अंगों, बालों आदि से मेल खाते हैं, जिससे रचनाकारों को उत्पन्न वीडियो सामग्री के आधार पर संपादित करने और फिर से बनाने की अनुमति मिलती है।

जो उपयोगकर्ता सेल्फी लेना पसंद करते हैं, विमी विभिन्न प्रकार के मनोरंजन और इंटरैक्टिव परिदृश्यों जैसे चैटिंग, गायन, नृत्य आदि का समर्थन करता है, उन उपयोगकर्ताओं के लिए जो इमोटिकॉन्स के शौकीन हैं, विमी एक ही फोटो के माध्यम से विभिन्न प्रकार के दिलचस्प चरित्र इमोटिकॉन्स उत्पन्न कर सकता है; खेलने के विभिन्न तरीकों और रचनात्मक स्वतंत्रता प्राप्त करने के साथ।

इसके अलावा, विमी विभिन्न प्रकार की पीढ़ी शैलियाँ भी प्रदान करता है जैसे कि सौंदर्य फोटो शैली और फंतासी शैली, जो उपयोगकर्ताओं को विभिन्न आयामों के माध्यम से यात्रा करने और ब्लॉकबस्टर-जैसे इमर्सिव दृश्य प्रभावों का आनंद लेने की अनुमति देती है।

वर्तमान में, उद्योग में 80% वीडियो में मुख्य सामग्री के रूप में पात्र होते हैं, साथ ही, लघु वीडियो और लाइव प्रसारण प्लेटफार्मों के विस्फोट के साथ, मुख्य सामग्री के रूप में पात्रों वाले वीडियो की मांग तेजी से बढ़ी है।

हालाँकि, बाजार में AIGC उत्पादों की कमी है जो चरित्र वीडियो निर्माण को नियंत्रित कर सकते हैं, जिससे सामग्री निर्माताओं की दक्षता में सुधार की तत्काल आवश्यकता होती है।

यह कहा जा सकता है कि विमी के आगमन ने इस अंतर को भर दिया है, जिससे अधिकांश सी-साइड वीडियो रचनाकारों के लिए एक सरल और उपयोग में आसान निर्माण उपकरण उपलब्ध हो गया है, जिसका व्यापक रूप से चरित्र लघु वीडियो के निर्माण में उपयोग किया जा सकता है।

विमी के बारे में अधिक जानकारी 5 जुलाई को सेंसटाइम द्वारा आयोजित "लव विदाउट बाउंड्रीज़ · ज़ियांग ज़िनली" कृत्रिम बुद्धिमत्ता मंच पर प्रस्तुत की जाएगी। एपीपीएसओ भी रिपोर्टों का अनुवर्ती कार्रवाई करेगा।

वर्तमान में, विमी ने सेंसटाइम की आधिकारिक वेबसाइट पर आरक्षण खोल दिया है, और इसका अनुभव लेने के लिए आपका स्वागत है।

आरक्षण पता पोर्टल संलग्न है: https://vme-int.softsugar.com/questionnaire/

# Aifaner के आधिकारिक WeChat सार्वजनिक खाते का अनुसरण करने के लिए आपका स्वागत है: Aifaner (WeChat ID: ifanr) आपको जल्द से जल्द अधिक रोमांचक सामग्री प्रदान की जाएगी।

ऐ फ़ैनर | मूल लिंक · टिप्पणियाँ देखें · सिना वीबो