सीडेंस 2.0 के सबसे मजबूत प्रतिद्वंदी का नाम लीक हो गया है।

अब, जब भी कोई कंपनी वीडियो मॉडल जारी करती है, तो उसकी तुलना अनिवार्य रूप से सीडेंस 2.0 से की जाती है।

हाल ही में अपेक्षाकृत शांत रहने वाला गूगल, वीडियो निर्माण के क्षेत्र में अपना वर्चस्व वापस पाने के लिए चुपचाप एक बड़ा कदम उठाने की तैयारी करता दिख रहा है।

आज सुबह-सुबह, एक नेटिजन ने गलती से जेमिनी में एक बिल्कुल नया वीडियो जनरेशन मॉडल – ओमनी (ऑल-राउंडर) – सक्रिय कर दिया।

जेमिनी चैट पेज पर सीधे तौर पर लिखा है, "जेमिनी ओम्नी के साथ बनाएं और हमारे बिल्कुल नए वीडियो जनरेशन मॉडल से परिचित हों। अपने वीडियो को रीमिक्स करें, सीधे चैट में एडिट करें, ढेर सारे टेम्प्लेट आज़माएं, और भी बहुत कुछ।"

▲जेमिनी को अप्रत्याशित एक्सेस मिलने का स्क्रीनशॉट

हालांकि, इस नेटिजन ने कहा कि जब उसने जेमिनी ऐप को दोबारा खोला, तो न केवल ओमनी फीचर गायब हो गया, बल्कि जेमिनी इंटरफेस भी पुराने संस्करण में वापस आ गया।

अब तक लीक हुए शुरुआती परीक्षण परिणामों के आधार पर, जेमिनी ओमनी कुछ खास परिस्थितियों में काफी अच्छा प्रदर्शन करती है, जो उस समय की याद दिलाता है जब नैनो बनाना इमेज जनरेशन के क्षेत्र में अग्रणी हुआ करता था।

सामने आए दो परीक्षण मामलों में, जिस तरह नैनो बनाना टेक्स्ट रेंडरिंग की समस्या का समाधान करता है, उसी तरह जेमिनी ओमनी भी पिछली एआई वीडियो जनरेशन की दो कमियों को दूर करता है: टेक्स्ट की सुसंगति और लोगों के खाने की भौतिक तर्कसंगतता

▲ वीडियो स्रोत: X@chetaslua|प्रॉम्प्ट शब्द: एक प्रोफेसर एक पारंपरिक ब्लैकबोर्ड पर त्रिकोणमितीय सर्वसमिकाओं के लिए एक गणितीय प्रमाण लिखते हैं, और समीकरण में जिस चरण पर वे वर्तमान में हैं, उसे समझाते हैं।

यह 10 सेकंड का वीडियो, जो ब्लैकबोर्ड पर जटिल गणितीय समीकरणों को लिखने की चुनौती देता है, में केवल एक ही प्रश्न है: "एक प्रोफेसर एक पारंपरिक ब्लैकबोर्ड पर त्रिकोणमितीय सर्वसमिका का गणितीय प्रमाण लिखते हैं और समीकरण को हल करने के लिए वर्तमान में अपनाए जा रहे चरणों की व्याख्या करते हैं।"

हालांकि फुटेज में एआई जनरेशन की कुछ मामूली खामियां अभी भी देखी जा सकती हैं, लेकिन पूरा वीडियो ब्लैकबोर्ड पर मौजूद "टेक्स्ट" कंटेंट को बखूबी दर्शाता है, जो अतीत में कई वीडियो मॉडलों में एक बड़ी खामी थी। इसके अलावा, वीडियो का समग्र यथार्थवाद भी बेहद प्रभावशाली है।

नेटिज़न्स ने वीडियो पर प्रतिक्रिया देते हुए इसे "बेहद आश्चर्यजनक" बताया, और एआई सुपर-क्रिएशन ब्लॉगर @Azed_ai ने भी वीडियो के नीचे टिप्पणी की, "अगर यह वास्तविक आउटपुट है, तो टेक्स्ट की एकरूपता वास्तव में अविश्वसनीय है।"

▲ वीडियो फ़ाइल लिंक: https://gemini.google.com/share/7d5dc678c80a

कुछ नेटिज़न्स ने वीडियो के स्रोत पर सवाल उठाते हुए सुझाव दिया कि यह जेमिनी ओम्नी द्वारा निर्मित नहीं हो सकता है, क्योंकि खबर ब्रेक करने वाले ब्लॉगर ने सीधे जेमिनी का एक आधिकारिक लिंक पोस्ट किया था।

हमने सीडेंस 2.0 का परीक्षण उन्हीं निर्देशों के साथ किया, और दृश्यों की यथार्थता सराहनीय थी। हालांकि, ब्लैकबोर्ड पर लिखी सामग्री त्रिकोणमितीय सर्वसमिकाओं से संबंधित प्रतीत नहीं हुई, और ब्लैकबोर्ड पर टेक्स्ट के प्रदर्शन में अभी भी कुछ समस्याएं थीं।

▲सीडेंस 2.0 द्वारा जनरेट किया गया

एक और लीक हुआ वीडियो "विल स्मिथ को स्पेगेटी खाते हुए" समर्पित है, और यह टेस्ट केस लगभग सभी वीडियो जनरेशन मॉडल के लिए अनिवार्य रूप से चलाए जाने वाले प्रॉम्प्ट में से एक बन गया है।

▲ स्रोत: Reddit@Zacatac_391|प्रॉम्प्ट शब्द: क्या आप एक ऐसे दृश्य का वर्णन कर सकते हैं जिसमें दो पुरुष समुद्र किनारे एक आलीशान रेस्तरां के आउटडोर डेक पर एक मेज पर बैठे हों? वे एक गोलाकार मेज पर बैठे हैं जिस पर एक सुंदर सफेद मेज़पोश है, और सभी शानदार साज-सामान, चम्मच, कांटे और चाकू, सुंदर नैपकिन और सेंटरपीस मौजूद हैं। एक व्यक्ति प्रतिष्ठित है: एक परिपक्व अफ्रीकी-अमेरिकी पुरुष, लगभग 50 वर्ष की आयु का, छोटी दाढ़ी वाला और आत्मविश्वास से भरा हुआ, एक सुसंगठित सूट पहने हुए। दूसरा उसका मित्र है, दोनों स्पेगेटी की एक प्लेट खाने के लिए मेज की ओर बढ़ते हैं। शुरुआत में, दोनों पुरुष मेज पर आते हैं, संक्षिप्त शिष्टाचार का आदान-प्रदान करते हैं, और शांति से स्पेगेटी खाना शुरू करते हैं, बीच-बीच में बातचीत भी करते हैं।

जिस परीक्षक को परीक्षण का प्रारंभिक एक्सेस मिला था, उसने बताया कि जब उसने परीक्षण में "विल स्मिथ स्पेगेटी" टाइप करने की कोशिश की, तो वह Google के कंटेंट जनरेशन गार्डरेल द्वारा सीमित हो गया, इसलिए उसने किसी ऐसे व्यक्ति का वर्णन किया जो काफी हद तक विल स्मिथ जैसा दिखता था।

जेमिनी ओम्नी द्वारा निर्मित वीडियो, गूगल के अपने वीडियो निर्माण मॉडल, वीओ 3.1 से बेहतर है, और ध्वनि और छवि गुणवत्ता के मामले में एक वास्तविक व्यक्ति जैसा दिखता है।

हालांकि, कुछ इंटरनेट उपयोगकर्ताओं ने गौर किया कि जब वे खड़े थे, तो प्लेट में पास्ता नहीं था, लेकिन बैठने के बाद वह दिखाई देने लगा। फिर, जब वे खाना खा रहे थे, तो पास्ता उनके कुछ खाने से पहले ही गायब हो गया।

हमने इन संकेतों के समूह को संसाधित करने के लिए सीडेंस का भी उपयोग किया, और जब हमने इसे खाया, तो परिणाम जेमिनी ओमनी की तुलना में कहीं अधिक प्राकृतिक था।

▲ सीडेंस 2.0 द्वारा निर्मित | प्रॉम्प्ट: क्या आप कल्पना कर सकते हैं कि दो पुरुष एक शानदार समुद्री तट के किनारे स्थित रेस्तरां में बाहरी मेज पर भोजन कर रहे हैं? वे एक गोल मेज के चारों ओर बैठे हैं जिस पर एक बेदाग सफेद मेज़पोश बिछा है, और उस पर चम्मच, कांटे, चाकू, सुंदर नैपकिन और एक सेंटरपीस सहित उत्तम कटलरी सजी है। उनमें से एक व्यक्ति बेदाग ढंग से कपड़े पहने हुए है: पचास वर्ष की आयु का एक परिपक्व और शांत अफ्रीकी-अमेरिकी व्यक्ति, जिसकी छोटी दाढ़ी है, उसने एक सुगठित सूट पहना है और आत्मविश्वास से भरपूर है। दूसरा उसका मित्र है; दोनों पुरुष पास्ता की एक प्लेट का आनंद लेने के लिए मेज पर आते हैं। शुरुआत में, वे कुछ साधारण शिष्टाचार का आदान-प्रदान करते हैं और फिर शांति से अपना पास्ता खाते हैं, बीच-बीच में हल्की-फुल्की बातचीत भी करते हैं।

रेडिट पर एक यूजर ने सवाल किया कि क्या उसने वीडियो जनरेशन का नवीनतम मॉडल इस्तेमाल किया है। टेस्टर ने बताया कि उसने अब तक जो सबसे अच्छा मॉडल इस्तेमाल किया है, वह क्लिंग 3.0 है।

एक नेटिजन ने जवाब दिया कि सीडेंस 2.0, क्लिंग 3.0 से कहीं बेहतर है, इसलिए जेमिनी ओम्नी का प्रदर्शन मेरे लिए (जिसने सीडेंस 2.0 का उपयोग किया है) आश्चर्यजनक नहीं है।

X पर, कुछ नेटिज़न्स का यह भी मानना ​​है कि जेमिनी ओम्नी, सीडेंस 2.0 से बेहतर प्रदर्शन करता है।

▲ X पर कई नेटिज़न्स ने इन खुलासे वाले वीडियो को साझा किया और कहा कि ये सीडेंस से अधिक प्रभावी थे।

इससे भी ज्यादा आश्चर्यजनक बात यह है कि Google ने इस बार न केवल वीडियो जनरेशन फंक्शनैलिटी लॉन्च की है, बल्कि जेमिनी ओम्नी वीडियो एडिटिंग फीचर्स को भी सपोर्ट करता है।

उदाहरण के लिए, आप मूल वीडियो में पास्ता को थाई शैली के सूप के एक कटोरे से बदल सकते हैं जो टॉम युम जैसा दिखता है।

यह पहले से जेनरेट किए गए सोरा वीडियो को सीधे एडिट करके वॉटरमार्क को हटा भी सकता है।

▲वीडियो स्रोत: X@Waguri_Kaoruko8

परीक्षण परिणामों के आधार पर, जेमिनी ओम्नी ने मूल सोरा वीडियो से लगातार हिलते हुए सोरा वॉटरमार्क को सफलतापूर्वक हटा दिया, साथ ही मूल वीडियो के साथ बुनियादी संगति को भी बनाए रखा।

कुछ इंटरनेट उपयोगकर्ताओं ने एनिमेटेड वीडियो बनाने में जेमिनी ओम्नी के प्रदर्शन का भी परीक्षण किया।

मूल नैनो बनाना की तरह, जो इमेज एडिटिंग पर केंद्रित था और उपयोगकर्ताओं को विभिन्न प्रकार की डेस्कटॉप मूर्तियाँ बनाने की अनुमति देता था, कई लोगों का मानना ​​है कि जेमिनी ओम्नी भी इसी राह पर चलेगा। हालाँकि इसकी वीडियो जनरेशन क्षमताएँ कमज़ोर हैं, लेकिन इसकी वीडियो एडिटिंग क्षमताएँ बेहतर होंगी। यह अनुमान लगाया जा रहा है कि जेमिनी ओम्नी 3 में अब तक की सबसे बेहतरीन वीडियो जनरेशन क्षमताएँ होंगी।

सामने आए इंटरफ़ेस में उपयोग का एक स्क्रीनशॉट भी शामिल था। डेटा से पता चला कि केवल दो वीडियो – एक गणित का व्हाइटबोर्ड वीडियो और नूडल्स खाते हुए एक वीडियो – बनाने में ही उपयोगकर्ता की दैनिक AI Pro सदस्यता सीमा का 86% उपयोग हो गया। उपयोगकर्ता ने बताया कि उसने उस दिन केवल कुछ जेमिनी फ्लैश का ही उपयोग किया था।

एआई वीडियो का कारोबार अभी भी काफी महंगा है, लेकिन जब तक परिणाम अच्छे होंगे, तब तक इसके लिए भुगतान करने को तैयार लोगों की संख्या काफी होगी।

हाल ही में, कुछ एआई वीडियो ऑनलाइन वायरल हुए हैं, जिनमें पिछले साल वायरल हुए एआई वीडियो की तुलना में लंबी अवधि, अधिक यथार्थवादी दृश्य, संवाद, अभिनय कौशल और कहानी कहने की क्षमता का दावा किया गया है।

वीडियो जनरेशन प्लेटफॉर्म रनवे के तकनीकी कलाकार मार्को स्लाव्निक ने रनवे ऑन एक्स का उपयोग करके बनाए गए कबूतरों का एक वीडियो पोस्ट किया। रनवे सीडेंस 2.0 मॉडल के उपयोग की अनुमति देता है, और वीडियो को देखते ही देखते लाखों व्यूज मिल गए।

कुछ नेटिज़न्स ने कहा कि 47 सेकंड के वीडियो में एआई या अप्राकृतिक गतिविधियों का कोई निशान नहीं दिखा, जिससे पता चलता है कि डिज्नी एनिमेशन को वास्तव में सतर्क रहने की जरूरत हो सकती है।

▲ वीडियो स्रोत: X@Markoslavnic

वीबो पर ट्रेंड करने वाला एक और विषय था "एआई लघु फिल्मों का बड़े पैमाने पर निर्माण और उनका क्रैश होना", जिसे बाहरी वेबसाइटों पर दोबारा पोस्ट किए जाने के बाद 12 मिलियन व्यूज मिले।

इस वीडियो को शेयर करने वाले व्यक्ति पीजे ऐस हैं, जो जनरेटिव एआई वीडियो और विज्ञापन के क्षेत्र में एक निर्माता होने के साथ-साथ एक एआई विज्ञापन कंपनी के संस्थापक भी हैं। उन्होंने सीधे तौर पर कहा,

यह हाल के वर्षों में देखी गई सर्वश्रेष्ठ लघु फिल्मों में से एक है।
जल्द ही, हम इसे "एआई फिल्म" नहीं कहेंगे, बल्कि बस एक फिल्म कहेंगे।

▲ वीडियो स्रोत: X@PJaccetturo

मूल वीडियो के बिलिबिली कमेंट सेक्शन में, कुछ नेटिज़न्स ने उल्लेख किया कि वीडियो बहुत लोकप्रिय था, और न केवल विदेश से पीजे ऐस ने उन्हें नौकरी की पेशकश करना चाहा, बल्कि ग्वांगझू में एआई+ क्रिएटिव टीम ने भी उनके प्रति सद्भावना का प्रस्ताव रखा।

वीडियो की खूब तारीफ हुई: "अगर यह ट्रेलर होता तो मैं इसे देखने सिनेमा हॉल जाता," "बेहतरीन काम; रंग, संरचना और कथानक सब लाजवाब हैं। थोड़ा छोटा होने के अलावा, यह 'लव, डेथ एंड रोबोट्स' के किसी भी सीज़न में बिल्कुल फिट बैठता," "कुछ साल पहले, इसे बनाने में एक बेहतरीन टीम को कई महीने और लाखों डॉलर लग जाते"…

▲ वीडियो स्रोत: [एआई की मूल लघु फिल्म "ज़ोंबी क्लीनर" – रीमास्टर्ड संस्करण, घरेलू "लव, डेथ एंड रोबोट्स"!] https://www.bilibili.com/video/BV1FFRQB2Eqw/

पिछले महीनों की तरह ही, इंटरनेट उपयोगकर्ता अब "इस महीने देखने लायक चार एआई लघु फिल्मों" का सारांश प्रस्तुत कर रहे हैं।

एआई द्वारा बनाई गई घटिया सामग्री के रूप में आलोचना की जाने वाली सामग्री के अलावा, एआई वीडियो का मुख्यधारा का माध्यम बनना अपरिहार्य है क्योंकि उत्पन्न सामग्री की गुणवत्ता में सुधार हो रहा है।

गूगल द्वारा जेमिनी ओम्नी का अनावरण आगामी सप्ताह में होने वाले गूगल आई/ओ सम्मेलन के लिए उत्साह बढ़ाने का एक तरीका हो सकता है। यदि जेमिनी ओम्नी को इस वर्ष के सम्मेलन में उपलब्ध कराया जाता है, तो यह एआई वीडियो निर्माण के एक नए युग की शुरुआत होगी।

#iFanr के आधिकारिक वीचैट अकाउंट को फॉलो करने के लिए आपका स्वागत है: iFanr (वीचैट आईडी: ifanr), जहां आपको जल्द से जल्द और भी रोमांचक सामग्री प्रस्तुत की जाएगी।