अभी-अभी, OpenAI का किंग बम सोरा आधिकारिक तौर पर लॉन्च किया गया है! वेबसाइट इतनी लोकप्रिय है कि यह क्रैश हो जाती है, अल्ट्रामैन तत्काल उपयोगकर्ता पंजीकरण बंद कर देता है

अभी-अभी, OpenAI Sora की आधिकारिक शुरुआत हुई।

इस प्रेस कॉन्फ्रेंस ने "लघु नाटक" की तेज़ गति वाली शैली को जारी रखा, जो लगभग 20 मिनट तक चली और इसकी मेजबानी सीईओ सैम ऑल्टमैन, सोरा प्रमुख बिल पीबल्स और अन्य ने की।

OpenAI ने कहा

दिलचस्प बात यह है कि सोरा की लोकप्रियता के कारण, बड़ी संख्या में उपयोगकर्ता अनुभव वेबसाइट पर आ गए, जिससे वेबसाइट क्रैश हो गई और पंजीकरण और लॉगिन बंद हो गया। खराब सेवा ऑल्टमैन को एक्स प्लेटफॉर्म पर उपयोगकर्ताओं को खुश करने की भी अनुमति देती है:

"अनुमान से अधिक मांग के कारण, हमें नए उपयोगकर्ता पंजीकरणों को रुक-रुक कर बंद करना होगा और जिस दर पर सामग्री उत्पन्न होती है वह कुछ समय के लिए धीमी हो जाएगी। हम कड़ी मेहनत कर रहे हैं!"

अनुभव का पता संलग्न है: Sora.com

सोरा इंटरफ़ेस का पता चला, इसमें 6 ईश्वर-स्तरीय कार्य हैं, संपादन सीखने की कोई आवश्यकता नहीं है?

मिडजर्नी के वेब इंटरफेस के समान, सोरा का भी अपना अलग यूजर इंटरफेस है। उपयोगकर्ता न केवल जेनरेट किए गए वीडियो को व्यवस्थित और ब्राउज़ कर सकते हैं, बल्कि अन्य उपयोगकर्ताओं से युक्तियां और चयनित सामग्री भी देख सकते हैं।

"लाइब्रेरी" फ़ंक्शन में, उपयोगकर्ता भविष्य में उपयोग के लिए अपने पसंदीदा या उपयोगी संकेत शब्द सहेज सकते हैं। और सहेजे गए शीघ्र शब्दों को आवश्यकतानुसार देखा या संशोधित किया जा सकता है, जो निस्संदेह उन उपयोगकर्ताओं के लिए दक्षता में काफी सुधार करेगा जिन्हें बार-बार समान सामग्री बनाने की आवश्यकता होती है।

वर्कफ़्लो के संदर्भ में, सोरा का संपादन कार्य एक महत्वपूर्ण आकर्षण है जो इसे अन्य प्रतिस्पर्धी उत्पादों से अलग करता है।

उदाहरण के लिए, रीमिक्स फ़ंक्शन में, उपयोगकर्ता पूरी तरह से प्राकृतिक भाषा संकेतों का उपयोग करके वीडियो संपादित कर सकते हैं, और सरल "शक्ति" विकल्पों और स्लाइडर्स के माध्यम से उत्पन्न परिवर्तन की डिग्री को नियंत्रित कर सकते हैं।

री-कट फ़ंक्शन बुद्धिमानी से सर्वोत्तम चित्र की पहचान कर सकता है और दृश्य को किसी भी दिशा में विस्तारित करने में सहायता कर सकता है।

सोरा का स्टोरीबोर्ड फ़ंक्शन एक वीडियो एडिटर के समान है, यह एक लंबा वीडियो बनाने के लिए कई त्वरित शब्दों को एक साथ जोड़ सकता है, और जटिल मल्टी-स्टेप दृश्यों को आसानी से संभाल सकता है।

लूप और ब्लेंड फ़ंक्शन के साथ, उपयोगकर्ता निर्बाध लूपिंग वीडियो भी बना सकते हैं और विभिन्न क्लिप को पूरी तरह से मिश्रित कर सकते हैं, जबकि स्टाइल प्रीसेट फ़ंक्शन जेनरेट की गई शैलियों को प्रीसेट और समायोजित कर सकता है।

तकनीकी विशिष्टताओं के संदर्भ में, सोरा 5-20 सेकंड की वीडियो पीढ़ी का समर्थन करता है और 1:1 और 9:16 जैसे मुख्यधारा पहलू अनुपात के साथ संगत है। पिछले संस्करणों की तुलना में पीढ़ी की गति में अब काफी सुधार हुआ है।

इसके अलावा, ध्यान देने योग्य कुछ विवरण भी हैं।

ओपनएआई एक लचीली पॉइंट मूल्य निर्धारण रणनीति अपनाता है। पॉइंट की संख्या रिज़ॉल्यूशन और अवधि के आधार पर भिन्न होती है। यदि आप पहले से ही चैटजीपीटी प्लस और प्रो सदस्य हैं, तो आप इसे बिना किसी अतिरिक्त लागत के उपयोग कर सकते हैं।

उदाहरण के लिए, 480p, 5s वीडियो बनाने के लिए 25 अंक की आवश्यकता होती है, और 480p, 20s वीडियो बनाने के लिए 150 अंक की आवश्यकता होती है।

इसके अलावा, यदि आप री-कट, रीमिक्स, ब्लेंड या लूप जैसे फ़ंक्शंस का उपयोग करते हैं, और उत्पन्न कार्य 5 सेकंड से अधिक है, तो आपके अंक अतिरिक्त रूप से काट लिए जाएंगे, जितना अधिक आप ओवरटाइम खर्च करेंगे। क्योंकि ओवरटाइम में भी आपके पैसे खर्च होंगे।

ग्राहकों के लिए, $20 चैटजीपीटी प्लस योजना 50 प्राथमिकता वाले वीडियो क्रेडिट (1,000 अंक) प्रदान करती है, जो 720पी रिज़ॉल्यूशन और 5 सेकंड की लंबाई का समर्थन करती है।

$200 चैटजीपीटी प्रो योजना 500 प्राथमिकता वाले वीडियो (10,000 अंक) तक की पेशकश करती है, 1080p रिज़ॉल्यूशन, 20 सेकंड की अवधि, 5 समवर्ती पीढ़ी और कोई वॉटरमार्क आउटपुट का समर्थन नहीं करती है।

OpenAI विभिन्न प्रकार के उपयोगकर्ताओं के लिए अलग-अलग मूल्य निर्धारण मॉडल भी विकसित कर रहा है, जिसे अगले साल की शुरुआत में लॉन्च किया जाएगा।

वैसे, सोरा वर्तमान में चैटजीपीटी के टीम, एंटरप्राइज और एडू संस्करणों का समर्थन नहीं करता है, और यह 18 वर्ष से कम आयु के उपयोगकर्ताओं के लिए खुला नहीं है। इस स्तर पर, यूनाइटेड किंगडम, स्विट्जरलैंड और यूरोपीय संघ जैसे क्षेत्रों को छोड़कर, उपयोगकर्ता उन सभी स्थानों पर सोरा तक पहुंच सकते हैं जहां चैटजीपीटी उपलब्ध है।

सोरा का वास्तविक परीक्षण इसकी सबसे बड़ी कमियों को उजागर करता है, लेकिन ये दृश्य पेशेवर स्तर के तुलनीय हैं

जाने-माने ब्लॉगर मार्केस ब्राउनली ने एक हफ्ते पहले ही सोरा का इस्तेमाल किया और यूट्यूब पर अपना अनुभव साझा किया।

उन्होंने कहा कि उत्पाद में अभी भी कुछ सीमाएँ हैं।

भौतिक अनुकरण के संदर्भ में, वस्तु की गति के बारे में मॉडल की समझ पर्याप्त गहरी नहीं है, और अप्राकृतिक गति और वस्तुओं के अचानक गायब होने जैसी समस्याएं अक्सर होती हैं। विशेष रूप से पैरों की हरकतों के साथ वस्तुओं से निपटते समय, आगे और पीछे के पैरों की स्थिति अक्सर भ्रमित हो जाती है, जिससे हरकतें अप्राकृतिक लगती हैं।

या, कुछ वीडियो निर्माण के परिणाम धीमी गति की तरह दिख सकते हैं, जबकि वीडियो के अन्य भाग सामान्य गति से चलते हैं, यह "अजीबता" नग्न आंखों को आसानी से दिखाई देती है। संक्षेप में, सोरा ने अभी भी अपनी पुरानी समस्या, भौतिक दुनिया के नियमों की समझ की कमी, का समाधान नहीं किया है।

इसके अलावा, सोरा टेक्स्ट जनरेशन की समस्या को हल करने में विफल रहा, जिसके परिणामस्वरूप बार-बार टेक्स्ट भ्रम होता रहा, हालांकि, संपादन शैली, टेक्स्ट स्क्रॉल बार मूवमेंट और समाचार एंकर शैली जेनरेशन विशेष रूप से यथार्थवादी हैं।

हालाँकि, ऐसे कुछ दृश्य हैं जहाँ सोरा अच्छी हैं।

उदाहरण के लिए, सोरा लैंडस्केप शॉट्स को संसाधित करने में उत्कृष्ट है और हवाई ड्रोन फुटेज का उत्पादन कर सकता है जो पेशेवर फुटेज को टक्कर देता है, लेकिन यह कार्टून और स्टॉप-मोशन एनीमेशन शैलियों के साथ भी कम अच्छा प्रदर्शन करता है।

प्रदर्शन के संदर्भ में, 5-सेकंड का 360p वीडियो आमतौर पर 20 सेकंड में तैयार किया जा सकता है।

हालाँकि, जब 1080p या जटिल प्रॉम्प्ट शब्दों की बात आती है, तो पीढ़ी का समय कुछ मिनटों तक बढ़ाया जा सकता है, लेकिन आज बड़ी संख्या में उपयोगकर्ताओं की आमद के साथ, पीढ़ी की गति स्पष्ट रूप से आधे बीट से भी धीमी है।

कई नेटिज़न्स ने भी पहली बार सोरा का अनुभव किया। उदाहरण के लिए, नेटिज़न @बेनाश एक वीडियो बनाना चाहता था, लेकिन सफलता के बिना इसे प्रस्तुत करने में 22 मिनट लग गए, वेबसाइट ने कुछ समय के लिए पंजीकरण और लॉग इन करना भी बंद कर दिया।

ब्लॉगर @nickfloats ने टिप्पणी की कि जब सोरा ने छवियों को वीडियो में परिवर्तित किया, हालांकि कुछ विशिष्ट दृश्य प्रभावों को बरकरार नहीं रखा गया, समग्र रूपांतरण प्रभाव "स्पष्ट और संतोषजनक" था।

क्या सोरा OpenAI की अगली "सुनहरी मुर्गी" बन सकती है?

सोरा सिस्टम कार्ड में ध्यान देने योग्य कुछ विवरण भी सूचीबद्ध हैं।

ओपनएआई अधिकारियों का मानना ​​है कि सोरा उन मॉडलों के लिए एक आधार प्रदान करता है जो वास्तविक दुनिया को समझ और अनुकरण कर सकते हैं और सामान्य कृत्रिम बुद्धिमत्ता (एजीआई) की प्राप्ति में एक महत्वपूर्ण मील का पत्थर होगा।

जैसा कि आधिकारिक ब्लॉग में बताया गया है, सोरा एक प्रसार मॉडल है जो एक बेस वीडियो से शुरू होता है जो स्थिर शोर जैसा दिखता है और धीरे-धीरे शोर को हटा देता है और अंतिम वीडियो में बदल जाता है। एक साथ कई फ़्रेमों को संसाधित करके, मॉडल एक कठिन समस्या को सफलतापूर्वक हल करता है: यह सुनिश्चित करना कि ऑब्जेक्ट वीडियो में सुसंगत बना रहे, भले ही वह अस्थायी रूप से दृश्य के क्षेत्र को छोड़ दे।

जीपीटी मॉडल के समान, सोरा ट्रांसफार्मर आर्किटेक्चर को अपनाता है।

सोरा DALL·E 3 में एनोटेशन तकनीक का उपयोग करता है, जो दृश्य प्रशिक्षण डेटा के लिए अत्यधिक वर्णनात्मक लेबल उत्पन्न करता है। परिणामस्वरूप, मॉडल उपयोगकर्ता के पाठ्य निर्देशों के आधार पर अधिक सटीक रूप से वीडियो सामग्री उत्पन्न करने में सक्षम है।

केवल टेक्स्ट कमांड से वीडियो बनाने में सक्षम होने के अलावा, सोरा मौजूदा स्थिर छवियों से वीडियो बनाने, छवि सामग्री को सटीकता और विस्तार पर ध्यान देने में सक्षम है। मॉडल मौजूदा वीडियो से गायब फ़्रेमों को भी विस्तारित या भर सकता है।

सोरा की सुरक्षित तैनाती सुनिश्चित करने के लिए, ओपनएआई ने चैटजीपीटी और एपीआई तैनाती में DALL·E के सुरक्षा अनुभव के साथ-साथ अन्य ओपनएआई उत्पादों (जैसे चैटजीपीटी) के सुरक्षा सुरक्षा उपायों के आधार पर इसे मजबूत किया है।

  • किसी अन्य व्यक्ति की अनुमति के बिना उसकी समानता का उपयोग करें, और वास्तविक नाबालिगों का चित्रण निषिद्ध है;
  • अवैध सामग्री या ऐसी सामग्री बनाना जो बौद्धिक संपदा अधिकारों का उल्लंघन करती हो;
  • हानिकारक सामग्री पर प्रतिबंध लगाना, जैसे कि गैर-सहमति वाली अंतरंग छवियां, धमकाने, परेशान करने या बदनाम करने वाली सामग्री, या हिंसा, घृणा फैलाने या दूसरों को परेशान करने वाली सामग्री;
  • ऐसी सामग्री बनाएं और वितरित करें जिसका उद्देश्य दूसरों को धोखा देना, धोखा देना या गुमराह करना हो।

सभी सोरा-जनरेटेड वीडियो C2PA मेटाडेटा के साथ आते हैं जो वीडियो को सोरा से आने वाले के रूप में पहचानता है, जिससे पारदर्शिता बढ़ती है और इसका उपयोग इसके मूल को सत्यापित करने के लिए किया जा सकता है।

फ्लक्स के विपरीत, जो पहले अपनी पहचान बनाने के लिए वास्तविक चित्रों पर निर्भर था, सोरा ने लोगों वाली सामग्री अपलोड करने के लिए विशेष रूप से सख्त समीक्षा मानक निर्धारित किए हैं, यह वर्तमान में केवल शुरुआती परीक्षकों की एक छोटी संख्या के लिए एक पायलट फ़ंक्शन के रूप में प्रदान किया गया है, और नग्नता वाली सामग्री को अवरुद्ध कर दिया गया है .

आधे साल से अधिक समय पहले अपनी शुरुआत करने वाली सोरा ने इंटरनेट से प्रशंसा हासिल की।

हालाँकि, अगर हम एक साल पहले डेमो के एक समूह के सामने "वास्तविकता अब मौजूद नहीं है" चिल्ला नहीं सकते थे, तो देश और विदेश में विभिन्न वीडियो मॉडलों के निरंतर बपतिस्मा के तहत, हमारी पहले से विकसित भूख के लिए उसी से आकर्षित होना मुश्किल है। उत्पाद।

रवैये में यह बदलाव एक साधारण तथ्य से उपजा है।

जब एआई "मुश्किल से उपयोग करने योग्य" से "बड़े पैमाने पर उपयोग किया जा सकता है" तक विकसित होता है, तो उपयोगकर्ताओं की उम्मीदें भी बढ़ जाएंगी, "क्या यह किया जा सकता है" से "कितनी अच्छी तरह से किया जा सकता है" पर पहुंच जाएगी।

सौभाग्य से, सोरा तालियों के बीच स्थिर नहीं रहे, कलाकारों के साथ गहन सहयोग के माध्यम से, उन्होंने वर्कफ़्लो क्षेत्र में महत्वपूर्ण सुधार किए हैं। री-कट, रीमिक्स, स्टोरीबोर्ड और अन्य फ़ंक्शन काफी उपयोगी हैं।

पार्टी ए और पार्टी बी का अस्तित्व यह निर्धारित करता है कि वर्कफ़्लो में संचार हमेशा एक आवश्यकता है। एआई इस संचार को और अधिक कुशल बना सकता है। सोरा का मूल्य इसमें नहीं है कि वह क्या कर सकता है, बल्कि रचनाकारों को इससे बचने की अनुमति देने में है तकनीकी विवरण और वास्तव में रचनात्मकता के सार पर लौटें।

साथ ही, $200 चैटजीपीटी प्रो सदस्यता योजना, जिसने पिछले सप्ताह बहुत चर्चा की थी, अब एक अधिक उचित मूल्य एंकर है। यह योजना सोरा तक असीमित पहुंच का भी समर्थन करती है। इस उत्पाद तालमेल से एप्लिकेशन परिदृश्यों को भी बढ़ावा मिलने की उम्मीद है व्यावसायिक मूल्य.

वर्तमान स्थिति को देखते हुए, उपयोगकर्ताओं का असली पैसा कभी भी नकली नहीं होगा।

केलिंग एआई ने लाखों मासिक राजस्व के उत्कृष्ट परिणाम दिए हैं। ओपनएआई के लिए, जो अभी भी "पैसा जलाने" के चरण में है, चैटजीपीटी के बाद सोरा के एक और सुनहरा अंडा बनने की उम्मीद है .

जब सोरा "उपयोग करने योग्य" से "उपयोग में आसान" से "अद्भुत" की ओर जाएगा, तो शायद भविष्य में एक दिन, हम पाएंगे कि जो वास्तव में अस्तित्व में नहीं है वह वास्तविकता नहीं है, बल्कि मानव रचनात्मकता का अंत है।

# Aifaner के आधिकारिक WeChat सार्वजनिक खाते का अनुसरण करने के लिए आपका स्वागत है: Aifaner (WeChat ID: ifanr) आपको जल्द से जल्द अधिक रोमांचक सामग्री प्रदान की जाएगी।

ऐ फ़ैनर | मूल लिंक · टिप्पणियाँ देखें · सिना वीबो