Midjourney v5 लोकप्रिय टेक्स्ट-टू-इमेज जनरेटर का नवीनतम भाषा मॉडल है जो अपनी यथार्थवादी रचनाओं के लिए जाना जाता है।
बुधवार को मिडजर्नी के पेड कस्टमर बेस के लिए अपडेट जारी किया गया और ग्राफिक डिजाइनर जूली वीलैंड सहित कई उपयोगकर्ता अपनी नई एआई-जेनरेट की गई कलाकृति को साझा कर रहे हैं। AI विवरण जो v5 भाषा मॉडल अपने साथ लाता है, उसमें बेहतर "दक्षता, सुसंगतता और गुणवत्ता" शामिल है, Midjourney ने अपनी वेबसाइट पर कहा।
कई उपयोगकर्ताओं ने विशेष रूप से मानव हाथ के विवरण में उन्नयन पर ध्यान दिया है, जिसमें विषयों में प्रति हाथ पांच अंगुलियों की संभावना अधिक होती है। पिछले मॉडलों में, मानव हाथ अक्सर अंकों की गलत संख्या के साथ उत्पन्न होते थे, कहीं भी चार से सात और दस के बीच। जो मिडजर्नी v5 का परीक्षण करने में सक्षम हैं वे दृश्य उन्नयन से प्रभावित हुए हैं।
वीलैंड ने पेटापिक्सल को बताया, "नवीनतम मिडजर्नी वी5 मॉडल बेहद जबरदस्त/डरावना और आकर्षक दोनों है।"
"जटिल विवरण और बनावट, जैसे यथार्थवादी त्वचा बनावट / चेहरे की विशेषताओं और प्रकाश व्यवस्था को फिर से बनाने की इसकी क्षमता अद्वितीय है," उसने कहा।
जबकि मिडजर्नी कुछ हद तक एक अद्वितीय भाषा मॉडल है, यह अन्य टेक्स्ट-टू-इमेज जेनरेटर जैसे स्टेबल डिफ्यूजन और डीएएल-ई के समान काम करता है, मॉडल के अनुसार छवियों को बनाने के लिए शब्दों वाले शीघ्र वर्णनकर्ताओं का उपयोग करता है, जिसे मानव का उपयोग करके प्रशिक्षित किया जाता है। ArsTechnica के अनुसार, एक संदर्भ के रूप में निर्मित कला।
इस बारे में बहस चल रही है कि एआई-जनित कला कानूनी है या नैतिक; हालाँकि, कई मिडजर्नी v5 उपयोगकर्ता मानते हैं कि निरंतर उन्नयन के साथ यह वास्तविक कला और फोटोग्राफी से अप्रभेद्य हो सकता है। विलैंड का मानना है कि मिडजर्नी जैसे एआई छवि जनरेटर प्रतिस्थापन के बजाय फोटोग्राफरों के साथी होने की संभावना है।
हालाँकि, मिडजर्नी v5 इसके उतार-चढ़ाव के बिना नहीं है। एआई छवि निर्माता निक सेंट पियरे ने अपने कई कार्यों को साझा किया, जिसके लिए उन्होंने पिछले मिडजर्नी वी4 और मिडजर्नी वी5 में समान संकेतों का उपयोग किया। एक छवि 1960 के दशक की स्ट्रीट स्टाइल में युवतियों का एक आकर्षक शॉट था जो एक आउटडोर फैशन शूट जैसा दिखता है। करीब से निरीक्षण करने पर, आप तैरते हाथों को शरीर से जुड़े नहीं देख सकते हैं और पृष्ठभूमि में मिशापेन चेहरे देख सकते हैं।
अपने नवीनतम v5 मॉडल के साथ, Midjourney के संस्थापक डेविड होल्ज़ ने ब्रांड के डिसॉर्डर पर सिफारिश की कि उपयोगकर्ता बेहतर परिणाम प्राप्त करने के लिए "लंबे, अधिक स्पष्ट पाठ" के पक्ष में छोटे संकेतों से दूर रहें।