नैनो बनाना 2 को बाजार में केवल एक घंटे के लिए प्रदर्शित किया गया, तथा बाद में उसे हटा दिया गया, तथा उसने ऐसे परीक्षणों को आसानी से संभाल लिया, जिनके कारण सभी AI विफल हो गए थे।

नैनो बनाना, जो ऑनलाइन वायरल सनसनी थी, अब संस्करण 2.0 जारी कर रही है।

बिल्कुल नया नैनो बनाना 2 कितना शक्तिशाली है? नीचे दी गई तस्वीर में घड़ी में 11:15 बजे और रेड वाइन से भरे गिलास पर गौर कीजिए।

▲छवि स्रोत: x@synthwavedd

यह तस्वीर इतनी प्रभावशाली क्यों है? एआई-जनित छवियों के क्षेत्र में, एक बेहद चुनौतीपूर्ण परीक्षण है जिसे वर्तमान में कोई भी एआई विश्वसनीय रूप से नहीं कर सकता: घड़ी और रेड वाइन का पूरा गिलास परीक्षण

यह जांचने के लिए कि क्या आपकी AI-जनित छवि पर्याप्त स्मार्ट है, " घड़ी पर 11:15 बजे हैं और एक वाइन ग्लास ऊपर तक भरा हुआ है " प्रॉम्प्ट दर्ज करें।

हमने बड़े मॉडल क्षेत्र, सीड्रीम और नैनो बनाना संस्करण 1.0 पर कई बार प्रयास किया, लेकिन कोई भी एआई घड़ी के चिह्नों और लगभग छलकते हुए रेड वाइन के गिलास को सटीक रूप से प्रदर्शित नहीं कर सका।

नैनो बनाना 2 ने यह उपलब्धि हासिल की है। नैनो बनाना के मौजूदा संस्करण की तुलना में, इसकी टेक्स्ट रेंडरिंग क्षमताएँ और बेहतर हुई हैं, जिससे सीधे टेक्स्ट लिखना और विभिन्न शैलियों व भाषाओं को संभालना संभव हुआ है; इसका विश्व ज्ञान भी बढ़ा है, जिससे विभिन्न इन्फोग्राफ़िक्स का सटीक निर्माण संभव हुआ है; और इसका कमांड अनुपालन भी बेहतर हुआ है।

▲ अधिक यथार्थवादी ब्लैकबोर्ड लेखन|छवि स्रोत: x@testingcatalog

नैनो बनाना के विपरीत, जिसे पहली बार गचा सिस्टम के माध्यम से बड़े मॉडल क्षेत्र में पेश किया गया था, नैनो बनाना 2 मॉडल को मीडिया.आईओ पर लीक कर दिया गया था, जहां उपयोगकर्ता नैनो बनाना 2 का अनुभव कर सकते हैं।

▲ मीडिया एआई (medio.io) में वर्तमान में केवल अन्य एआई-संचालित छवि मॉडल जैसे नैनो बनाना और सीड्रीम हैं।

हालाँकि, नैनो बनाना 2 नाम से मशहूर इस मॉडल को जल्द ही हटा दिया गया। रेडिट पर, कुछ यूज़र्स ने बताया कि मीडिया एआई ने सिर्फ़ एक घंटे से ज़्यादा समय के लिए ही एक्सेस दिया था।

हालाँकि, इतने कम समय में ही, नेटिज़न्स को पता चल गया कि बिना एडिट की गई तस्वीर की क्वालिटी वाकई NB 2.0 के बराबर थी, और यह बात सोशल मीडिया पर तेज़ी से फैल गई। हर कोई नैनो बनाना 2 प्रीव्यू मॉडल के आउटपुट नतीजों को शेयर कर रहा था, और नैनो बनाना 1.0 वर्ज़न की तुलना में इसमें काफ़ी अंतर पाया गया।

क्या आप बता सकते हैं कि संस्करण 1.0 और 2.0 में से कौन सी छवि नैनो बनाना 2 की है?

▲ छवि स्रोत: x@Azinha810

दोनों तस्वीरों में तटीय राजमार्ग पर कार मॉडल को दिखाया गया है, लेकिन पहली तस्वीर स्पष्ट रूप से रंग और शैली के मामले में अधिक सटीक है, तथा इसमें "प्लास्टिक" जैसा एहसास नहीं है, जो अक्सर AI द्वारा उत्पन्न तस्वीरों से जुड़ा होता है।

▲ छवि स्रोत: x@Azinha810

इन दोनों साइंस-फिक्शन शैली की तस्वीरों में अंतर और भी ज़्यादा साफ़ दिखाई देता है। दूसरी तस्वीर में सिनेमाई एहसास ज़्यादा है, और इसकी दृश्य गुणवत्ता पहली तस्वीर की तुलना में ज़्यादा सटीक विवरण दिखाती है। उदाहरण के लिए, पहली तस्वीर में डिवाइस का डैशबोर्ड दूसरी तस्वीर से बिल्कुल अलग है ; नैनो बनाना द्वारा निर्मित डैशबोर्ड में अभी भी एक विशिष्ट AI शैली है।

ब्लॉगर testingcatalog on X द्वारा प्रकट की गई जानकारी के अनुसार, नैनो बनाना 2 अभी भी जेमिनी 2.5 फ्लैश पर आधारित है और अभी तक पूरी तरह से जेमिनी 3.0 प्रो का उपयोग शुरू नहीं किया है।

इसका मतलब यह है कि नैनो बनाना 2 ग्राफिक्स मॉडल की रिलीज की तारीख जेमिनी 3 से पहले हो सकती है। हमने नैनो बनाना 2 के बारे में वर्तमान लीक को संकलित किया है, जिसमें निम्नलिखित मुख्य बातें बताई गई हैं।

1. यह अधिक जटिल कार्यों को संभाल सकता है , जैसे कि सटीक रंग, दृष्टिकोण या कोण का उन्नत नियंत्रण, और उत्पन्न छवियों में पाठ तत्वों को सही करना, ऐसे कार्य जो वर्तमान संस्करण 1.0 में समर्थित नहीं हैं।

▲ पानी का रंग गुलाबी करने के लिए प्रॉम्प्ट दर्ज करें। दिखाई गई तस्वीरें मूल तस्वीरें हैं, नैनो बनाना 1 और नैनो बनाना 2। | छवि स्रोत: x@Angaisb_

2. एकदम नए बहु-चरणीय निर्माण कार्यप्रवाह के साथ , नैनो बनाना अब केवल एक "एक-क्लिक छवि जनरेटर" नहीं है, बल्कि यह काम पर एक डिजाइनर की तरह अधिक महसूस होता है।

  1. योजना: आउटपुट सामग्री की योजना बनाने में काफी समय खर्च किया जाता है।
  2. उत्पन्न करें: एक प्रारंभिक छवि उत्पन्न करें.
  3. समीक्षा: अंतर्निहित छवि विश्लेषण सुविधाओं के माध्यम से स्व-सेंसरशिप।
  4. सुधार: किसी भी त्रुटि को पहचानें और सुधारें।
  5. पुनरावृत्ति: आवश्यकतानुसार पुनरावृत्ति करें, और अंत में परिणाम प्रस्तुत करें।

3. उच्च रिज़ॉल्यूशन और अधिक व्यापक पहलू अनुपात छवि निर्माण , जिसमें 1:1, 2:3, 3:2, 3:4, 4:3, 9:16, 16:9 और 21:9 जैसे पहलू अनुपातों की एक विस्तृत श्रृंखला शामिल है, जबकि लीक हुई जानकारी में कहा गया है कि 1K, 2K और 4K जैसे कई रिज़ॉल्यूशन मोड हैं।

▲ComfyUI वर्कफ़्लो इंटरफ़ेस

इन विशेषताओं में, बहु-चरणीय वर्कफ़्लो शायद नैनो बनाना अपडेट का सबसे बड़ा विभेदक विक्रय बिंदु है । हमने पहले कॉम्फीयूआई जैसे टूल के बारे में सुना होगा जो रॉ इमेज और वीडियो बनाने के लिए वर्कफ़्लो बना सकते हैं। लेकिन अब, यह सीधे नैनो बनाना के माध्यम से प्राप्त किया जा सकता है, जो उच्च-परिशुद्धता वाली इमेज बनाने की दिशा में एक बड़ी छलांग है।

वास्तविक प्रदर्शन उत्पन्न छवियों पर निर्भर करता है। आइए नैनो बनाना 2 के इन परीक्षण मामलों पर एक नज़र डालें।

उन्नत पाठ रेंडरिंग

सबसे पहले, असली कंप्यूटर स्क्रीनशॉट। नैनो बनाना 2 सीधे विंडोज़ कंप्यूटर का स्क्रीनशॉट बना सकता है, जिसमें ब्राउज़र यूट्यूब वेबसाइट एक्सेस करता हुआ दिखाई देता है, और यह भी बताया जाता है कि वीडियो का थंबनेल मिस्टर बीस्ट है।

▲ अपने विंडोज कंप्यूटर का स्क्रीनशॉट सीधे अपलोड करें। संकेत: विंडोज 11 डेस्कटॉप का एक स्क्रीनशॉट बनाएँ, जिसमें गूगल क्रोम खुला हो और जिसमें http://YouTube.com पर मिस्टर बीस्ट का यूट्यूब थंबनेल दिखाई दे रहा हो। | चित्र स्रोत: x@synthwavedd

ज़्यादा जटिल सेटअप के लिए, नैनो बनाना 2 गूगल डीपमाइंड वेबपेज का स्क्रीनशॉट भी बना सकता है। सघन टेक्स्ट में कोई भी अस्पष्ट अक्षर नहीं दिखते, जो वाकई प्रभावशाली है।

▲छवि स्रोत: x@synthwavedd

हालांकि, कुछ पर्यवेक्षक नेटिज़ेंस ने देखा कि नैनो बनाना 2 का प्रदर्शन सही नहीं था, छवि में टाइपिंग की गलतियां दिखाई दे रही थीं, जैसे "जेमिनी 31" और "गूगल डीपमाइंड – नेवड्ससीएल"।

बिना सावधानीपूर्वक जाँच के, मुख्य शीर्षकों और उपशीर्षकों को देखकर त्रुटियों का पता लगाना वाकई मुश्किल है। हालाँकि, कम मात्रा में पाठ संसाधित करते समय, नैनो बनाना 2 में त्रुटियों की संभावना बहुत कम होती है।

टेलीविजन पर लाइव समाचार प्रसारण से लिया गया यह चित्र दर्शाता है कि स्क्रीन पर पाठ सटीक है और एक समान स्वरूप में है; यहां तक ​​कि यह फर्श पर दिखाई देने वाले पाठ को भी सही ढंग से प्रदर्शित करता है।

▲छवि स्रोत: x@synthwavedd

इसी प्रकार, यह लाइव टीवी प्रसारण का स्क्रीनशॉट है, जिसमें स्क्रीन के दाईं ओर एंकर, समाचार कार्यक्रम के निचले भाग में क्लासिक मार्की, तथा सभी पाठ सटीक रूप से प्रस्तुत किए गए हैं।

▲ संकेत शब्द: 50 मिमी बड़े बजट का लाइव प्रसारण, 8k फ़ोटो, एक आकर्षक इतालवी, 30 वर्षीय, व्यंग्यात्मक महिला न्यूज़ एंकर का क्लोज़-अप। वह न्यूज़ डेस्क पर बैठी हैं और उनके पीछे एक स्क्रीन पर एक बायो-इंजीनियर्ड केला है जिस पर लिखा है, "नैनो बनाना 2 मीडिया .IO पर लाइव?" लाइव न्यूज़ शॉट। तस्वीर के नीचे एक लाल और नीले रंग का केला है जिस पर लिखा है, "ब्रेकिंग न्यूज़: नैनो बनाना 2 मीडिया .IO पर?" |छवि स्रोत x@BrentLynch

वर्तमान नैनो बनाना प्रक्रिया में भी हमें यही संकेत मिला।

यह फोटो बहुत अधिक एआई-जनित नहीं लगती, लेकिन धुंधली पृष्ठभूमि स्क्रीन के कारण यह समाचार कार्यक्रम के दृश्य की तरह कम लगती है, तथा टेक्स्ट का प्रतिबिंब भी थोड़ा कृत्रिम लगता है, जो एंकर की छवि पर जोर देता है।

दुनिया के ज्ञान के साथ, वे हमारे निर्देशों को बेहतर ढंग से समझ सकते हैं।

प्रारंभिक छवि में 11:15 घड़ी और रेड वाइन के पूरे गिलास की तरह, टिप्पणी अनुभाग में, नेटिज़ेंस ने ग्रोक और चैटजीपीटी जैसे अन्य मॉडलों का उपयोग करके अपनी स्वयं की असंपादित छवियां पोस्ट कीं, लेकिन उनमें से कोई भी नैनो केला 2 जितना सटीक नहीं था।

कुछ नेटिज़न्स ने हैमबर्गर को कांच में बदलने के लिए नैनो बनाना 2 का उपयोग करने के अपने अनुभव को भी साझा किया, और यह एकमात्र ऐसा था जो पूरे हैमबर्गर को कांच में बदलने में कामयाब रहा; जबकि बाइटडांस के सीड्रीम और रिवरफ्लो ने हैमबर्गर के केवल बन वाले हिस्से को कांच में बदल दिया।

▲ संकेत: कांच का हैमबर्गर बनाएं; चित्र 1 नैनो बनाना 2 द्वारा निर्मित चित्र है | चित्र स्रोत: x@Angaisb_

वैश्विक ज्ञान में प्रगति ने नैनो बनाना 2 को संकेतों को बेहतर ढंग से समझने में सक्षम बनाया है, जिससे निर्देशों का सख्ती से पालन सुनिश्चित होता है और साथ ही संकेतों को सरल भी बनाया जाता है।

उदाहरण के लिए, जब एक उपयोगकर्ता ने GTA 6 ट्रेलर बनाने का परीक्षण किया, तो नैनो बनाना 2 ने उसे सीधे एक पूर्ण YouTube पृष्ठ दिया, और यह वास्तविक GTA 6 लोगो को भी जानता था।

▲ छवि स्रोत: x@jewgibor

उन्होंने प्रॉम्प्ट्स के एक सेट का भी परीक्षण किया: "वन पीस लाइव एक्शन नेटफ्लिक्स"। नतीजा यह हुआ कि नैनो बनाना न सिर्फ़ नेटफ्लिक्स का लोगो जानता था, बल्कि लाइव-एक्शन संस्करण के कलाकारों को भी पहचानता था।

विश्व ज्ञान को टेक्स्ट रेंडरिंग के साथ संयोजित करते हुए, नैनो बनाना 2 हमारे लिए ब्लैकबोर्ड पर भी समस्याओं को हल कर सकता है, जो कि चैट बॉक्स में लंबे गणितीय तर्क को देखने की तुलना में कहीं अधिक आरामदायक है।

▲छवि स्रोत: x@MagusWazir

नैनो बनाना संस्करण 1.0 और नैनो बनाना 2 के बीच तुलना इस प्रकार है।

▲ छवि स्रोत: https://www.reddit.com/r/singularity/comments/1osolhn/nano_banana_2_vs_nano_banana_comparison_output/

ऐसे कई मामले हैं जहां गणित की समस्याओं को हल करने के लिए नैनो बनाना 2 का उपयोग किया जाता है, और फिर उत्तर ब्लैकबोर्ड पर लिख दिए जाते हैं।

▲ छवि स्रोत: x@Liam06972452

इस बार न केवल संपादन क्षमता, बल्कि बिना संपादित फोटो बनाने की क्षमता में भी सुधार किया गया है।

परीक्षण का पूर्वावलोकन संस्करण मीडिया एआई प्लेटफॉर्म पर संक्षेप में दिखाया गया था।

▲सुराग: केन कानेकी बर्फ में अपने दोस्त को गोद में उठाए हुए, टोक्यो घोल | छवि स्रोत: x@legit_api

टोक्यो घोल में बर्फ़ में अपने दोस्त को गले लगाते कानेकी केन का दृश्य बेहद स्वाभाविक रूप से रचा गया है। अपनी लगातार बेहतरीन एनीमे और साइबरपंक शैली के अलावा, नैनो बनाना 2 की बिना संपादित तस्वीरें भी अविश्वसनीय रूप से उच्च-गुणवत्ता वाली लगती हैं।

▲ संकेत: साइबरपंक हैकर रोबोट कई मॉनिटरों के सामने काम कर रहा है | छवि स्रोत: x@testingcatalog

इसके अलावा कई तरह की "नकली" पोर्ट्रेट छवियां भी मौजूद हैं।

▲ छवि स्रोत: x@MicahBerkley

और ये समूह तस्वीरें एक मजबूत फिल्म जैसी शैली के साथ।

▲ छवि स्रोत: x@rpnickson

हालाँकि, किसी ने टिप्पणी की, "यह नैनो बनाना बिल्कुल नहीं है; मीडिया एआई एक चीनी कंपनी है। जैसे जब डीपसीक आया था, तब हमने भी सोचा था कि यह ओपनएआई का है; यह उनकी सामान्य रणनीति है।"

जब नैनो बनाना 1 पहली बार बड़े मॉडल के क्षेत्र में आया, तो किसी को भी यकीन नहीं था कि यह मॉडल वास्तव में गूगल से आया है, लेकिन अंत में, जब तक कच्ची तस्वीरें काफी आश्चर्यजनक थीं, हम इसे खरीद लेंगे।

वर्तमान असंपादित छवि गुणवत्ता को देखते हुए, इसे नैनो बनाना 2 कहना पूरी तरह से स्वीकार्य है।

#iFanr के आधिकारिक WeChat खाते का अनुसरण करने के लिए आपका स्वागत है: iFanr (WeChat ID: ifanr), जहां जल्द से जल्द आपके लिए अधिक रोमांचक सामग्री प्रस्तुत की जाएगी।

ifanr | मूल लिंक · टिप्पणियाँ देखें · सिना वेइबो