आर्टिफैक्ट टिकटॉक का उपयोग करने के बाद, मैंने तुरंत PS . को अनइंस्टॉल कर दिया

छवियां टेक्स्ट बन जाती हैं, जो अब कोई समस्या नहीं है। विभिन्न OCR फ़ंक्शन आपके लिए चित्रों से टेक्स्ट निकालना आसान बनाते हैं, और AI के लिए किसी चित्र की व्याख्या करना कोई बड़ी समस्या नहीं है।

लेकिन आज के एआई के लिए चित्र बनाना अभी भी मुश्किल है।चित्रों को पहचानना और जानकारी निकालना एआई के लिए जानकारी संसाधित करना है। लेकिन न केवल जानकारी को संसाधित करने के लिए, बल्कि निर्माण को पूरा करने के लिए, ड्राइंग में एक अतिरिक्त परत है। पहला एक बहुविकल्पीय प्रश्न है, जबकि दूसरा एक प्रस्तावात्मक रचना है।

बहुविकल्पीय प्रश्नों का अच्छी तरह से उत्तर देने के बाद, अगला कदम फ्री प्ले के व्यक्तिपरक प्रश्नों का उत्तर देना है। लेकिन किसी ने नहीं सोचा था कि इस सवाल का जवाब सबसे पहले अपने ही ऐप पर देने वाला टिकटॉक था।

Facebook, Jack Ma . उत्पन्न करने के लिए TikTok का उपयोग करें

Google और OpenAI जैसे दिग्गजों की तुलना में, जिन्होंने AI उद्योग में बहुत अधिक निवेश किया है और लंबे समय से AI उद्योग में डूबे हुए हैं, TikTok सिर्फ एक "स्थानांतरण छात्र" हो सकता है। लेकिन यह आश्चर्य की बात क्यों नहीं है कि तबादले के छात्र ने विशाल को दरकिनार कर सबसे पहले समस्या खड़ी की? हालांकि स्थानांतरण के छात्रों ने भी कुछ सरलता की, कम से कम वे अभी भी बहुत प्रभावशाली हैं।

टिकटोक द्वारा बनाए गए टेक्स्ट-टू-पिक्चर फ़ंक्शन को "एआई ग्रीनस्क्रीन" कहा जाता है, जो मूल नीरस सफेद पृष्ठभूमि को बदल देता है, और एआई आपके लिए वीडियो की पृष्ठभूमि तैयार करता है। हो सकता है कि इन वीडियो की पृष्ठभूमि निर्माताओं की ज़रूरतों को पूरा न करे, लेकिन आखिरकार, यह आपके लिए अनुकूलित एक अनूठी हरी स्क्रीन पृष्ठभूमि है। यदि आप भाग्यशाली हैं, तो यह वीडियो सामग्री के विषय के लिए अधिक उपयुक्त हो सकता है।

वीडियो भेजते समय इस फ़ंक्शन का अनुभव करने के लिए विशेष प्रभाव पर क्लिक करें। चित्र सिलिकॉन स्टार्स से आता है

हमने इस नई सुविधा के साथ कुछ परीक्षण किए, यह देखने के लिए कि टिकटॉक द्वारा खींची गई तस्वीर कैसी दिखती है। यादृच्छिक परीक्षण में शब्दों में, कुछ पेंटिंग चौंकाने वाली थीं, जबकि अन्य को "अजीबता का चित्रण करने में बहुत अच्छा" के रूप में दर्जा दिया गया था।

"फेसबुक" दर्ज करके प्रस्तुत की गई पेंटिंग सबसे अच्छी तरह से प्राप्त हुई है। आप फेसबुक के नीले आइकन को अस्पष्ट रूप से पहचान सकते हैं। तस्वीर में एक आंख और एक कान डरावनी भावना पैदा करता है। फेसबुक की ताजा खबरों के साथ मेरा कहना है कि यह पेंटिंग फेसबुक शब्द के भाव को बखूबी कैद करती है।

सेब और चीन जैसे शब्द भी हैं जो छवि में सटीक रूप से दर्शाए गए हैं। पूर्व आसानी से देख सकता है कि यह एक सेब है, और बाद वाला चीनी शैली की इमारतों को भी देख सकता है, और साथ ही, यह उद्यमिता के क्षेत्र में राष्ट्रीय ध्वज और अन्य संवेदनशील पैटर्न से भी बचता है। यह सिर्फ इतना है कि ऐप्पल की तस्वीर पेश करना मुश्किल है यहां तक ​​​​कि ऐप्पल + ऐप्पल सीईओ कुक के कीवर्ड भी सेब और व्यंजन से संबंधित पैटर्न पेश करते हैं।

हालाँकि, कई असंबंधित भी हैं। उदाहरण के लिए, हमने अलीबाबा, टेनसेंट और बाइटडांस की कोशिश की, और उत्पन्न लोगों का इन ब्रांडों से कोई लेना-देना नहीं है। लेकिन किसी भी मामले में, एक नज़र में, कुछ हद तक अमूर्त पहचानना मुश्किल है।

पात्रों के नाम दर्ज करके कई रोचक चित्र भी खींचे जाते हैं। प्रसिद्ध विदेशी हस्तनिर्मित ब्लॉगर ली ज़िकी का नाम एक सुखद लैंडस्केप पेंटिंग है; प्रसिद्ध पूर्व प्रीमियर लीग कोच आर्सेन वेंगर की पेंटिंग भी एक नज़र में पहचानने योग्य है, जो क्लासिक तस्वीरों के पुन: निर्माण की शैली से संबंधित है; जैक मा की शैली भी थोड़ी है अजीब है, और आंखें जो फेसबुक के अनुरूप हैं, उनमें झांकने की भावना है।

मस्क के लिए, हमने टिकटोक के साथ चार चित्र बनाए और उनमें से कोई भी पहचानने योग्य नहीं था।

बेशक, चरित्र शब्दों और अमूर्त चित्रों की सफलता के अलावा, स्विच और गुआंगझोउ भी हैं जिन्हें सही माना जाता है और याद दिलाया जा सकता है।

पात्रों के साथ एक ज़ेल्डा-एस्क पेंटिंग जो प्रशंसकों को पहचान देती है "यह मारियो हो सकता है।" इसी तरह, गुआंगज़ौ की प्रतिष्ठित इमारतों और शानदार रंगों को आसानी से पहचाना जा सकता है।

प्रत्येक पृष्ठभूमि छवि उत्पन्न करने का समय 5 सेकंड से कम है। यदि विषय समान है, तो ये छवियां वीडियो की पृष्ठभूमि छवि के लिए बहुत उपयुक्त हैं। पीढ़ी का समय कम है और हर कोई इसका उपयोग कर सकता है। यह टिकटॉक का लाभ है, इसलिए इस तरह के टेक्स्ट-टू-इमेज उत्पाद को सैकड़ों लाखों दैनिक गतिविधियों के साथ एक एप्लिकेशन पर एक ऐतिहासिक घटना के रूप में माना जा सकता है।

बात बस इतनी है कि टिकटॉक अभी भी शॉर्टकट अपनाता है।

वर्तमान में, उत्पादित लगभग सभी चित्र चित्रकला की शैली से संबंधित हैं, और कई तो अमूर्तवाद और प्रभाववाद से भी संबंधित हैं। यथार्थवादी छवियों को बनाने की तुलना में, यह कठिनाई बहुत कम है। आखिरकार, भले ही आप अपने जैसे न दिखें, आप इसकी भरपाई के लिए अपने दिमाग पर भरोसा कर सकते हैं। आपके द्वारा इनपुट किए गए शब्दों को समझने वाली एआई वही समस्या है जिसका सामना आप तब करते हैं जब आप किसी कला संग्रहालय को देखने जाते हैं एक कला प्रदर्शनी – यदि समानता पर्याप्त नहीं है, तो समझो और श्रृंगार करो।

यह भी एक लागत-बचत विधि है कठिनाई कम है, आवश्यक कंप्यूटिंग शक्ति भी कम है, और लागत कम है।

थोड़ा खूनी पाठ वाली तस्वीरें भी बहुत डरावनी नहीं होंगी

टेक्स्ट-टू-इमेज, यहां तक ​​कि Google के पास भी रीयल-टाइम जेनरेट किया गया कोई उत्पाद नहीं है

प्रभाव के दृष्टिकोण से, टिकटोक के एआई ग्रीन स्क्रीन रेंडरिंग प्रभाव को बहुत अधिक स्कोर नहीं किया जा सकता है। लेकिन एक उच्च सीमा वाली तकनीक के रूप में, इसे एक सुधार माना जा सकता है यदि इसका उपयोग उपयोगकर्ताओं द्वारा कुछ ही सेकंड में बिना किसी सीमा के किया जा सकता है।

हालांकि इस तथ्य से सीमित है कि उत्पन्न चित्र "रोज़" पर्याप्त नहीं हैं, और प्रौद्योगिकी के दुरुपयोग और छवि धोखाधड़ी के बारे में चिंता पैदा करने के लिए पर्याप्त यथार्थवादी नहीं हैं, यथार्थवादी चित्र वास्तव में किए जा सकते हैं, लेकिन वे अभी तक एआई हरी स्क्रीन जैसे सभी के लिए उपलब्ध नहीं हैं। यही बात है।

Google ने एक इमेजेन एआई टूल भी जारी किया है जो एक साधारण वाक्य को वास्तविक छवि में बदल सकता है – एक फोटो शूट के रूप में वास्तविक। लेकिन दुर्भाग्य से, Google भी, जिसने AI में भारी निवेश किया है, ऐसे उत्पाद नहीं बना पाया है जो तुरंत उत्पन्न होते हैं। दूसरे शब्दों में, इमेजेन एआई में अभी तक आपके लिए चित्र खींचने के लिए AI के लिए पूछने का विकल्प उपलब्ध नहीं है।

इमेजन एआई अलग-अलग चित्र बनाने के लिए विभिन्न विकल्पों पर क्लिक कर सकता है

वर्तमान में, आधिकारिक वेबसाइट पर केवल कुछ पूर्व निर्धारित विकल्प हैं। यदि आप प्रत्येक पर क्लिक करते हैं, तो भी केवल दर्जनों संयोजन हैं, लेकिन चुनने के लिए यथार्थवादी शैलियाँ और तेल चित्रकला शैलियाँ हैं। इच्छुक पाठक अभी भी जा सकते हैं और स्वयं थोड़ा सा खेल सकते हैं।

Google वह प्रकार है जो प्रसिद्ध है और हर कदम पर ध्यान आकर्षित करता है। और आर्टिफिशियल इंटेलिजेंस रिसर्च लैब OpenAI कार्यों पर निर्भर है, और उन्होंने सबसे मूल और लोकप्रिय आर्टिफिशियल इंटेलिजेंस टेक्स्ट-टू-इमेज जेनरेटर Dall-E लॉन्च किया है।

दाल-ई

Dall-E वास्तविक रूप से टेक्स्ट की सामग्री से मौजूदा छवियों को फिर से संपादित कर सकता है, यह आपके लिए तत्वों को जोड़ और हटा सकता है, छाया, प्रतिबिंब और बनावट के प्रतिपादन को ध्यान में रखते हुए – PS तकनीक आपको मार सकती है। मौजूदा चित्रों का विश्लेषण और उनकी नकल करना और उन्हें बदलना बहुत आसान है।प्रेरणा शैली मूल कार्य से आती है, अर्थात नायक बदल जाता है।

एक शोध परियोजना के रूप में, डैल-ई अभी भी बंद बीटा में है, और सूची में "सीमित संख्या में विश्वसनीय उपयोगकर्ता" सोशल मीडिया पर फोटो के बाद फोटो पोस्ट कर रहे हैं। परीक्षण में भाग लेने वाले प्रत्येक उपयोगकर्ता को शुरू में 50 मुफ्त अंक मिल सकते हैं, और उसके बाद प्रति माह 15 अंक, 1 अंक एक पाठ सामग्री के साथ 4 चित्र उत्पन्न कर सकता है, और पेंटिंग की तीन शैलियों को भी चुन सकता है।

वर्तमान में, डैल-ई में अभी भी आंतरिक बीटा उपयोगकर्ताओं के लिए बहुत कम मुद्रीकरण विधियां हैं – यदि आप प्रति माह 15 अंक समाप्त होने के बाद सेवा का अनुभव करना चाहते हैं, तो आप $15 के लिए 115 अंक खरीद सकते हैं। अच्छी खबर यह है कि परिणामी छवियों का व्यावसायीकरण भी किया जा सकता है, और एक बार जब आप इसे डॉल-ई के माध्यम से बना लेते हैं, तो आप उन्हें चित्रण, कवर, टी-शर्ट डिज़ाइन, और बहुत कुछ के लिए उपयोग कर सकते हैं।

उपयोगकर्ता निर्धारित स्थिति में तत्वों को जोड़ सकता है, और फोटो में जोड़े गए तत्व भी छाया आदि के संदर्भ में स्वचालित रूप से पूरक हो जाएंगे।

वीडियो निर्देशक करेन एक्स चेंग ने ब्लूमबर्ग को बताया:

मैं घंटों तक छवियों को बनाने के साथ प्रयोग कर रहा हूं, और मैंने अपना रास्ता खो दिया है … ऐसा लगता है कि आप फ़ोटोशॉप जैसे उपकरण के मुकाबले एक जीवित, सांस लेने वाले व्यक्ति के साथ काम कर रहे हैं।

बेशक, डैल-ई वर्तमान में सही नहीं है। पूरी तरह से यथार्थवादी मानव चेहरा बनाना अभी भी इसके लिए थोड़ा मुश्किल है। मानव हड्डियों को सटीक रूप से पेश करने में सक्षम होने के लिए इसे पेशेवर चिकित्सा ज्ञान की आवश्यकता होती है। यह बहुत अच्छा नहीं है। शोधकर्ता आदित्य रमेश ने कहा कि DALL-E केवल टेक्स्ट पढ़ना और फिर इमेज बनाना जानता है, इसलिए यह वास्तव में कुछ समान रूप से समान सामग्री बनाने की कोशिश कर रहा है।

डल-ई द्वारा बनाई गई शानदार तस्वीरें

यह तकनीक निश्चित रूप से बहुत आशाजनक है। आप कल्पना कर सकते हैं कि यह सामग्री निर्माताओं के लिए चित्र खोजने की सीमा को कम करता है, और आप कल्पना कर सकते हैं कि चित्र कलाकार इसकी मदद से दक्षता में सुधार कर सकते हैं। लेकिन जिस तरह हर तकनीक के उद्भव का दुरुपयोग किया जा सकता है, उसी तरह चित्र बनाने में टेक्स्ट की मदद करने के लिए एआई की तकनीक में भी ऐसा जोखिम है-डीपफेक पर दिखाई देने वाले नकारात्मक अनुप्रयोग परिदृश्य एक-एक करके दोहराए जाएंगे।

सौभाग्य से, इस बार, प्रौद्योगिकी प्रदाता ने पहले से ही तैयारी कर ली थी और एआई को पिंजरे में रखना चाहता था।

टिकटोक की अमूर्त इमेजरी अपने आप में सुरक्षा की एक परत है क्योंकि यह यथार्थवादी नहीं है। इसके अलावा, भले ही आप टिकटोक में कुछ विचारोत्तेजक सामग्री (हिंसा, नग्नता) दर्ज करते हैं, प्रस्तुत पेंटिंग अभी भी अपेक्षित नहीं हैं, और अमूर्त शैली स्पष्ट नहीं है और समीक्षा की भारी लागत से बचाती है।

▲ डल-ई की आधिकारिक वेबसाइट पर प्रतिबंध

Dall-E, AI की हिंसक, वयस्क, घृणास्पद सामग्री की पीढ़ी को भी सीमित करता है, एल्गोरिथम में ऐसी अवधारणाओं के लिए Dall-E के जोखिम को कम करता है। साथ ही, मंच में छवियों को उत्पन्न करने के लिए वास्तविक मानव चेहरों के उपयोग को रोकने के लिए उन्नत तकनीक भी है (हस्तियों को राहत मिली है), और स्वचालित और मानव निगरानी प्रणाली भी डेल-ई के दुरुपयोग को रोकती है।

यह सिर्फ इतना है कि सभी नई तकनीकों के उद्भव से केवल बुरे पक्ष को ही नहीं देखा जा सकता है, और उच्च दक्षता की संभावनाएं जो इसे लाती हैं, आगे देखने लायक हैं। कम से कम, ऐ फैनर उस लेख के अंत की प्रतीक्षा कर रहा है जिसे एक दिन आगे बढ़ाया जाएगा। "लेख का शीर्षक मानचित्र डैल-ई द्वारा तैयार किया गया है"।

न ज्यादा दिलचस्प, न ज्यादा आशावादी।

#Aifaner के आधिकारिक WeChat खाते पर ध्यान देने के लिए आपका स्वागत है: Aifaner (WeChat: ifanr), अधिक रोमांचक सामग्री जल्द से जल्द आपके लिए लाई जाएगी।

लव फैनर | मूल लिंक · टिप्पणियां देखें · सिना वीबो