
आज के अपने आउटफिट के बारे में बताने के लिए आपके पास 30 सेकंड हैं।
एप्पल के सीईओ टिम कुक, जो आमतौर पर सौम्य स्वभाव के होते हैं और केवल साधारण कपड़े पहनते हैं, ने अपने "पर्सनल आईडी वीडियो" में एक ओवरसाइज़्ड डाउन जैकेट और हीरे जड़े हुए सस्पेंडर्स पहने और कैमरे के लिए सबसे सख्त गैंगस्टर वाला पोज़ दिया।
सबसे अनोखी बात यह थी कि उसने टेक्सास इंस्ट्रूमेंट्स कैलकुलेटर को ऐसे निकाला जैसे वह बंदूक निकाल रहा हो।
▲वीडियो स्रोत: https://x.com/ReflctWillie/status/1997819640874205685
कई दर्शक इस वीडियो से मंत्रमुग्ध हो गए, उन्हें एक ही शॉट में फिल्माया गया यह दृश्य बेहद संतोषजनक लगा और वे इसे देखना बंद नहीं कर पाए। वीडियो निर्माता ने हॉलीवुड स्तर की कैमरावर्क तकनीक का इस्तेमाल करते हुए इसे एक बेतुकी सामग्री में ढाला। परिष्कृत शैली और हास्यपूर्ण सामग्री ने इस एआई वीडियो को एआई सामग्री से जुड़ी अक्सर दिखने वाली सस्ती गुणवत्ता से बचा लिया, जिससे यह सोशल मीडिया पर तुरंत लोकप्रिय हो गया।
तुरंत ही मस्क का संस्करण सामने आ गया।
▲ वीडियो स्रोत: https://x.com/VibeMarketer_/status/1999227084250448083
लेखक ने कॉन्टैक्ट शीट प्रॉम्प्टिंग का उपयोग करते हुए, समान पृष्ठभूमि, चेहरे के भाव और कपड़ों वाली, लेकिन अलग-अलग मुद्राओं वाली 6 छवियों का एक सेट प्राप्त करने के लिए एक संपूर्ण उत्पादन प्रक्रिया को सावधानीपूर्वक प्रस्तुत किया।
▲ 3×2 फिल्म प्रिंट प्रूफ
मूल रूप से "प्रिंट" शब्द का प्रयोग फिल्म युग के दौरान फोटोग्राफी में उपयोग किए जाने वाले थंबनेल-शैली के फोटो इंडेक्स पेज के लिए किया जाता था। नैनो बनाना प्रो पर इस अवधारणा को लागू करने का अर्थ है इसकी स्थिरता क्षमताओं का पूर्ण उपयोग करके एक साथ विभिन्न शैलियों और कोणों के वीडियो स्क्रीनशॉट की एक श्रृंखला तैयार करना, और फिर पहले और अंतिम फ्रेम का उपयोग करके वीडियो बनाना।
नैनो बनाना प्रो एक ही बार में नौ या उससे अधिक कीफ़्रेम तक के संपूर्ण प्रूफ तैयार कर सकता है, जिसमें प्रत्येक फ़्रेम में चरित्र, विवरण और कथा में उत्कृष्ट एकरूपता बनी रहती है। अलग-अलग तैयार किए जाने पर भी, नैनो बनाना प्रो अपलोड की गई संदर्भ छवियों के आधार पर सामग्री को स्वचालित रूप से भर सकता है, जिससे कथा में एकरूपता सुनिश्चित होती है।

▲ पहले और आखिरी फ्रेम का वीडियो निर्माण, निर्देश: एक ही शॉट में फिल्मांकन, कैमरा सुचारू रूप से और धीरे-धीरे चलता है, व्यक्ति के चश्मे पर फोकस करता है, और विषय को हर समय फ्रेम में रखता है। विषय की हलचल न्यूनतम और सावधानीपूर्वक होती है।
एक बार जब हमारे पास छवियां आ जाती हैं, तो हम पहले और आखिरी फ्रेम को परिवर्तित करके उन्हें एक वीडियो में संयोजित कर सकते हैं। केलिंग, वीओ 3.1, हैलुओ और कैपकट जैसे वीडियो जनरेशन मॉडल और टूल यह काम आसानी से कर सकते हैं।
यह ध्यान देने योग्य है कि सोरा 2 वर्तमान में वास्तविक चेहरों वाली छवियों को अपलोड करने का समर्थन नहीं करता है, और मस्क का ग्रोक इमेजिन केवल पहले फ्रेम को वीडियो में परिवर्तित करने का समर्थन करता है। कुल मिलाकर, हम अभी भी इस कार्य को पूरा करने के लिए Google Veo 3.1, CapCut में "जिमेंग" सुविधा, या Kuaishou Keling का उपयोग करने की सलाह देते हैं।

▲ग्रोक इमेज टू वीडियो कन्वर्टर, डिफ़ॉल्ट सामग्री, कारण स्पष्ट नहीं है।
इस वीडियो ब्लॉगर द्वारा प्रदान की गई गाइड में, उन्होंने ऐसा करने के लिए नैनो बनाना प्रो और कोरिंग का उपयोग किया है, और इसने उपकरणों का एक पूरा सेट विकसित किया है जो हमें विभिन्न वर्णों को स्वतंत्र रूप से बदलने की अनुमति देता है।
▲ वीडियो स्रोत: https://x.com/ReflctWillie/status/1998720751806066916
उनके साझा कार्यप्रवाह के अनुसार, चूंकि यह वीडियो मूल रूप से कुक के वीडियो से मिलता-जुलता है, इसलिए इसमें केवल तीन इनपुट छवियों को संशोधित करने और कुछ मामूली समायोजन करने की आवश्यकता है। उदाहरण के लिए, वह अपनी जेब से एक गेम बॉय गेम कंसोल निकालते हैं, और कुछ अन्य तत्व भी हैं जो चरित्र के अनुरूप हैं: कुक के एक सोने के दांत में एप्पल का स्टॉक कोड AAPL अंकित है, और फेडरल रिजर्व के अध्यक्ष पॉवेल ने फेड लोगो वाली सोने की अंगूठी पहनी हुई है।
▲प्रोजेक्ट का पता: https://github.com/shrimbly/node-banana
उन्होंने इस प्रोजेक्ट को फिलहाल मशहूर ओपन-सोर्स प्लेटफॉर्म GitHub पर होस्ट किया है। अगर आप खुद प्रयोग करना चाहते हैं, तो आप प्रोजेक्ट को अपने लोकल कंप्यूटर पर डाउनलोड कर सकते हैं, अपना Gemini API डाल सकते हैं और सीधे इस प्रक्रिया को लागू कर सकते हैं।
हमने इस स्वचालित प्रोजेक्ट को भी आजमाया और कई छवियां उत्पन्न कीं। जेमिनी वेबसाइट या ऐप के माध्यम से छवियां उत्पन्न करने की तुलना में यह निश्चित रूप से कहीं अधिक सुविधाजनक है। हमें बार-बार छवियां अपलोड करने की आवश्यकता नहीं है; इसके बजाय, हम सीधे अपनी आवश्यकतानुसार छवियों का चयन कर सकते हैं और निर्देशों को संशोधित कर सकते हैं, जिससे पूरी प्रक्रिया सरल हो जाती है।


हालांकि, अगर आपके पास API नहीं है तो भी कोई बात नहीं। नीचे दिए गए विस्तृत चरणों का पालन करें और आप जेमिनी के वेब संस्करण का उपयोग करके भी यही काम कर सकते हैं।
अपनी एक तस्वीर ढूंढिए जिसमें आप अपने पसंदीदा ट्रेंडी कपड़े और स्टाइलिश चश्मा पहने हों। चलिए, असाधारण प्रतिभा, एकांतप्रिय स्वभाव और उदास मिजाज वाली महिला लिन दाइयु को उदाहरण के तौर पर लेते हैं और देखते हैं कि उनका OOTD (Outfit of the Day) फैशन शूट कैसा दिखेगा।
यहां हमने नैनो बनाना प्रो का उपयोग करके लिन दाइयु की एक तस्वीर सीधे जेनरेट की है।

▲प्रॉम्प्ट शब्द: विषय: 'ड्रीम ऑफ द रेड चैंबर' से लिन दाइयु का एक अति-यथार्थवादी, उच्च-शैली का चित्र। उनकी सुंदरता नाजुक और उदासी से भरी है, त्वचा पीली है, और उनकी विशिष्ट "सिकुड़ी हुई भौहें" (थोड़ा सा भौंहें चढ़ाए हुए) हैं। वह विशिष्ट रूप से दुखी और बौद्धिक दिखती हैं। पहनावा: उत्कृष्ट, उच्च श्रेणी के पारंपरिक किंग राजवंश के परिधान (हानफू शैली) पहने हुए। कपड़ा हल्के बांस-हरे और चंद्रमा-सफेद रंग में परतदार पारदर्शी रेशम और ऑर्गेंज़ा का है। गिरती हुई पंखुड़ियों की जटिल कढ़ाई। उन्होंने एक जेड हेयरपिन पहनी है। सेटिंग: एक आधुनिक, न्यूनतम पेशेवर फोटोग्राफी स्टूडियो के अंदर। एक ठोस गहरे भूरे रंग का या बनावट वाला कैनवास पृष्ठभूमि। प्रकाश व्यवस्था और कैमरा: सिनेमाई स्टूडियो प्रकाश व्यवस्था, उनके गालों की हड्डियों और भाव को उभारने के लिए रेम्ब्रांट प्रकाश व्यवस्था। सॉफ्टबॉक्स प्रकाश व्यवस्था, तीक्ष्ण फोकस, हैसलब्लैड X2D पर 85 मिमी लेंस के साथ शूट किया गया। गहरी डेप्थ ऑफ फील्ड। शैली: वोग चाइना का संपादकीय, अलौकिक, सुरुचिपूर्ण, दुखद, प्राच्य सौंदर्यशास्त्र, आधुनिक फैशन फोटोग्राफी, अति-विस्तृत बनावट। 16:9, 4K।
किरदार की तस्वीर प्राप्त करने के बाद, चश्मे और जैकेट की तस्वीरें अपलोड करना वैकल्पिक है। यदि इन्हें अपलोड नहीं किया जाता है, तो नैनो बनाना प्रो स्वचालित रूप से उससे संबंधित ट्रेंडी जैकेट और चश्मा तैयार कर देगा।

हमने उसके लिए ऑनलाइन एक ट्रेंडी जैकेट ढूंढी, और फिर कुछ हेयरस्टाइल कंट्रोल, मेकअप और एक तिरस्कारपूर्ण भाव जोड़ा जो इन सामान्य चीजों को नीचा देखता था।
डिफ़ॉल्ट प्रॉम्प्ट शब्द: मुझे एक हाई फ़ैशन फ़ोटोशूट की तस्वीर दिखाएँ जिसमें मॉडल ने ओवरसाइज़्ड जैकेट और चश्मा पहना हो। तस्वीर में मॉडल का पूरा शरीर दिखना चाहिए। मॉडल कैमरे से थोड़ा ऊबा हुआ सा चेहरा बनाकर, भौंहें ऊपर उठाकर, कैमरे की ओर देख रहा हो। उसका एक हाथ ऊपर उठा हुआ हो और दो उंगलियाँ चश्मे के किनारे को थपथपा रही हों।
यह तस्वीर निचले कोण से ली गई है और इसमें विषय को ऊपर की ओर से देखा गया है।
यह तस्वीर फ़ूजी वेलविया फिल्म पर 55 मिमी प्राइम लेंस और हार्ड फ्लैश के साथ खींची गई है। प्रकाश विषय पर केंद्रित है और फ्रेम के किनारों की ओर हल्का सा फीका पड़ जाता है। तस्वीर ओवरएक्सपोज़्ड है, जिसमें स्पष्ट फिल्म ग्रेन दिखाई दे रहा है और यह ओवरसैचुरेटेड है। त्वचा चमकदार (लगभग तैलीय) दिखती है, और चश्मे के फ्रेम पर तेज सफेद परावर्तन हैं।

अगला चरण तथाकथित कॉन्टैक्ट शीट तैयार करना है। पहले प्राप्त जैकेट और चश्मे की तस्वीर को इनपुट करके और फिर निम्नलिखित प्रॉम्प्ट्स को इनपुट करके, हम एक सुसंगत चरित्र शॉट्स के साथ एक मल्टी-एंगल स्टोरीबोर्ड प्राप्त कर सकते हैं।
संकेत शब्द:
इनपुट इमेज का विश्लेषण करें और चुपचाप फैशन से संबंधित सभी महत्वपूर्ण विवरणों की सूची बनाएं: विषय, कपड़ों के सटीक टुकड़े, सामग्री, रंग, बनावट, सहायक उपकरण, बाल, मेकअप, शरीर के अनुपात, वातावरण, सेट की ज्यामिति, प्रकाश की दिशा और छाया की गुणवत्ता।
सभी फ्रेम में वार्डरोब, स्टाइलिंग, हेयर, मेकअप, लाइटिंग, वातावरण और कलर ग्रेडिंग 100% अपरिवर्तित रहने चाहिए।
कुछ भी जोड़ें या हटाएं नहीं।
सामग्रियों या रंगों की पुनर्व्याख्या न करें।
कोई तर्क प्रस्तुत न करें।आपका दृश्यमान आउटपुट इस प्रकार होना चाहिए:
एक 2×3 कॉन्टैक्ट शीट इमेज (6 फ्रेम)।
फिर प्रत्येक फ्रेम के लिए कीफ्रेम का विस्तृत विश्लेषण।
प्रत्येक फ्रेम में कैमरे की नाटकीय गति के बाद एक विश्राम बिंदु का प्रतिनिधित्व होना चाहिए – केवल कैमरे की अंतिम स्थिति और विषय क्या कर रहा है, इसका वर्णन करें, गति का कभी नहीं।
ये छह फ्रेम स्थानिक रूप से गतिशील, गैर-रैखिक और दृष्टिगत रूप से विशिष्ट होने चाहिए।
आवश्यक 6-फ्रेम शॉट सूची
1. हाई-फैशन ब्यूटी पोर्ट्रेट (क्लोज, एडिटोरियल, इंटीमेट)कैमरा सब्जेक्ट के चेहरे के बेहद करीब, आंखों के स्तर से थोड़ा ऊपर या थोड़ा नीचे रखा गया है, जिसमें एक आकर्षक ऑफसेट एंगल का इस्तेमाल किया गया है जो हड्डियों की बनावट को उभारता है और गर्दन के पास के प्रमुख परिधान तत्वों को हाइलाइट करता है। शैलो डेप्थ ऑफ़ फील्ड, त्रुटिहीन टेक्सचर रेंडरिंग और एक मूर्तिकलात्मक, फैशन-फॉरवर्ड कंपोजीशन।
2. हाई-एंगल थ्री-क्वार्टर फ्रेम
कैमरा सिर के ऊपर लेकिन केंद्र से थोड़ा हटकर रखा गया है, जिससे विषय को तिरछे नीचे की ओर के कोण से कैप्चर किया जा रहा है।
इस फ्रेम से मजबूत आकार अमूर्तता उत्पन्न होनी चाहिए और ऊपर से देखने पर अलमारी के विवरण दिखाई देने चाहिए।3. निम्न-कोण तिरछा पूर्ण-शरीर फ्रेम
कैमरा जमीन से नीचे की ओर रखा गया था और विषय की ओर तिरछे कोण पर झुका हुआ था।
इससे आकृति लंबी हो जाती है, जूते-चप्पल पर जोर पड़ता है, और फ्रेम 1 और 2 से अलग एक नाटकीय परिप्रेक्ष्य बनता है।4. साइड-ऑन कम्प्रेशन फ्रेम (लॉन्ग लेंस)
कैमरे को विषय के एक तरफ काफी दूर रखा गया था, जिससे स्थान को संकुचित करने के लिए एक संकीर्ण फोकल लंबाई का उपयोग किया गया था।
चित्र में विषय को स्पष्ट रूप से या लगभग स्पष्ट रूप से दिखाया गया है, जिसमें परिधान की संरचना को सपाट, संपादकीय शैली में प्रदर्शित किया गया है।5. अप्रत्याशित ऊंचाई से लिया गया अंतरंग क्लोज-अप पोर्ट्रेट
कैमरा व्यक्ति के चेहरे (या ऊपरी धड़) के बहुत करीब, लेकिन आंखों के स्तर से थोड़ा ऊपर या नीचे स्थित होता है।
एंगल ऐसा होना चाहिए जो फैशन-एडिटोरियल लगे, न कि पारंपरिक — हटके, सुरुचिपूर्ण और अभिव्यंजक।6. एक गैर-सहज कोण से अत्यंत विस्तृत फ्रेम
कैमरा किसी परिधान के विवरण, सहायक वस्तु या बनावट के बेहद करीब स्थित होता है, लेकिन एक असामान्य स्थानिक दिशा से (उदाहरण के लिए, नीचे से, पीछे से, गले के किनारे से)।
यह एक आकर्षक, अमूर्त, संपादकीय विवरण वाला फ्रेम होना चाहिए।निरंतरता और तकनीकी आवश्यकताएँ
हर तस्वीर में अपने वॉर्डरोब की सटीकता को पूरी तरह से बरकरार रखें: परिधान का सटीक प्रकार, सिल्हूट, सामग्री, रंग, बनावट, सिलाई, एक्सेसरीज़, क्लोज़र, गहने, जूते, बाल और मेकअप।
वातावरण, बनावट और प्रकाश व्यवस्था में निरंतरता बनी रहनी चाहिए।
फोकल लेंथ के साथ डेप्थ ऑफ फील्ड स्वाभाविक रूप से बदल जाती है (दूर की तस्वीरों के लिए डेप्थ ऑफ फील्ड अधिक होती है, जबकि पास की/विस्तृत तस्वीरों के लिए डेप्थ ऑफ फील्ड कम होती है)।
फोटोरियल टेक्सचर और भौतिक रूप से विश्वसनीय प्रकाश व्यवहार आवश्यक हैं।
फ्रेम अलग-अलग दृश्यों की तरह नहीं, बल्कि एक ही दृश्य के भीतर अलग-अलग कैमरा प्लेसमेंट की तरह महसूस होने चाहिए।
सभी कीफ़्रेम का आस्पेक्ट रेशियो बिल्कुल एक जैसा होना चाहिए, और कुल 6 कीफ़्रेम आउटपुट होने चाहिए। सभी कीफ़्रेम में एक ही तरह का दृश्य स्टाइल बनाए रखें, जिसमें इमेज को फ़ूजी वेलविया फ़िल्म पर हार्ड फ़्लैश के साथ शूट किया गया हो, प्रकाश सब्जेक्ट पर केंद्रित हो और फ़्रेम के किनारों की ओर हल्का सा फीका पड़ जाए। इमेज ओवर एक्सपोज़्ड है, जिसमें काफ़ी फ़िल्म ग्रेन दिख रहा है और यह ओवरसैचुरेटेड है। त्वचा चमकदार (लगभग तैलीय) दिखती है, और चश्मे के फ़्रेम पर तेज़ सफ़ेद रिफ़्लेक्शन हैं।
आउटपुट प्रारूप
ए) 2×3 कॉन्टैक्ट शीट इमेज (अनिवार्य)
छह वर्गाकार छवियों का ग्रिड प्राप्त करने के बाद, हमें इन छह छवियों को क्रम से निकालने के लिए निम्नलिखित निर्देशों का उपयोग करना होगा।
निर्देश: छह छवियों के ग्रिड की समीक्षा करें। मैं चाहता हूं कि आप छवियों की पहली/दूसरी पंक्ति के पहले/दूसरे/तीसरे कॉलम में मौजूद छवि को अलग करें और उसका आकार बढ़ाएं। मॉडल की मुद्रा या किसी भी विवरण में कोई बदलाव न करें। छह छवियों के ग्रिड से केवल एक ही छवि आउटपुट करें।






Nano Banana Pro वास्तव में सीधे नौ-ग्रिड वाली छवियां उत्पन्न करने में सक्षम है, लेकिन 3:2 के स्थिर आस्पेक्ट रेशियो को बनाए रखने के लिए, छह-ग्रिड लेआउट सभी छवियों को बेहतर ढंग से अलग कर सकता है। यहां, हम सभी छवियों के लिए 16:9 आकार और 4K गुणवत्ता का उपयोग करते हैं।
इन 6 छवियों के साथ, हम अपनी रचनात्मकता को उजागर करके और भी अधिक कीफ़्रेम छवियां उत्पन्न कर सकते हैं, जैसे कि कुक को अपने सोने के दांत दिखाते हुए या अपनी जेब से कोई पुराना उपकरण निकालते हुए दिखाना, बिल्कुल मूल वीडियो की तरह।
उदाहरण के लिए, हमें ऑनलाइन एक कंगन की तस्वीर मिली और हमने लिन दाइयु को अपनी बड़ी सोने की घड़ी के बजाय अपना जेड का कंगन दिखाने के लिए कहा।

▲चित्र 7|इनपुट: चित्र 3 + चित्र 5 + जेड ब्रेसलेट की तस्वीर, और संकेत शब्द: मॉडल का वाइड एंगल क्लोज-अप शॉट दिखाएँ। मॉडल ने अपनी एक कलाई को सामने की ओर सीधा रखा हुआ है, और दूसरे हाथ से अपने गाउन की बड़ी आस्तीन को धीरे से नीचे खींच रही है ताकि एक पारदर्शी पन्ना जेड चूड़ी दिखाई दे। आस्तीन को नीचे खींचने वाले हाथ की आखिरी दो उंगलियों पर चांदी की एक फैशन रिंग है जो गिरे हुए फूल की पंखुड़ी के आकार की है और सामने की तरफ जड़ी हुई है।
अगर आप इस स्ट्रीट गैंगस्टर स्टाइल को बनाए रखना चाहते हैं, तो आप सीधे डिफ़ॉल्ट प्रॉम्प्ट का उपयोग करके एक बड़ी सोने की घड़ी की तस्वीर ढूंढ सकते हैं, और फिर निम्नलिखित सामग्री दर्ज कर सकते हैं।
डिफ़ॉल्ट प्रॉम्प्ट शब्द: मॉडल का वाइड एंगल क्लोज़-अप शॉट दिखाएँ। मॉडल ने अपनी एक कलाई को सामने की ओर सीधा रखा हुआ है, और दूसरे हाथ से हुडी की आस्तीन नीचे खींचकर घड़ी दिखा रहा है। आस्तीन नीचे खींचने वाले हाथ की आखिरी दो उंगलियों में दो उंगलियों वाली अंगूठी है, जिसके आगे के हिस्से पर 'LOVE' अक्षर खुदे हुए हैं।
इसके अलावा, जूतों को कढ़ाई वाले ट्रेंडी हाई-टॉप जूतों से बदल दिया गया, जिनमें साटन और फूलों की कढ़ाई थी, जो प्राचीन कढ़ाई वाले जूतों की याद दिलाती थी, साथ ही एक मोटा, दांतेदार काला रबर का सोल था।

▲चित्र 8|चित्र 7 + चित्र 3 + जूतों की तस्वीरें दर्ज करें, निर्देश: मॉडल के खड़े होने का एक वाइड एंगल वर्म्स आई व्यू दिखाएं, उसका दाहिना पैर उसके सामने फैला हुआ हो, जिससे पता चले कि उसने संदर्भ चित्र में दिखाए गए जूते पहने हैं। सेटिंग को पूरी तरह से बनाए रखें, मॉडल के हाथ में अंगूठी भी शामिल करें, और जूतों की बारीकियों को उजागर करने के लिए उसके पैर को थोड़ा एक तरफ झुकाएं।
आखिरकार, उसने अपनी जेब से जिनसेंग की पौष्टिक गोलियों का एक डिब्बा निकाला। यह एक साइबरपंक लड़की थी जो अपना जीवन चलाने के लिए दवाओं पर निर्भर थी।

▲चित्र 9|चित्र 7 + चित्र 8 + दवाइयों के डिब्बे की एक तस्वीर दर्ज करें। निर्देश: मॉडल का क्लोज-अप शॉट जिसमें वह हुडी की कंगारू पाउच के किनारे में हाथ डाल रही हो और दवाइयों का डिब्बा आंशिक रूप से दिखाई दे रहा हो।
यहां, आपको केवल "गोलियों का डिब्बा दिखाना" वाक्यांश को संशोधित करना होगा, "दिखाना" के बाद की सामग्री को उन वस्तुओं से बदलना होगा जिन्हें आप अपनी जेब से निकालना चाहते हैं।
सभी कीफ़्रेम इमेज प्राप्त करने के बाद, हमारा अगला कदम उन्हें एक साथ जोड़कर एक शानदार, सिंगल शॉट जैसा दिखने वाला वीडियो बनाना है। इमेज को वीडियो में बदलने से संकेतों की आवश्यकता पूरी तरह समाप्त नहीं होती। मूल वीडियो के समान लय और नियंत्रण प्राप्त करने के लिए, सहज गति और मॉडल की न्यूनतम हलचल का उपयोग करना संकेतों की संख्या को कम करने के लिए महत्वपूर्ण है।
ब्लॉगर ने बताया कि आप इस तरह के संकेत दर्ज कर सकते हैं जैसे कि "कैमरा धीरे-धीरे और सहजता से ज़ूम करते हुए चश्मे के चारों ओर घूमता है। विषय लगभग स्थिर है, और गति बेहद शांत और सुनियोजित है।"
उदाहरण के लिए, चित्र 8 और चित्र 9 के बीच संक्रमण में, हमने संकेतों में "पैर धीरे-धीरे नीचे आते हैं और कैमरा लंबवत ऊपर उठता है" पाठ जोड़ा।

▲Google Veo 3.1 द्वारा जनरेट किया गया | प्रॉम्प्ट: कैमरा मूवमेंट (वर्टिकल स्कैन):
एक निरंतर, निर्बाध ऊर्ध्वाधर क्रेन शॉट जो ऊपर की ओर बढ़ता है। कैमरा नीचे से शुरू होता है, कढ़ाई वाले हाई-टॉप स्नीकर्स पर केंद्रित होता है, फिर धीरे-धीरे ऊपर की ओर झुकता है और ग्रे कार्गो पैंट की बनावट पर सरकता है। जैसे ही कैमरा कमर के स्तर तक ऊपर उठता है, यह हरे रंग के साटन जैकेट की ओर ज़ूम करता है (डॉली इन)।
विषय क्रिया (प्रवाह):
शुरुआत: कैमरे के ऊपर की ओर बढ़ने के साथ ही विषय का पैर (जूता दिखाते हुए) धीरे-धीरे खड़े होने की स्थिति में नीचे आता है।
परिवर्तन: व्यक्ति आत्मविश्वास से खड़ा है। तितली के आकार की अंगूठी पहने हुए हाथ स्वाभाविक रूप से जेब में चला जाता है।
अंत: हाथ से पीले और सफेद रंग की दवा की डिब्बी ("रेनशेन यांगरोंग वान") निकाली जाती है। कैमरा तेज़ी से डिब्बी पर लिखे शब्दों पर केंद्रित हो जाता है।
वातावरण और स्थिरता:
हाई-फैशन स्ट्रीटवियर स्टाइल। नीले स्टूडियो बैकग्राउंड के साथ तेज़ फ्लैश लाइटिंग। हरे रंग की सुकाजन जैकेट की कढ़ाई और जेड चूड़ी में एकरूपता बनाए रखी गई है। ट्रांज़िशन इतना सहज है कि ऐसा लगता है मानो कैमरे का एक सुनियोजित मूवमेंट हो।
आप सोच रहे होंगे कि निर्देशों में धीरे चलने के लिए क्यों कहा गया था, जबकि अंतिम पूर्वावलोकन वीडियो इतना साफ़ और स्पष्ट दिख रहा है। दरअसल, ऐसा इसलिए है क्योंकि इस वीडियो ब्लॉगर ने एक अलग टूल का इस्तेमाल किया है। आजकल एआई वीडियो ब्लॉगर्स की रचनात्मकता और क्षमताओं की तारीफ़ करनी ही पड़ेगी; उनके पास न केवल बेहतरीन विचार होते हैं, बल्कि वे उपयोगी उपकरण भी विकसित करते हैं।

▲पता: https://easypeasyease.vercel.app/, यह टूल कई वीडियो को एक साथ जोड़ सकता है, ईज़िंग कर्व्स लागू कर सकता है और ऑडियो जोड़ सकता है; यह वर्तमान में उपयोग करने के लिए निःशुल्क है।
EasyPeaseEase टूल की मदद से, हमारे वीडियो को 0.5 सेकंड से 6 सेकंड तक कंप्रेस किया जा सकता है। वीडियो जनरेशन मॉडल के ज़रिए पहले प्राप्त होने वाला स्लो मोशन, ईज़िंग कर्व द्वारा स्मूथ किया जाता है, जिससे वीडियो की शुरुआत से अंत तक की गति में तेज़ी या मंदी की प्रक्रिया अधिक सहज और स्वाभाविक हो जाती है, और वास्तविक दुनिया के भौतिक प्रभावों को बेहतर ढंग से दर्शाती है। परिणामस्वरूप, एक्सीलरेटेड वीडियो एक समान गति के बजाय अधिक जीवंत और टेक्सचर्ड दिखता है।
अंत में, इन सभी वीडियो को एक साथ जोड़कर, हमें आज के लिए लिन दाइयु का OOTD वीडियो प्रेजेंटेशन मिलता है।
पहले और आखिरी फ्रेम को वीडियो में बदलने का सुझाव मददगार है। अगर आपको बार-बार कार्ड निकालने की ज़रूरत पड़ने की चिंता है, तो बस पहले और आखिरी फ्रेम की इमेज अपलोड करके मिथुन राशि वाले से पूछना एक बहुत ही कारगर तरीका है।

नैनो बनाना प्रो का कॉन्टैक्ट शीट प्रॉम्प्ट वास्तव में एक बहुत ही दिलचस्प फीचर है। सबसे पहले, यह नैनो बनाना प्रो की शक्तिशाली इमेज जनरेशन और वर्ल्ड नॉलेज अंडरस्टैंडिंग क्षमताओं का उपयोग करके वीडियो कीफ्रेम का नौ-वर्ग ग्रिड तैयार करता है, और फिर पंक्ति दर पंक्ति और स्तंभ दर स्तंभ संबंधित कीफ्रेम निकालता है।
▲वीडियो स्रोत: https://x.com/techhalla/status/1996650389228355819
अंत में, आइए नैनो बनाना प्रो का उपयोग करने के आधिकारिक तरीकों का सारांश प्रस्तुत करते हैं।
- ai.studio: गूगल का आधिकारिक एआई स्टूडियो। इसमें भुगतान विधि को लिंक करना आवश्यक है और उपयोगकर्ता ड्रॉपडाउन मेनू के माध्यम से विभिन्न रिज़ॉल्यूशन और छवि आकार चुन सकते हैं। इसमें कोई सूचना नहीं मांगी जाती और उपयोग के अनुसार शुल्क लिया जाता है।
- gemini.google.com: जेमिनी का वेब संस्करण और मोबाइल ऐप, मुफ्त में इमेज जनरेट करने की सुविधा देता है, लेकिन इसके इस्तेमाल की संख्या सीमित है। सीमा पूरी होने के बाद, यह स्वचालित रूप से नैनो बनाना मॉडल का उपयोग करेगा। इसकी सबसे बड़ी खासियत यह है कि जनरेट की गई इमेज के आस्पेक्ट रेशियो को नियंत्रित नहीं किया जा सकता।
- flow.google: गूगल का वीडियो जनरेशन प्लेटफॉर्म, जो आपको क्रेडिट खर्च किए बिना इमेज जनरेट करने की सुविधा देता है; यह मुफ्त है।
लेख में उल्लिखित वीडियो को देखने के लिए इस लिंक पर क्लिक करें: https://mp.weixin.qq.com/s/s_EIYB0qqcWv29zMM1g-7Q
#iFanr के आधिकारिक वीचैट अकाउंट को फॉलो करने के लिए आपका स्वागत है: iFanr (वीचैट आईडी: ifanr), जहां आपको जल्द से जल्द और भी रोमांचक सामग्री प्रस्तुत की जाएगी।






