एक हजार युआन की रिकॉर्डिंग कार्ड के लिए वे हर साल एक हजार युआन अतिरिक्त शुल्क लेने की हिम्मत क्यों करेंगे?

संपादक का नोट:
जब कृत्रिम बुद्धिमत्ता अपने स्वयं के स्वरूप की खोज शुरू करती है, तो उसके कुछ विकल्प अप्रत्याशित होते हैं।
कृत्रिम बुद्धिमत्ता (AI) ने स्मार्टफ़ोन पर एक समर्पित बटन को जन्म दिया है, जिससे ऐसा लगता है कि स्मार्टफ़ोन की खोई हुई विकासवादी गति फिर से जागृत हो गई है। चश्मे, जिनमें देखने और सुनने की प्राकृतिक क्षमता होती है, अगली पीढ़ी के व्यक्तिगत उपकरणों की तरह दिखने लगे हैं। कुछ छोटे, विशिष्ट उपकरण कुछ मामलों में ऑल-इन-वन उपकरणों से अधिक विश्वसनीय प्रतीत होते हैं। वहीं, स्मार्टफ़ोन को डिस्पोजेबल उपकरणों से बदलने के क्रांतिकारी प्रयासों को ठंडी प्रतिक्रिया मिली है।
प्रौद्योगिकी का कार्यान्वयन केवल कार्यों को एक के ऊपर एक रखने के बारे में नहीं है; यह लोगों की आदतों, परिदृश्यों की उपयुक्तता और "उपयोग में आसान" की पुनर्परिभाषा के बारे में भी है।
iFanr ने "AI गैजेट्स क्रॉनिकल" नामक एक कॉलम लॉन्च किया है, जिसका उद्देश्य आपके साथ यह पता लगाना है कि AI किस प्रकार हार्डवेयर डिज़ाइन को बदल रहा है, मानव-कंप्यूटर इंटरैक्शन को नया आकार दे रहा है, और इससे भी महत्वपूर्ण बात यह है कि AI हमारे दैनिक जीवन में कैसे प्रवेश करेगा।
यह एआई ऑब्जेक्ट्स क्रॉनिकल श्रृंखला का 9वां लेख है।

हाल के वर्षों में, "एआई हार्डवेयर" बहुत लोकप्रिय हो गया है, लेकिन ऐसा लगता है कि यह अनिवार्य रूप से "एक बार की बिक्री" की कहानी में समाहित हो रहा है।

प्रेस कॉन्फ्रेंस में एक भव्य अवधारणा प्रस्तुत की गई, जिसमें विचारों और कल्पना का उपयोग करके पहले चरण का प्रभाव दिखाया गया। हालांकि, जब इसे वास्तव में उपयोगकर्ताओं तक पहुंचाया गया, तो पता चला कि इसकी क्षमताएं उस कहानी से मेल नहीं खातीं जो यह प्रचारित कर रही थी।

परिणामस्वरूप, उत्पाद के उपयोग की आवृत्ति में भारी गिरावट आई, और कोई भी इसकी बिक्री उपरांत सेवा के लिए भुगतान जारी रखने को तैयार नहीं था। अंततः, दैनिक सक्रिय उपयोगकर्ताओं की संख्या घटकर कुछ सौ रह गई, जिससे इसका दुखद अंत हुआ।

लेकिन प्लाउड ने इस दुष्चक्र को तोड़ दिया – इसने न केवल मेरे वॉयस रिकॉर्डर से पैसा कमाया, बल्कि मुझसे हर साल 1,000 डॉलर कमाना जारी रखने की योजना भी बनाई, जो अंततः प्रति वर्ष 250 मिलियन डॉलर तक पहुंच जाएगा।

इससे भी महत्वपूर्ण बात यह है कि मैं इसे देने के लिए वास्तव में तैयार हूं, खासकर इसलिए क्योंकि एआई हार्डवेयर की अवधारणा पर अभी भी बहुत सवाल उठाए जाते हैं, इसने सीधे तौर पर एक संपूर्ण व्यावसायिक मॉडल स्थापित किया है।

हार्डवेयर प्रवेश द्वार है, ऐप इसका मूल आधार है।

प्लाउड के निःशुल्क "स्टार्टर" प्लान में 300 मिनट का ट्रांसक्रिप्शन समय शामिल है।

हालांकि, जिस उपयोगकर्ता को पेशेवर रिकॉर्डिंग कौशल की आवश्यकता है और इसलिए उसे वॉयस रिकॉर्डर खरीदने की जरूरत है, उसके लिए 300 मिनट केवल एक परीक्षण पैकेज है।

मूल्य सीमा में आगे बढ़ते हुए, प्रोफेशनल वर्जन की कीमत 339 युआन प्रति वर्ष है और यह प्रति माह 1200 मिनट का ट्रांसक्रिप्शन समय प्रदान करता है, जबकि "प्रीमियम" सदस्यता की कीमत 1099 युआन प्रति वर्ष है और यह असीमित समय प्रदान करती है।

अब बात दिलचस्प मोड़ लेती है। प्लाउड नोट वॉयस रिकॉर्डर की कीमत मात्र 1049 युआन के आसपास है।

दूसरे शब्दों में कहें तो, वार्षिक सदस्यता की लागत हार्डवेयर की कीमत से भी अधिक हो सकती है।

तो प्लाउड में ऐसा क्या जादू है जो लोगों को वॉयस रिकॉर्डर खरीदने के लिए 1,000 युआन खर्च करने और फिर हर साल इसका उपयोग करने के लिए 1,000 युआन खर्च करते रहने के लिए प्रेरित करता है?

दरअसल, प्लाउड के मूल अनुभव का आधार स्वयं वॉयस रिकॉर्डर हार्डवेयर नहीं है, बल्कि इसके साथ आने वाला ऐप है।

यह ऐप काफी सरल है; इसके सभी कार्य "रिकॉर्डिंग" को संसाधित करने के इर्द-गिर्द घूमते हैं, जिससे यह परिष्कृत और पेशेवर प्रतीत होता है।

इसका मुख्य कार्य "नोट्स" तैयार करना है: प्लाउड रिकॉर्ड की गई सामग्री को संसाधित करने के लिए एक बड़े मॉडल का उपयोग करता है। आप एक क्लिक में सब कुछ प्लाउड पर छोड़ सकते हैं, या आप भाषा, एआई मॉडल और प्रतिलेखन के लिए टेम्पलेट का चयन कर सकते हैं।

लेकिन "परिणामों" के मामले में प्लाउड को जो चीज वास्तव में अलग बनाती है, वह इसकी टेम्पलेट सुविधा है, जो मेरे विचार से वह सुविधा है जो इसे पैसे के लिए सबसे अधिक मूल्यवान बनाती है।

आधिकारिक वेबसाइट पर सबसे पहले बड़ी संख्या में तैयार टेम्पलेट्स उपलब्ध हैं, जो बैठकों, भाषणों, कॉल, साक्षात्कार, चिकित्सा, वित्तीय और कानूनी मामलों जैसे विभिन्न परिदृश्यों और व्यवसायों को कवर करते हैं। कुछ "कार्यात्मक" टेम्पलेट्स भी हैं जो रिकॉर्डिंग में वक्ता के इरादों और शक्ति संतुलन का विश्लेषण करते हैं, और यहां तक ​​कि वक्ता की मनोवैज्ञानिक गतिशीलता और ईमानदारी का भी विश्लेषण कर सकते हैं।

संक्षेप में, प्लाउड के टेम्पलेट्स निश्चित संकेतों की लंबी श्रृंखलाएं हैं। वे रिकॉर्डिंग को व्यवस्थित और लक्षित करने के लिए बड़े मॉडलों का उपयोग करते हैं। प्लाउड जो बेच रहा है, वह पहले से लिखे गए संकेतों के सेट हैं।

क्योंकि यह एक प्रॉम्प्ट है, इसलिए यह स्वाभाविक रूप से उपयोगकर्ताओं को अपने स्वयं के टेम्पलेट बनाने की अनुमति देता है – यह किसी ऐसे व्यक्ति द्वारा बनाए गए उत्पाद के समान है जो वास्तव में अपने काम को समझता है, क्योंकि अक्सर, सामान्य टेम्पलेट व्यक्तिगत आवश्यकताओं के अनुरूप नहीं होते हैं; जो वास्तव में मूल्यवान है वह जानकारी को संसाधित करने के लिए आपका अपना तर्क है।

उदाहरण के लिए, हम हर सुबह विषय चयन बैठक करते हैं, जिसमें विषयवस्तु, विषय का मूल तत्व, महत्वपूर्ण जानकारी और जिम्मेदार संपादकों जैसे प्रमुख बिंदुओं पर चर्चा होती है। सामान्य प्रतिलेखन इन बिंदुओं को दर्ज तो कर सकता है, लेकिन इन्हें सीधे क्रियान्वयन योग्य रूप में परिवर्तित करना कठिन है।

बाद में, मैंने प्लाउड के लिए एक टेम्पलेट लिखा और उसमें डेटा को इन आयामों के अनुसार व्यवस्थित किया। अंतिम परिणाम बहुत स्पष्ट था: प्रत्येक विषय को अलग-अलग विभाजित किया गया था, और प्रत्येक कार्य को सटीक रूप से सौंपा गया था।

विभिन्न टेम्पलेट्स का उपयोग करके, एक ही रिकॉर्डिंग का विश्लेषण और उससे प्राप्त जानकारी को अलग-अलग तरीकों से निकाला जा सकता है। बार-बार प्रक्रिया करने से हम रिकॉर्डिंग से सबसे महत्वपूर्ण जानकारी निकाल सकते हैं।

प्लाउड के बारे में मेरी एक धारणा यह है कि यह बहुत ही जन-केंद्रित है।

लार्क नोट्स जैसे कई रिकॉर्डिंग उत्पाद वास्तव में "मीटिंग रिकॉर्डिंग" पर ही केंद्रित होते हैं। हर बार रिकॉर्डिंग पूरी होने पर नोट्स अपने आप तैयार हो जाते हैं, जिनका उपयोग सीधे कार्यों को सौंपने के लिए किया जा सकता है।

लेकिन प्लाउड इस बात पर आधारित है कि "लोग" क्या सुनते हैं, और लोगों के बीच की बातचीत पर ध्यान केंद्रित करता है। सबसे पहले, यह 100% रिकॉर्ड करता है, और फिर सारांश और टेम्पलेट्स के माध्यम से, यह सबसे मूल्यवान सामग्री के 50% को सहेजता और उजागर करता है और 10% सार प्रस्तुत करता है।

विभिन्न टेम्पलेट मूल जानकारी को देखने के अलग-अलग तरीके दर्शाते हैं। अपनी रुचियों के अनुसार सबसे उपयुक्त टेम्पलेट का उपयोग करें—यह मानवीय चिंतन का स्थान तो नहीं ले सकता, लेकिन इससे विभिन्न दृष्टिकोण प्राप्त हो सकते हैं।

मूल रूप से सबसे आवश्यक जानकारी को बरकरार रखते हुए और बातचीत के दौरान मानव मस्तिष्क द्वारा उत्पन्न यादों और अनुभवों को जोड़कर, संचार के माध्यम से प्राप्त की जा सकने वाली समझ के स्तर को वास्तव में अधिकतम किया जा सकता है।

एआई युग में "बिजली और प्रकाश व्यवस्था"

हालांकि यह एक "एआई हार्डवेयर" है, लेकिन प्लाउड "हार्डवेयर" से सीधे तौर पर पैसा नहीं कमाता है; इसकी अधिकांश आय सब्सक्रिप्शन से आती है।

यह क्लासिक "रेज़र-ब्लेड" व्यापार मॉडल है: रेज़र निर्माता न केवल रेज़र बेचते हैं, बल्कि बदलने योग्य ब्लेड भी बेचते हैं। हार्डवेयर खरीदने के बाद, उपयोगकर्ताओं को भुगतान जारी रखना पड़ता है और वे एक सिस्टम से बंध जाते हैं।

आज के संदर्भ में, यह एक मानक "एआई-संचालित मूल्य निर्धारण" तर्क जैसा दिखता है। विभिन्न सदस्यता स्तरों के बीच मुख्य अंतर गुणवत्ता और गति में नहीं, बल्कि अवधि, राशि और आपके द्वारा भुगतान किए जाने वाले "टोकन" की संख्या में निहित है।

बेशक, इसका यह मतलब नहीं है कि प्लाउड का वॉयस रिकॉर्डर बेकार है। जो लोग नियमित रूप से रिकॉर्डिंग करते हैं, उनके लिए रिकॉर्डिंग के लिए विशेष रूप से बनाया गया एक फिजिकल ऐड-ऑन उनके अनुभव को काफी बेहतर बना सकता है।

क्या प्लाउड, ओपनएआई की तरह, "एआई मॉडल" से पैसा कमाता है? ऐसा लगता तो नहीं है।

प्लाउड का उत्कृष्ट उपयोगकर्ता अनुभव वास्तव में एक व्यापक भाषा मॉडल द्वारा समर्थित है, और आप डीपसीक, कियानवेन और डौबाओ जैसे कई मॉडलों में से चयन कर सकते हैं। हालांकि, डिफ़ॉल्ट "स्वचालित मोड" ही प्लाउड का सार है: यह आपको तकनीकी विवरणों की चिंता कम करने और सीधे परिणाम प्राप्त करने की सुविधा देता है।

यह एआई युग की सबसे प्रमुख विशेषता भी है: हम परिणामों के लिए भुगतान करते हैं, न कि स्वयं उपकरणों या प्रक्रिया के लिए।

प्लाउड कंपनी सीधे तौर पर "एआई" नहीं बेचती; यह अपने खुद के बड़े मॉडल भी नहीं बनाती। इसके बजाय, यह "एआई का उपयोग करने की एक विधि" बेचती है।

असल में, बड़े एआई मॉडल पानी और बिजली की तरह ही एक प्रेरक शक्ति मात्र हैं। उनमें अपार ऊर्जा होती है, लेकिन हमने अभी तक उन्हें पर्याप्त रूप से विकसित नहीं किया है और चैटबॉट के दायरे से बाहर नहीं निकल पाए हैं।

ठीक 200 साल पहले की तरह, किसी को नहीं पता था कि फैराडे की बिजली की खोज किस काम आएगी, जब तक कि बिजली की रोशनी, टेलीफोन और अन्य विद्युत उपकरण दुनिया में नहीं आ गए।

प्लाउड एआई युग का "प्रकाशस्तंभ" है।

महत्वाकांक्षी रैबिट आर1 और ह्यूमेन एआई पिन, जनरेटिव एआई लहर के संदर्भ में "एआई के साथ समस्याओं को खोजने" के उत्पादों की तरह अधिक हैं।

सीधे शब्दों में कहें तो, वे मूल रूप से अभी भी हार्डवेयर के ऐसे रूप हैं जो "केवल एआई के लिए एआई" हैं, बिना वास्तव में खुद को किसी विशिष्ट उपयोगकर्ता परिदृश्य से जोड़े या वास्तविक दुनिया की समस्याओं को हल करने के लिए एआई का उपयोग किए।

प्लाउड के लिए एआई महत्वपूर्ण नहीं है। शुरुआत से ही कंपनी का मकसद सिर्फ "रिकॉर्डिंग" का अच्छा काम करना था। एआई का बड़ा मॉडल तो बस इस लक्ष्य तक पहुंचने का सबसे छोटा रास्ता है।

जिस प्रकार प्राचीन काल से ही प्रकाश की समस्या मानव जाति को परेशान करती रही है, उसी प्रकार मनुष्यों ने बिजली की रोशनी से पहले मोमबत्तियों का आविष्कार किया था, लेकिन बिजली की रोशनी की दक्षता और प्रभाव अतीत की तुलना में कहीं बेहतर थे, इसलिए हमने बिजली की रोशनी को चुना।

प्लाउड भी इसी तरह के तर्क पर काम करता है। हमारे पास अभूतपूर्व भाषा प्रसंस्करण क्षमताओं वाला एक विशाल एआई मॉडल है, इसलिए हम इसका उपयोग रिकॉर्डिंग परिदृश्य में समस्याओं को हल करने और "रिकॉर्डिंग" को पहले से कहीं बेहतर बनाने के लिए करते हैं।

हम इन रिकॉर्डिंग को प्रोसेस करने के लिए ChatGPT या Gemini जैसे मौजूदा चैटबॉट का इस्तेमाल कर सकते हैं, लेकिन अच्छे नतीजे पाने के लिए हमें उच्च गुणवत्ता वाले संकेत शब्दों की ज़रूरत है। अगर मॉडल अच्छा नहीं है, तो हमें उसे बदलना पड़ेगा, जो कि इस्तेमाल करने का आसान तरीका नहीं है।

दूसरी ओर, प्लाउड उपयोगकर्ताओं को यह विचार करने के लिए बाध्य नहीं करता कि किस बड़े मॉडल का उपयोग करना है या बेहतर सुझाव प्रदान करना है। यह एक ऐसी निश्चितता प्रदान करता है जो उपयोगकर्ताओं को एक क्लिक में अच्छे परिणाम देती है।

इसके अलावा, समान उत्पादों की एक बड़ी संख्या में, प्लाउड ही वह उत्पाद है जिसमें सबसे अधिक "निश्चितता" है।

हम जिस चीज के लिए भुगतान करने को तैयार हैं, वह है यह निश्चितता—बिना किसी "लॉटरी" की आवश्यकता के तत्काल पहुंच की निश्चितता।

एआई हार्डवेयर को "जटिलता" को अवशोषित करना चाहिए।

बहुत से लोगों को वास्तव में यह नहीं पता होता कि एआई का उपयोग कैसे किया जाए।

यहां जिस "ज्ञान की कमी" का जिक्र किया गया है, वह दो पहलुओं को संदर्भित करता है: पहला, सक्रिय रूप से एआई उत्पादों की तलाश न करना, लेकिन इससे भी महत्वपूर्ण बात यह है कि एआई का उपयोग करना न जानना, यह मान लेना कि केवल एक डायलॉग बॉक्स में एक छोटा सा प्रॉम्प्ट डालने से यह आपके इरादों को पूरी तरह से समझ जाएगा और तुरंत एक उपयोगी परिणाम देगा।

समस्या यहीं है: प्रॉम्प्ट, वर्कफ़्लो और मॉडल के अंतरों पर शोध करने में समय बिताने के इच्छुक लोगों की संख्या—दूसरे शब्दों में, वे लोग जो "एआई का उपयोग करना जानते हैं"—अत्यंत कम है। अधिकांश उपयोगकर्ताओं के पास न तो धैर्य है और न ही इसकी आवश्यकता। उन्हें परिणाम चाहिए, न कि खुद को अर्ध-विशेषज्ञ प्रॉम्प्ट इंजीनियर बनाने का प्रशिक्षण।

आखिरकार, एआई से हमारी यही अपेक्षा है कि वह कम से कम प्रयास से अधिकतम और सर्वोत्तम परिणाम प्राप्त करे।

यदि आप एआई का उपयोग करना नहीं जानते हैं, तो आप यह नहीं जान पाएंगे कि एक योग्य और उपयोगी एआई उत्पाद कैसा होना चाहिए – इसलिए वर्तमान तकनीकी उद्योग तथाकथित "एआई हार्डवेयर" से भरा पड़ा है जो केवल प्रचार है और जिसका कोई मूल्य नहीं है; जिसमें एआई तो है लेकिन कोई क्षमता नहीं है।

लोग बहुत अधिक विज्ञापन देखते हैं और आसानी से चैट करने, जनरेट करने और मॉडल को कॉल करने की क्षमता को एक स्थापित उत्पाद मान लेते हैं, लेकिन यह पर्याप्त नहीं है।

एक अच्छे एआई उत्पाद को कम से कम दो काम करने चाहिए: पहला, उसे यह पता होना चाहिए कि उपयोगकर्ता एआई का उपयोग करने की संभावना नहीं रखते हैं, इसलिए उसे सीखने की लागत उपयोगकर्ताओं पर नहीं डालनी चाहिए; दूसरा, उसे मूल रूप से अस्थिर मॉडल क्षमताओं को अपेक्षाकृत स्थिर परिणाम में संपीड़ित करने में सक्षम होना चाहिए।

प्लाउड का महत्व यहीं निहित है; यह एक बहुत ही वास्तविक समस्या का समाधान करता है: हर कोई एआई सीखना नहीं चाहता, लेकिन हर कोई काम पूरा करना चाहता है।

Plaud से पहले, सभी समान हैं। हर कोई एक ही बटन दबाता है और उसे एक जैसी उच्च-गुणवत्ता वाली सामग्री मिलती है। एकमात्र अंतर यह है कि सदस्यता लेने के बाद उन्हें कितनी सामग्री मिल सकती है।

प्लाउड द्वारा प्रदान की गई "चीट शीट" एक अधिक उन्नत "टेम्प्लेट" है, जो आपको अपनी आवश्यकताओं के आधार पर उपयुक्त प्रॉम्प्ट चुनने की सुविधा देती है; यदि यह पर्याप्त नहीं है, तो उपयोगकर्ताओं द्वारा उपलब्ध कराए गए विभिन्न टेम्प्लेट और भी अधिक उपयोगी हैं। आपको इसे पढ़ने की आवश्यकता नहीं है; प्लाउड सीधे आपको एआई के लाभ प्रदान करता है।

गेम के अंदर खरीदारी के लिए भुगतान करने की तरह ही, प्लाउड आपको लगातार विकसित हो रहे बड़े भाषा मॉडलों पर शोध करने और अधिक और बेहतर संकेत तैयार करने में मदद करता है, जिससे पीछे छूट जाने की चिंता पूरी तरह से दूर हो जाती है।

प्लाउड मूल रूप से एक "स्पीडरन एआई" प्लगइन बेच रहा है जो जटिलताओं को दूर करता है और आपके लिए कमियों को दूर करता है।

यह कहना मुश्किल नहीं है, लेकिन बहुत कम कंपनियां ऐसी हैं जो सचमुच किसी एक चीज़ पर ध्यान केंद्रित कर सकें और अपने सभी संसाधन उसी में लगा सकें। बड़े, व्यापक स्तर पर काम करने वाले निर्माता "विशेषज्ञ" बनने के बजाय "सामान्यवादी" बनना चाहते हैं, और वे शायद ही किसी एक रिकॉर्डिंग फ़ंक्शन में इतने संसाधन निवेश करेंगे। वहीं दूसरी ओर, छोटे, नए स्टार्टअप के पास ऐसा करने के लिए अनुभव और विशेषज्ञता की कमी होती है।

यही कारण है कि प्लाउड उद्योग में अग्रणी बन गया है – क्योंकि यह पूरी तरह से रिकॉर्डिंग पर केंद्रित है। परिणामस्वरूप, इसके सभी संसाधन प्रतिदिन ध्वनि को परिष्कृत करने में लगे रहते हैं, जिससे यह अपने प्रतिस्पर्धियों की तुलना में पहले और अधिक सटीक परिणाम देता है।

इसने न तो पूरी तरह से एक नई दुनिया का आविष्कार किया, न ही भविष्य की कोई असाधारण कल्पना प्रस्तुत की। इसने बस एक महत्वपूर्ण बात साबित की: इस स्तर पर, सबसे मूल्यवान एआई उत्पाद अक्सर वे नहीं होते जिनमें सबसे अधिक आकर्षक क्षमताएं होती हैं, बल्कि वे होते हैं जो आम लोगों को सबसे अधिक निश्चितता प्रदान करते हैं।

मुझे उम्मीद है कि मुझे और भी अधिक "ताली" सुनने को मिलेगी।

#iFanr के आधिकारिक वीचैट अकाउंट को फॉलो करने के लिए आपका स्वागत है: iFanr (वीचैट आईडी: ifanr), जहां आपको जल्द से जल्द और भी रोमांचक सामग्री प्रस्तुत की जाएगी।