
डीपसीक बड़े मॉडलों के लिए वैसा ही है जैसा मिक्स्यू आइसक्रीम मिल्क टी के लिए होता है। आपको लागत-प्रभावशीलता के बारे में चिंता करने की ज़रूरत नहीं है, क्योंकि इसकी क्षमताएं बेजोड़ हैं और यह आपकी जेब पर कभी बोझ नहीं डालेगा।
हाल ही में, DeepSeek ने अपने DeepSeek-V4-Pro मॉडल API की कीमत में स्थायी कमी की आधिकारिक घोषणा की है। DeepSeek ने यह भी बताया कि API की आउटपुट गति में सुधार और सेवा विस्तार किया गया है, जिसके परिणामस्वरूप तेज़ गति, अधिक स्थिर सेवा और 500 समवर्ती कनेक्शनों के लिए डिफ़ॉल्ट समर्थन मिलता है। एंटरप्राइज़ उपयोगकर्ता ऑनलाइन आवेदन करके उच्च समवर्तीता स्तरों के लिए आवेदन कर सकते हैं।
बड़े मॉडल API के लिए मूल्य निर्धारण मानदंड को फिर से परिभाषित किया जा रहा है: मॉडल जारी करें, छूट प्रदान करें, कैश हिट मूल्य कम करें, और अंत में अस्थायी पेशकश को दीर्घकालिक मूल्य में बदलें। कम कीमत वाले मॉडलों के बाद अगला कदम संभवतः एजेंट होगा।

डीपसीक ने अपनी कीमत में स्थायी रूप से गिरावट दर्ज की; लियांग वेनफेंग ने टोकन की कीमत में भारी कमी की है।
आइए सबसे पहले डीपसीक की कीमतों में कमी की समयरेखा की संक्षिप्त समीक्षा करें:
- 24 अप्रैल को, डीपसीक V4 का पूर्वावलोकन संस्करण आधिकारिक तौर पर जारी किया गया था।
- 25 अप्रैल को, डीपसीक ने वी4-प्रो पर 25% की छूट की घोषणा की।
- 26 अप्रैल को, डीपसीक ने घोषणा की कि कैश हिट की कीमत को प्रारंभिक कीमत के दसवें हिस्से तक समायोजित किया जाएगा।
- 28 अप्रैल को, डीपसीक ने घोषणा की कि वी4-प्रो पर 25% की छूट 31 मई तक बढ़ा दी जाएगी।
- 22 मई को, डीपसीक ने वी4-प्रो की कीमत में स्थायी कमी की घोषणा की, जिससे इसकी कीमत मूल कीमत के एक-चौथाई तक कम हो गई।
समयरेखा में सबसे महत्वपूर्ण बात यह है कि अस्थायी छूट अब स्थायी मूल्य कटौती में बदल गई है। समायोजन के बाद, DeepSeek-V4-Pro इनपुट कैश हिट की कीमत 0.1 युआन प्रति मिलियन टोकन से घटकर 0.025 युआन हो गई है, और इनपुट कैश मिस की कीमत 12 युआन प्रति मिलियन टोकन से घटकर 3 युआन हो गई है।
आउटपुट मूल्य 24 युआन प्रति मिलियन टोकन से घटाकर 6 युआन कर दिया गया है। डिफ़ॉल्ट रूप से 500 समवर्ती कनेक्शन और सेवा गति में वृद्धि के साथ, आधिकारिक एपीआई डेवलपर्स और व्यवसायों के लिए और भी आकर्षक बन गया है।

▲
https://api-docs.deepseek.com/zh-cn/quick_start/pricing
मूल्य में कमी का सबसे सीधा प्रभाव यह है कि यह डेवलपर्स के निर्णय लेने में कार्य लागत को अधिक तात्कालिक स्तर पर धकेल देता है।
कोड-आधारित परिदृश्य में, एक ही कार्य में प्रोजेक्ट फ़ाइलों को पढ़ना, लॉग का विश्लेषण करना, कई बार संशोधन करना और बार-बार परीक्षण चलाना शामिल हो सकता है, जिससे टोकन की खपत आसानी से बढ़ सकती है।
लंबे संदर्भ, कोडबेस विश्लेषण, बैच रिफैक्टरिंग, स्वचालित परीक्षण और मल्टी-राउंड एजेंट निष्पादन जैसे उच्च-खपत वाले परिदृश्य व्यक्तिगत डेवलपर्स और छोटी टीमों के लिए उनके बजट के भीतर अधिक सुलभ होते जा रहे हैं।
पहले, डेवलपर मुख्य रूप से मॉडल की क्षमताओं, स्थिरता, इकोसिस्टम और उपयोगकर्ता की आदतों के आधार पर क्लाउड, ओपनएआई या जेमिनी का चयन करते थे। डीपसीक की स्थायी रूप से काफी कम कीमत का मतलब है कि लागत-प्रभावशीलता को देखते हुए, डेवलपर की उपयोग की आदतें आसानी से बदल सकती हैं।

इस विचार के आधार पर, डीपसीक की बाज़ार में निरंतर भूमिका स्पष्ट हो जाती है: कम कीमतों, ओपन सोर्स और सशक्त अनुमान क्षमताओं के माध्यम से बड़े मॉडल बाज़ार में लगातार मूल्य लाभ अर्जित करना। घरेलू मॉडल निर्माताओं के लिए, V4-Pro की स्थायी मूल्य कटौती API मूल्य निर्धारण रेखा को पुनर्परिभाषित करने के बराबर है।
ज़िपू, मिनीमैक्स और लूनर डार्क साइड जैसे मॉडल, जो एपीआई शुल्क पर निर्भर हैं और डेवलपर्स और एंटरप्राइज़ ग्राहकों को लक्षित करते हैं, काफी दबाव का सामना कर रहे हैं। इसके विपरीत, क्लाउड, ओपनएआई और जेमिनी जैसे प्रमुख विदेशी मॉडल बाज़ार, ग्राहक संरचना और इकोसिस्टम की स्थिति में अंतर के कारण अपेक्षाकृत सीमित अल्पकालिक प्रभाव का सामना कर रहे हैं।
हालांकि, अगर डीपसीक बाद में क्लाउड कोड के समान एक एन्कोडिंग टूल लॉन्च करता है, और कम टोकन लागत के साथ उच्च-आवृत्ति कॉल का समर्थन करता है, तो कीमत के प्रति संवेदनशील डेवलपर्स अधिक आसानी से आकर्षित होंगे।
डीपसीक की मूल्य निर्धारण नीति के बारे में लियांग वेनफेंग की पिछली व्याख्या आज भी समझ में आती है।
2024 में, जब डीपसीक V2 ने अपनी कीमत कम की, तब लियांग वेनफेंग ने बताया कि डीपसीक अपने हिसाब से काम करता है, लागत की गणना करता है और उसी के अनुसार कीमतें तय करता है, जिसका सिद्धांत है न तो नुकसान उठाना और न ही अत्यधिक मुनाफा कमाना। उन्होंने यह भी कहा कि कीमत में कमी आंशिक रूप से अगली पीढ़ी के मॉडल संरचना के अन्वेषण से हुई लागत में कमी के कारण हुई, और आंशिक रूप से इस तथ्य के कारण कि एपीआई और एआई सभी के लिए सुलभ और किफायती होने चाहिए।
APIs को उच्च-लाभ वाले राजस्व स्रोत के रूप में उपयोग करने के बजाय, DeepSeek अपनी मजबूत बुनियादी ढांचागत क्षमताओं का उपयोग अनुमान लागत को कम करने और फिर कम कीमतों के साथ डेवलपर्स, एप्लिकेशन और डाउनस्ट्रीम इकोसिस्टम को अपने प्लेटफॉर्म की ओर आकर्षित करने के लिए कर रहा है।

"डीपसीक की 10 ट्रिलियन अमेरिकी डॉलर की भव्य रणनीति" शीर्षक वाले एक हालिया लेख में, एक्स प्लेटफॉर्म पर ब्लॉगर @bookwormengr ने एक अधिक कट्टरपंथी व्याख्या प्रस्तुत की।
उनका मानना है कि डीपसीक का असली लक्ष्य ज़िपू, लूनर डार्क साइड और मिनीमैक्स से प्रतिस्पर्धा करना नहीं है, न ही मल्टीमॉडल, वॉयस और वीडियो जैसी अपनी उत्पाद श्रृंखलाओं को जल्दबाजी में पूरा करना है। बल्कि, इसका उद्देश्य प्रशिक्षण और अनुमान के लिए आवश्यक संसाधनों को लगातार कम करके एक सस्ता और अधिक विकेन्द्रीकृत एआई हार्डवेयर इकोसिस्टम विकसित करना है।
उनके विचार में, डीपसीक का दीर्घकालिक मूल्य न केवल मॉडल में ही निहित है, बल्कि घरेलू स्तर पर उत्पादित स्टोरेज, जीपीयू, एएसआईसी, नेटवर्क चिप्स और विषम हार्डवेयर को बड़े मॉडल प्रशिक्षण और अनुमान प्रणाली में प्रवेश करने में सक्षम बनाने में भी निहित है।

यह भविष्यवाणी पूरी तरह से सच नहीं हो सकती है, लेकिन यह डीपसीक द्वारा किए गए विकल्पों की श्रृंखला के पीछे की दिशा को स्पष्ट करती है:
MoE, MLA, DSA, GRPO, RLVR, KV कैश कम्प्रेशन, डुअल पाथ और TileLang, सतही तौर पर मॉडल आर्किटेक्चर और इन्फरेंस इंजीनियरिंग के अनुकूलन हैं। लेकिन गहराई से देखें तो, इन सभी का उद्देश्य हाई-एंड HBM, टॉप-टियर GPU और CUDA इकोसिस्टम पर निर्भरता को कम करना है।
मूल्य में कमी की घोषणाओं की श्रृंखला में, सबसे उल्लेखनीय न केवल उत्पादन मूल्य में कमी है, बल्कि कैश हिट मूल्य में भी कमी है।
बड़े पैमाने पर मॉडल अनुमान में, कुंजी-मान (KV) कैश एक महत्वपूर्ण लागत मद है। जब मॉडल लंबे संदर्भों को संसाधित करता है, तो उसे बाद की पीढ़ी में बार-बार उपयोग के लिए ऐतिहासिक टोकन से संबंधित कुंजी और मान को संग्रहीत करने की आवश्यकता होती है। संदर्भ जितना लंबा होगा, उतना ही अधिक कैश सहेजने और पुनः प्राप्त करने की आवश्यकता होगी, और GPU मेमोरी, बैंडविड्थ और भंडारण प्रणालियों पर उतना ही अधिक दबाव पड़ेगा।

सामान्य चैट में, कैशिंग का दबाव शायद स्पष्ट न हो, लेकिन कोड, लंबे दस्तावेज़ों और एजेंट कार्यों में जाने पर लागत संरचना तेजी से बदल जाती है। @bookwormengr ने एक लंबे लेख में कुंजी-मूल्य कैशिंग की लागत की विशेष रूप से गणना की है।
1 मिलियन टोकन, 8-बिट केवी परिशुद्धता और 16-बिट इंडेक्स परिशुद्धता के संदर्भ के आधार पर, उन्होंने अनुमान लगाया कि डीपसीक वी4 को लगभग 5.48 जीबी एचबीएम की आवश्यकता होती है, जबकि जीएलएम5 को लगभग 60 जीबी और क्वेन3-235बी-ए22बी को लगभग 89 जीबी की आवश्यकता होती है।

लंबे संदर्भ और एजेंट कार्यों की वास्तविक लागत केवल मॉडल निर्माण ही नहीं है, बल्कि कैशिंग, जीपीयू मेमोरी, बैंडविड्थ और बार-बार संदर्भ प्रबंधन भी है।
जब कोई कोड एजेंट किसी प्रोजेक्ट को प्रोसेस करता है, तो वह बार-बार एक ही कोडबेस संरचना, फाइलों का एक ही बैच, टास्क हिस्ट्री, सिस्टम प्रॉम्प्ट्स का एक ही सेट और टेस्ट लॉग्स का एक ही बैच पढ़ सकता है। यदि प्रत्येक राउंड का बिल पूरे कॉन्टेक्स्ट के आधार पर दोबारा बनाया जाता है, तो लंबे टास्क जल्दी ही महंगे हो जाएंगे। कैश हिट्स की कीमत कम होने के बाद, कॉन्टेक्स्ट को दोहराने की लागत में काफी कमी आएगी।
हाल के वर्षों में डीपसीक द्वारा MoE आर्किटेक्चर, लॉन्ग कॉन्टेक्स्ट, KV कैश कम्प्रेशन और इन्फरेंस एफिशिएंसी में किए गए निरंतर निवेश से उल्लेखनीय परिणाम प्राप्त हुए हैं। तकनीकी विकास के परिणामस्वरूप कीमतों में कमी आना अपरिहार्य है और इससे एआई प्रोग्रामिंग बाजार का परिदृश्य पूरी तरह से बदल जाएगा।
"क्लाउड कोड" का चीनी संस्करण बनाना क्यों आवश्यक है?
सबसे पहले प्रभावित होने वाले एआई प्रोग्रामिंग टूल्स के सब्सक्रिप्शन मॉडल हैं।
बाज़ार में उपलब्ध अधिकांश प्रमुख एआई प्रोग्रामिंग टूल मासिक कोडिंग प्लान सब्सक्रिप्शन प्रदान करते हैं, जिससे उपयोगकर्ताओं को कोड पूर्णता, मॉडल आह्वान और एजेंट निष्पादन जैसे लाभ मिलते हैं। हल्के कोड पूर्णता के इस युग में, प्रति आह्वान लागत अत्यंत कम है।
हालांकि, एआई प्रोग्रामिंग एक बार में पूरी होने वाली प्रक्रियाओं से विकसित होकर एजेंट-स्वचालित कोडिंग की पूर्ण प्रक्रिया तक पहुंच गई है। मॉडल स्वतंत्र रूप से कोड संशोधन, परीक्षण संचालन और त्रुटि निवारण को पूरा कर सकता है, जिससे प्रति कार्य टोकन की खपत में उल्लेखनीय वृद्धि होती है।
जब अंतर्निहित API की कीमतों में भी भारी गिरावट आती है, तो कोडिंग प्लान को नए समर्थन की तलाश करनी पड़ती है। यह समर्थन संभवतः इंजीनियरिंग क्षमताओं में निहित होगा—उदाहरण के लिए, परियोजना संरचना को बेहतर ढंग से समझना, संदर्भों का सटीक चयन करना, टोकन की खपत को नियंत्रित करना, कोड को विश्वसनीय रूप से संशोधित करना, Git, टर्मिनलों, CI/CD को संभालना और एक उद्यम परिवेश में अनुमतियों और ऑडिट लॉग का प्रबंधन करना।
एपीआई मध्यस्थों को भी पुनर्व्यवस्थित करने की आवश्यकता है। व्यक्तिगत डेवलपर्स के लिए, सामर्थ्य और उपयोग में आसानी महत्वपूर्ण बनी हुई है। लेकिन व्यवसायों के लिए, स्थिरता, लेखापरीक्षा, नियंत्रणीयता और सुवाह्यता कहीं अधिक महत्वपूर्ण हैं।
इस तर्क के आधार पर, कोडिंग प्लान और ट्रांजिट स्टेशन में किए गए बदलाव महज सतही हैं। कम कीमतों के अलावा, सबसे अहम सवाल यह है कि डेवलपर एक्सेस प्वाइंट पर अंततः किसका नियंत्रण है?

हाल ही में हार्ड फोर्क के साथ एक साक्षात्कार में, गूगल के सीईओ सुंदर पिचाई ने पहली बार सार्वजनिक रूप से स्वीकार किया कि गूगल टेक्स्ट, मल्टीमॉडल, वॉयस, रीजनिंग और समग्र बुद्धिमत्ता के क्षेत्र में बहुत प्रतिस्पर्धी है, लेकिन एजेंसी कोडिंग जैसी क्षमताओं में अभी भी पीछे है, खासकर टूल इनवोकेशन, निर्देश पालन और लंबे चक्र वाले कार्यों में।
उन्होंने यह भी बताया कि इससे भी महत्वपूर्ण बात यह है कि मॉडल को वास्तविक दुनिया के अनुप्रयोगों में लागू करना, डेटा को वापस प्रवाहित होने देना और प्रक्रिया को जारी रखना। पिचाई ने विशेष रूप से कहा कि कोडिंग एक ऐसा क्षेत्र है जिसमें डेटा प्रवाह के साथ काम करना आवश्यक है।
टर्मिनल टूल्स यह दिखा सकते हैं कि डेवलपर किस प्रकार कार्य प्रस्तावित करते हैं, अनुवर्ती प्रश्न पूछते हैं, सुझाव स्वीकार करते हैं, कार्य छोड़ देते हैं और मॉडल में और सुधार का अनुरोध करते हैं। वे परीक्षण परिणामों, टर्मिनल लॉग, फ़ाइल परिवर्तनों और गिट कमिट्स के आधार पर यह भी निर्धारित कर सकते हैं कि किसी एजेंट निष्पादन ने अपना कार्य पूरा किया है या नहीं। इस प्रकार का डेटा कोडिंग मॉडल और एजेंट उत्पादों के लिए अत्यंत मूल्यवान है।
अपनी सार्वजनिक भर्ती गतिविधियों को देखते हुए, डीपसीक हाल ही में एजेंट-संबंधी गतिविधियों में अधिक सक्रिय हो गया है।
नौकरी के विज्ञापनों में एजेंट डीप लर्निंग एल्गोरिदम शोधकर्ता, एजेंट डेटा रणनीति इंजीनियर, उत्पाद प्रबंधक और अनुसंधान एवं विकास इंजीनियर जैसे पद भी दिखाई दे रहे हैं। इससे भी महत्वपूर्ण बात यह है कि डीपसीक के वरिष्ठ शोधकर्ता चेन डेली ने सीधे नौकरी का विज्ञापन दिया है, जिसमें उन्होंने उल्लेख किया है कि वे कोड हार्नेस को बिल्कुल नए सिरे से विकसित करेंगे।

जैसा कि नाम से ही स्पष्ट है, मॉडल + हार्नेस = एजेंट। एजेंट उत्पादों में, मॉडल समझने और उत्पन्न करने के लिए ज़िम्मेदार होता है, जबकि हार्नेस मॉडल की क्षमताओं को वास्तविक इंजीनियरिंग वातावरण में लाने के लिए ज़िम्मेदार होता है, जो मॉडल के बाहर "निष्पादन प्रणाली" के समतुल्य है।
क्लाउड कोड का डीपसीक संस्करण डेवलपर्स को केवल एक डायलॉग बॉक्स ही नहीं, बल्कि एक ऐसा इंजीनियरिंग सिस्टम प्रदान करे जो लगातार कार्यों को निष्पादित कर सके।
डीपसीक में शामिल होने के बाद कुई तियानयी का ध्यान कोड एजेंट की इंजीनियरिंग विशेषताओं से भी संबंधित है।
सार्वजनिक जानकारी के अनुसार, कुई तियानयी ने झेजियांग विश्वविद्यालय के कंप्यूटर विज्ञान विभाग से स्नातक की उपाधि प्राप्त की। उन्होंने कंप्यूटर विज्ञान प्रतियोगिता के माध्यम से झेजियांग विश्वविद्यालय में प्रवेश लिया और एसीएम एशिया क्षेत्रीय प्रतियोगिता में छह बार स्वर्ण पदक जीता। इसके बाद उन्होंने जेन स्ट्रीट में नौ वर्षों तक काम किया और टीएसवाई कैपिटल के सह-संस्थापक बने।

कोड एजेंट की चुनौती केवल कोड जनरेट करने में ही नहीं, बल्कि वास्तविक दुनिया की परियोजनाओं में कार्यों को लगातार निष्पादित करने की क्षमता में भी निहित है। मात्रात्मक ट्रेडिंग सिस्टम लंबे समय से कम विलंबता, स्थिरता, स्वचालित निष्पादन और जोखिम नियंत्रण पर जोर देते रहे हैं; ये अनुभव, कम से कम इंजीनियरिंग प्रतिमान के संदर्भ में, एजेंट हार्नेस पर लागू होते हैं।
एजेंट टूल्स की क्षमताएं केवल कोड लिखने तक ही सीमित नहीं हैं; इनमें अनुमतियां, ऑडिटिंग, डेटा अलगाव और सुरक्षा नीतियां भी शामिल हैं।
इसके परिणामस्वरूप, डीपसीक जैसे घरेलू मॉडलों के लिए अवसर मिलता है। यदि डीपसीक कम लागत वाले मॉडल, कोड हार्नेस, स्थानीय तैनाती और उद्यम-स्तरीय एक्सेस कंट्रोल को संयोजित कर सकता है, तो सरकार, वित्त, विनिर्माण और ऊर्जा जैसे डेटा-संवेदनशील उद्योगों में इसका मजबूत वैकल्पिक मूल्य होगा।
डीपसीक द्वारा क्लाउड कोड का चीनी संस्करण बनाने के पीछे का तर्क यह है: कम कीमत वाले टोकन अधिक डेवलपर्स को आकर्षित करते हैं; कम कैशिंग लागत एजेंट टास्क निष्पादन लागत को कम करती है; कोड हार्नेस मॉडल को विकास परिवेश में लाता है; और वास्तविक वर्कफ़्लो, बदले में, डीपसीक को अपने मॉडल और उत्पादों को बेहतर बनाने में मदद करते हैं।
जैसे कोई बर्फ का गोला पहाड़ी से नीचे लुढ़कता है, वैसे ही यह हर बार लुढ़कने पर बड़ा और तेज़ होता जाता है। कीमतों में कमी तो बस पहला धक्का है जो इसे पहाड़ी से नीचे लुढ़कने के लिए प्रेरित करता है; इसके बाद, यह लगातार और भारी होता जाएगा, और इसे कोई रोक नहीं पाएगा।
#iFanr के आधिकारिक वीचैट अकाउंट को फॉलो करने के लिए आपका स्वागत है: iFanr (वीचैट आईडी: ifanr), जहां आपको जल्द से जल्द और भी रोमांचक सामग्री प्रस्तुत की जाएगी।