Cortana से लेकर Copilot तक, Microsoft ने आखिरकार अपने समय का इंतजार किया

कुछ समय पहले, हमने बिल्ड 2023 डेवलपर कॉन्फ्रेंस में Microsoft द्वारा जारी किए गए विंडोज कोपिलॉट पर सूचना दी थी – विंडोज 11 आर्टिफिशियल इंटेलिजेंस असिस्टेंट का गहन एकीकरण।

अब तक, Copilot Microsoft के लगभग सभी महत्वपूर्ण उत्पादों में दिखाई दिया है, जिसमें प्रोग्रामिंग के लिए Github Copilot, कार्यालय के लिए Microsoft 365 Copilot, ग्राहक संचार के लिए Viva Copilot, व्यवसाय प्रक्रिया के लिए Dynamic 365 Copilot और इसी तरह शामिल हैं।

Microsoft उन कंपनियों की तुलना में एक कदम आगे निकल गया है, जिन्होंने कोपिलॉट में सभी को चुनते हुए खुद को AI पहले और AI में सभी घोषित किया, यानी पूरी तरह से आर्टिफिशियल इंटेलिजेंस-असिस्टेड तकनीक की ओर रुख किया।

हम एक महत्वपूर्ण मोड़ पर पहुंच गए हैं

इसे देखकर, मेरा मानना ​​है कि बहुत से पाठक जो एआई तकनीक की परवाह नहीं करते हैं, उन्हें "कोपिलॉट" क्या है, इसके बारे में ज्यादा जानकारी नहीं है।

शब्द "कोपिलॉट" एक विमानन शब्द से लिया गया है, जिसका अर्थ सह-पायलट (सह-पायलट) है। एक हवाई जहाज पर, सह-पायलट वह व्यक्ति होता है जो विमान के संचालन में मुख्य पायलट की सहायता करता है। आमतौर पर, जब मुख्य पायलट को आराम करने या अन्य कार्यों को संभालने की आवश्यकता होती है, तो सह-पायलट नियंत्रण संभाल लेगा। दोनों हैं विमान की सुरक्षित उड़ान के लिए संयुक्त रूप से जिम्मेदार।

इस परिभाषा की तुलना करते हुए, हमारे लिए यह समझना मुश्किल नहीं है: कंप्यूटर प्रोग्राम का उपयोग करने वाला हर व्यक्ति "पायलट" है, और एआई "सह-पायलट" है जो नौकायन में हमारी सहायता करता है।

उदाहरण के लिए, जब आप काम करने के लिए तैयार हों, तो आप विंडोज 11 में कोपिलॉट को कॉल कर सकते हैं और अपनी जरूरतें टाइप कर सकते हैं:

मैं और अधिक कुशलता से कैसे काम कर सकता हूँ?

Windows Copilot सुझाव देगा कि आप फ़ोकस मोड चालू करें और सिस्टम इंटरफ़ेस को अधिक गहरे रंग वाले मॉडल में समायोजित करें।

इस समय, आप अभी भी कुछ संगीत सुनना चाहते हैं, और फिर आवश्यकताएँ टाइप करें:

काम के लिए कुछ संगीत चालू करें

Windows Copilot आपके पसंद के संगीत के प्रकार के अनुसार Spotify जैसे संगीत सॉफ़्टवेयर पर संबंधित प्लेलिस्ट चलाएगा।

ऐसा लगता है कि हम कमांड-लाइन इंटरफेस के दिनों में वापस आ गए हैं, जहां सभी कंप्यूटर ऑपरेशन एक इनपुट बॉक्स के माध्यम से किए जाते हैं। लेकिन अंतर यह है कि अब आपको प्रोग्रामिंग सीखने और समझने में समय बिताने की आवश्यकता नहीं है, एक कंप्यूटर-विशिष्ट भाषा, आप अपनी आवश्यकताओं को इसमें डालने के लिए मानव प्राकृतिक भाषा का उपयोग करते हैं, और यह इसे हल करने में आपकी सहायता कर सकता है।

Windows Copilot आपको कई समस्याओं को हल करने में भी मदद कर सकता है। उदाहरण के लिए, जब आप एक दस्तावेज़ प्राप्त करते हैं जो पढ़ने के लिए बहुत लंबा है, तो आप इसे सीधे डेस्कटॉप से ​​Copilot तक खींच सकते हैं, और AI को आपके लिए "क्वांटम गति" प्राप्त करने के लिए दस्तावेज़ को सारांशित करने दें। . पढ़ें"।

कार्यकुशलता में सुधार के लिए आप दस्तावेज़ की सामग्री को फिर से लिखने या समझाने में मदद भी कर सकते हैं। सीधे शब्दों में कहें तो कोपिलॉट आपके काम को पूरी तरह से बदल नहीं सकता है, लेकिन यह आपको बहुत सारे अनावश्यक दोहराव वाले श्रम से बचा सकता है, इस प्रकार "डिजिटल काम" पर खर्च होने वाले समय की बचत करता है।

यह सहपायलट की Microsoft की परिभाषा भी है: एक ऐसा अनुप्रयोग या घटक जो लोगों को जटिल या संज्ञानात्मक कार्यों को पूरा करने में मदद करने के लिए प्राकृतिक भाषा प्रसंस्करण तकनीकों या बड़े भाषा मॉडल (जैसे GPT-4) का उपयोग करता है।

जो मित्र डायल-अप इंटरनेट युग से आए हैं, उन्होंने कुछ प्रमुख तत्वों पर ध्यान दिया होगा:

ऑपरेटिंग सिस्टम + सहायक, रुको, क्या यह विंडोज 97 युग का क्लिप्पी और विंडोज फोन युग का कोरटाना नहीं है! ?

यह सही है, क्लिप्पी, कॉर्टाना और कोपिलॉट (क्या Microsoft C से शुरू होने वाले शब्दों से ग्रस्त है?) वास्तव में स्थिति में कुछ ओवरलैप है, और आप उन्हें विभिन्न इंटरफ़ेस युगों में एक ही उत्पाद के तीन रूपों के रूप में भी सोच सकते हैं।

क्लिप्पी : ग्राफिकल इंटरएक्टिव इंटरफेस के साथ एक सिस्टम असिस्टेंट। इसका मूल डिजाइन उद्देश्य जटिल संचालन कार्यों को सरल बनाने के लिए एक सुलभ और अनुकूल इंटरफेस प्रदान करना है। हालाँकि, चूंकि क्लिप्पी को पॉप-अप विंडो के माध्यम से इंटरैक्ट करने की आवश्यकता होती है, इसलिए यह हमेशा अनुपयुक्त रूप से पॉप अप होता है, जिससे उपयोगकर्ता इसका उपयोग करते समय फोकस खो देता है।

कोरटाना : वॉयस इंटरफेस के लिए एक सिस्टम असिस्टेंट, सिरी और गूगल असिस्टेंट की बेंचमार्किंग और पर्सनल डिजिटल असिस्टेंट की स्थिति। हालाँकि, कार्यात्मक सीमाओं के कारण, Cortana जो कर सकता है वह बहुत सीमित है। भले ही Microsoft Cortana को विंडोज़ की तुलना में अधिक प्लेटफ़ॉर्म पर धकेलता है, फिर भी उपयोगकर्ताओं को आकर्षित करना मुश्किल होगा।

विंडोज़ सह-पायलट : प्राकृतिक भाषा संपर्क के युग में एआई सहायक, यह सिस्टम में गहराई से निहित है, लेकिन सिस्टम तक ही सीमित नहीं है, इसे विभिन्न कार्यक्रमों और अनुप्रयोगों में एकीकृत किया जा सकता है, और उपयोगकर्ताओं की जरूरतों को समझ सकता है और सहायता प्रदान कर सकता है। कार्यक्षमता, लचीलेपन और एकीकरण के मामले में क्लिप्पी और कोरटाना से कहीं अधिक है।

तकनीकी विकास के दृष्टिकोण से, आप पाएंगे कि कोपिलॉट और कोरटाना के रास्ते समान हैं लेकिन पूरी तरह से अलग दिशा में हैं।

2014 में, Cortana ने विंडोज फोन 8.1 के डिफॉल्ट वॉयस असिस्टेंट के रूप में शुरुआत की, जो वॉयस सर्च, शेड्यूल मैनेजमेंट और पर्सनलाइज्ड सजेशन जैसे फंक्शन प्रदान करता है, वॉयस असिस्टेंट मार्केट में माइक्रोसॉफ्ट की आधिकारिक प्रविष्टि को चिन्हित करता है, जो Apple और Google के साथ प्रतिस्पर्धा करता है।

इसके बाद, Cortana को विंडोज 10 ऑपरेटिंग सिस्टम के साथ लॉन्च किया गया, पीसी और टैबलेट में विस्तारित किया गया, अधिक सिस्टम फ़ंक्शंस को एकीकृत किया गया, और अधिक लोगों के लिए अधिक परिचित हो गया।

बाद के समय में, Microsoft ने अधिक उपयोगकर्ता प्राप्त करने की उम्मीद में Cortana को Microsoft 365 सुइट, टीम्स आदि सहित और उत्पादों में भर दिया।

लेकिन 2021 तक, Microsoft ने Cortana की अधिकांश सेवाओं को बंद करने और वॉइस असिस्टेंट युद्ध से हटने का फैसला किया।

Cortana की विफलता केवल इसलिए नहीं है क्योंकि इसकी बाजार हिस्सेदारी में वृद्धि नहीं हो पाई है, बल्कि इसलिए भी है क्योंकि वॉइस असिस्टेंट फ़ंक्शन स्वयं बहुत अधिक तरंगें बनाना मुश्किल है: 10 साल पहले, वॉइस असिस्टेंट आपको ईमेल लिखने और मौसम की जांच करने में मदद कर सकता था। यह केवल इन बुनियादी कार्यों को कर सकता है, और उपयोगकर्ता की धारणा मजबूत नहीं है।

चैटजीपीटी के उभरने तक यह नहीं था कि आवाज एआई सहायकों द्वारा छोड़ा गया "बेवकूफ" स्टीरियोटाइप टूट गया था।

ChatGPT प्राकृतिक भाषा के माध्यम से लोगों की जरूरतों को समझ सकता है और लोगों को कुछ ऐसे कार्यों को पूरा करने में मदद कर सकता है जिनके लिए उच्च बुद्धि की आवश्यकता होती है। हालांकि GPT मॉडल कभी-कभी त्रुटियां उत्पन्न करता है, इसने AI सहायकों के लंबे समय से चले आ रहे दर्द बिंदु – शब्दार्थ समझ को हल कर दिया है।

यह एक महत्वपूर्ण मोड़ है। माइक्रोसॉफ्ट ने अपने उत्पादों के साथ बड़ी भाषा मॉडल प्रौद्योगिकी को जल्दी से जोड़ दिया, एक के बाद एक जबड़ा छोड़ने वाली प्रौद्योगिकी डेमो को बाहर कर दिया: बिंग पर खोज करने के लिए चैट का उपयोग करके, एक उत्कृष्ट पीपीटी बनाने के लिए कुछ वाक्यों का उपयोग करके एज को जाने दें। ब्राउज़र वेबपेज की सामग्री को एक क्लिक से सारांशित करता है …

जल्द ही, कोपिलॉट हर जगह होगा, एआई हर जगह होगा, कंप्यूटर के साथ हमारी बातचीत का अंतर्निहित तर्क टूटना शुरू हो जाता है, और एक नया इंटरैक्शन लॉजिक टूटने के लिए तैयार है, कंप्यूटर और इंटरनेट की एक नई पीढ़ी को फिर से परिभाषित करता है।

एआई के प्रकोप के बाद बिल गेट्स ने अपना फैसला सुनाया।

यह एक मूलभूत परिवर्तन है, कंप्यूटर को चीजों का वर्णन करने के लिए प्राकृतिक भाषा अब हमारा मुख्य "इंटरफ़ेस" है, जो एक बहुत बड़ा सुधार है।

दूसरे शब्दों में, साइडबार एआई सहायक एक नया सामान्य बन जाएगा, और आपकी भाषा "मैजिक पावर" जैसे माउस क्लिक और फिंगर टच के साथ एक नई इंटरैक्शन पद्धति बन जाएगी।

हालाँकि, यदि आप कोपिलॉट को AI सहायकों के नए युग के रूप में देखते हैं, तो आप Microsoft की महत्वाकांक्षाओं को कम आंकते हैं।

सॉफ्टवेयर का एक नया रूप

जैसा कि हमने पहले उल्लेख किया है, Microsoft ने Copilot को अपने कई उत्पादों से जोड़ा है, जिससे Bing, Edge और Office को नया जीवन मिला है।

इससे भी महत्वपूर्ण बात यह है कि अलग-अलग सॉफ्टवेयर में बिखरे ये सह-पायलट एक-दूसरे से स्वतंत्र नहीं हैं, बल्कि एक-दूसरे से संवाद करते हैं।

यहां हम एक बहुत ही महत्वपूर्ण अवधारणा – प्लग-इन सेट पेश करने जा रहे हैं।

आप इन बड़े भाषा मॉडल-आधारित कोपिलॉट को क्रोम ब्राउज़र के रूप में सोच सकते हैं (बेशक, यह एक बहुत ही अनुचित रूपक है), और प्लग-इन ब्राउज़र पर एक्सटेंशन हैं। तृतीय-पक्ष प्लग-इन के साथ, कोपिलॉट बहुत कुछ हासिल कर सकता है विभिन्न कार्य।

पहले, हमने ChatGPT के प्लग-इन सेट के अनुभव को विस्तार से पेश किया है। इन तृतीय-पक्ष प्लग-इन के साथ, ChatGPT भोजन का ऑर्डर देने, उड़ानों की जाँच करने और गणितीय और भौतिक समस्याओं को हल करने जैसे कार्यों को महसूस कर सकता है।

अब, इन प्लगइन्स का उपयोग बिंग, एज, ऑफिस और यहां तक ​​कि विंडोज में भी किया जा सकता है, क्योंकि ये उत्पाद समान ओपन प्लगइन मानक का उपयोग करते हैं।

सीधे शब्दों में कहें, जब तक डेवलपर्स एक बार प्लग-इन विकसित करते हैं, तब तक इसे माइक्रोसॉफ्ट कॉपिलॉट्स की एक श्रृंखला पर लागू किया जा सकता है, जो डेवलपर्स और उपयोगकर्ताओं दोनों के लिए बहुत लचीलापन लाता है।

या एक उदाहरण के रूप में व्यावहारिक अनुप्रयोग को लें।

जल्द ही, आप बिंग पर ज़िलो प्लग-इन (किराये की जानकारी क्वेरी) को कॉल कर सकते हैं, और फिर सीधे बिंग से पूछ सकते हैं, "एक्सएक्स बजट के साथ एक्स स्थान में घर किराए पर लेने के लिए अनुशंसित लिस्टिंग क्या हैं?", और बिंग सीधे संबंधित दे सकता है लिस्टिंग जानकारी।

या आप AI को एज ब्राउज़र पर आपके लिए व्यंजनों को सारांशित करने दे सकते हैं, और फिर इंस्टाकार्ट प्लग-इन को कॉल करके उन सामग्रियों को खरीद सकते हैं जिन्हें आप एक क्लिक के साथ खरीद रहे हैं।

यह जानकारी प्राप्त करने का एक बिल्कुल नया तरीका है। यह खोज इंजन से सेवा प्रदाता वेबसाइटों तक की प्रक्रिया को छोड़ देता है और फिर विशिष्ट जानकारी के लिए, सीधे आपके लिए आवश्यक सामग्री को निकालता है, और फिर इसे सीधे तरीके से आपके सामने प्रस्तुत करता है।

Copilot + प्लग-इन सेवाओं को प्राप्त करने के लिए इंटरनेट का उपयोग करने के हमारे तरीके को बदल सकते हैं।

दूसरी ओर, प्लग-इन का उपयोग उस Office सुइट में भी किया जा सकता है जिससे हम सबसे अधिक परिचित हैं।

उदाहरण के लिए, जब आप कानूनी अनुबंध का मसौदा तैयार करने के लिए वर्ड का उपयोग करना चाहते हैं, लेकिन आप स्थानीय कानूनों से परिचित नहीं हैं, तो आप विशिष्ट सामग्री का मसौदा तैयार करने और संशोधित करने में सहायता के लिए थॉमसन रॉयटर्स, वेस्टलॉ और अन्य कानूनी प्लग-इन को कॉल कर सकते हैं।

प्लग-इन सेट का उद्भव बड़े भाषा मॉडल की संभावना को समृद्ध करता है, और एक सामान्य प्लग-इन मानक प्लग-इन सेट की भूमिका को अधिकतम करता है। यह कोपिलॉट टेक्नोलॉजी स्टैक है जिसे Microsoft बना रहा है, और अंत में वे एक साथ मिलकर माइक्रोसॉफ्ट की नजर में सबसे आदर्श सह-पायलट। आकार:

सिर्फ एक नया प्रोग्राम नहीं, सिर्फ एक नया यूजर इंटरफेस नहीं, बल्कि एक नया प्लेटफॉर्म।

जैसा कि पहले उल्लेख किया गया है, बड़े भाषा मॉडल के उद्भव ने सॉफ्टवेयर को उपयोग और संचालन में अभूतपूर्व आसानी के साथ संपन्न किया है, और "एआई सहायकीकरण" सॉफ्टवेयर डिजाइन में नया सामान्य हो जाएगा।

एडोब जैसे निर्माताओं ने एआई कार्यों को अपने सॉफ्टवेयर में जोड़ना शुरू कर दिया है, और अधिक से अधिक डेवलपर्स अपने उत्पादों के लिए "कोपिलॉट" डिजाइन करने पर विचार करेंगे।

Microsoft इस तरह के एक नए अवसर का लक्ष्य बना रहा है जो अभी भी अपनी प्रारंभिक अवस्था में है। यह डेस्कटॉप सिस्टम और ऑफिस सॉफ्टवेयर में अपने उच्च बाजार हिस्सेदारी का लाभ उठाना चाहता है ताकि अपने प्रतिस्पर्धियों से पहले इस ब्रांड-नए प्लेटफॉर्म का निर्माण किया जा सके।

Microsoft CTO केविन स्कॉट ने बिल्ड कॉन्फ़्रेंस में डेवलपर्स के लिए ईमानदारी से इस भव्य विज़न का परिचय दिया। उन्होंने बिल गेट्स के एक अंश को उद्धृत किया:

किसी प्लेटफ़ॉर्म के सही मूल्य का एहसास तभी होता है जब प्लेटफ़ॉर्म द्वारा बनाए गए मूल्य का श्रेय उन लोगों को दिया जाता है जो इसे बनाते हैं, न कि स्वयं प्लेटफ़ॉर्म बनाने वालों को।

केविन स्कॉट का मानना ​​है कि GPT-4 जैसा बुनियादी मॉडल बहुत शक्तिशाली है, बहुत शक्तिशाली है, लेकिन यह सब कुछ नहीं कर सकता है, जिसके लिए अधिक डेवलपर्स को संबंधित कार्यक्रम में ऐसी तकनीक लागू करने की आवश्यकता होती है, और बड़े भाषा मॉडल का उपयोग कार्यक्रमों के निर्माण के हिस्से के रूप में करते हैं। एआई पूरी तरह से नया उपयोगकर्ता अनुभव बना सकता है।

यह कार्यक्रम विकास का एक बिल्कुल नया तरीका है। केविन स्कॉट ने एक बिंदु बनाया:

जो चीज पीसी, इंटरनेट और स्मार्टफोन को महान बनाती है वह वह नहीं है जो प्लेटफॉर्म के साथ मौजूद है, बल्कि यह है कि लोग उनके ऊपर क्या बनाते हैं।

वर्तमान में, एआई तकनीक और दुनिया के बारे में लोगों की धारणा को एक अविश्वसनीय गति से बदल रहा है। यह न केवल हमारे डेटा को संसाधित करने के तरीके को बदलता है, बल्कि मशीनों के साथ बातचीत करने के तरीके को भी पुनर्परिभाषित करता है, और यहां तक ​​कि जिस तरह से हम समस्याओं को समझते हैं और हल करते हैं। तरीका।

बड़े भाषा मॉडल का उदय पारंपरिक प्रोग्रामिंग ढांचे के माध्यम से टूट जाता है, और एआई हमारी भाषा को समझना शुरू कर देता है, हमारी जरूरतों का अनुमान लगाता है, और यहां तक ​​कि हमारी भावनाओं को भी समझता है, डेटा और एल्गोरिदम की शक्ति का उपयोग करके उन समस्याओं को हल करने के लिए जो पहले अकल्पनीय थीं।

यह विस्मयकारी है कि इस तरह के एक नए तकनीकी उथल-पुथल के सामने, 48 वर्षीय Microsoft अभी भी तकनीकी परिवर्तन में सबसे आगे है।

बकवास काटो।

#Aifaner के आधिकारिक WeChat सार्वजनिक खाते का अनुसरण करने के लिए आपका स्वागत है: Aifaner (WeChat ID: ifanr), जितनी जल्दी हो सके आपके लिए अधिक रोमांचक सामग्री प्रस्तुत की जाएगी।

ऐ फैनर | मूल लिंक · टिप्पणियाँ देखें · सिना वीबो