ये AI उत्पाद 430 मिलियन लोगों के लिए बाधाओं को तोड़ रहे हैं

हमने पहले एक लेख लिखा था – "मुझसे दोबारा मत पूछें कि बधिर लोग संगीत समारोहों में क्यों जाते हैं" , जिसने विदेशी संगीत समारोहों की विशेष स्थिति को लोकप्रिय बनाया: सांकेतिक भाषा दुभाषिए।

हालाँकि श्रवण-बाधित लोग संगीत को स्पष्ट रूप से सुन या सुन नहीं सकते हैं, वे सांकेतिक भाषा दुभाषियों के अत्यधिक संक्रामक हाथ आंदोलनों, चेहरे के भाव और शारीरिक भाषा के माध्यम से संगीत की लय और वातावरण की गर्मी को महसूस कर सकते हैं।

सुनने वाले लोगों के लिए यह एक अप्रत्याशित सांकेतिक भाषा परिदृश्य हो सकता है। वास्तव में, अभी भी कई स्थान हैं जहां ऑनलाइन और ऑफलाइन दोनों तरह से सांकेतिक भाषा दुभाषियों की आवश्यकता है, लेकिन वे पर्याप्त नहीं हैं।

सैली चाक, एक अंग्रेज, ने 2002 में एक ब्रिटिश सांकेतिक भाषा दुभाषिया कंपनी खोली। 20 वर्षों के संचालन के बाद, कंपनी काफी बड़े पैमाने पर विकसित हो गई है, और एक सांकेतिक भाषा दुभाषिया की बुकिंग का समय घटाकर 30 मिनट कर दिया गया है, लेकिन वह है अभी भी संतुष्ट नहीं हूं.

क्या श्रवण-बाधित लोगों को वीडियो वेबसाइट पर उपशीर्षक चालू करने की तरह, सांकेतिक भाषा व्याख्या तक तत्काल पहुंच मिल सकती है?

उसका उत्तर एआई को शामिल करना है।

ऑनलाइन से लेकर ऑफलाइन तक, श्रवण-बाधित लोगों को अपनी "मूल भाषा" का अधिक बार उपयोग करने की अनुमति दी जानी चाहिए

2022 में, सैली चाक ने एक नई स्टार्ट-अप कंपनी, साइनैप्स खोली, जो लिखित पाठ को वास्तविक समय में अमेरिकी सांकेतिक भाषा और ब्रिटिश सांकेतिक भाषा में अनुवाद करने के लिए जेनरेटिव एआई सांकेतिक भाषा अनुवाद सॉफ्टवेयर विकसित करने पर केंद्रित थी।

इस साल मई में, साइनैप्स को सीड राउंड फाइनेंसिंग में £2 मिलियन प्राप्त हुए, जिसमें से £500,000 ब्रिटिश सरकार से आए।

वे जिन ऑफ़लाइन परिदृश्यों को लक्षित कर रहे हैं उनमें से एक रेलवे स्टेशन और हवाई अड्डे जैसे परिवहन केंद्र हैं।

संयुक्त राज्य अमेरिका में सिनसिनाटी/उत्तरी केंटकी अंतर्राष्ट्रीय हवाई अड्डे ने स्वागत, सुरक्षा, प्रस्थान, आगमन और अन्य जानकारी प्रदान करने के लिए स्क्रीन पर अमेरिकी सांकेतिक भाषा प्रदर्शित करने के लिए साइनैप्स के साथ साझेदारी की है।

एआई कैसे काम करता है? साइनैप्स एक बड़े सांकेतिक भाषा डेटासेट पर आधारित है और आजीवन आभासी सांकेतिक भाषा दुभाषियों को बनाने के लिए जेनरेटिव एडवरसैरियल नेटवर्क (जीएएन) और गहन शिक्षण तकनीकों का उपयोग करता है जो यथासंभव सटीक अनुवाद करते हैं।

ये अवतार वास्तविक सांकेतिक भाषा दुभाषियों पर आधारित हैं, और हर बार जब इनका व्यावसायिक उपयोग किया जाता है, तो वास्तविक लोगों को छूट मिलती है।

यह ध्यान में रखते हुए कि हवाई अड्डे के गंतव्य, प्रस्थान समय और प्लेटफ़ॉर्म नंबर अक्सर बदलते रहते हैं, साइनैप्स के सांकेतिक भाषा अनुवाद को ट्रैफ़िक डेटा के साथ एकीकृत करके वास्तविक समय में अपडेट किया जा सकता है।

साथ ही, साइनैप्स ने ऑनलाइन जरूरतों को नजरअंदाज नहीं किया है और वेबसाइटों और वीडियो स्ट्रीमिंग के लिए सांकेतिक भाषा अनुवाद भी प्रदान करता है।

हालाँकि YouTube जैसी वेबसाइटों ने उपशीर्षक बंद कर दिए हैं, श्रवण-बाधित लोग अक्सर उपशीर्षक की तुलना में सांकेतिक भाषा को प्राथमिकता देते हैं क्योंकि सांकेतिक भाषा में व्याकरणिक संरचनाएं और अभिव्यक्तियाँ होती हैं जो अन्य भाषाओं से स्वतंत्र होती हैं, जिससे उनका ऑनलाइन अनुभव बेहतर हो जाता है।

आपने देखा होगा कि सांकेतिक भाषा का जिक्र करते समय हम अमेरिकी सांकेतिक भाषा और ब्रिटिश सांकेतिक भाषा का उपयोग करते हैं। जिस तरह दुनिया भर में बोली जाने वाली और लिखित भाषाएँ समझ से बाहर हैं, उसी तरह सांकेतिक भाषा सर्वव्यापी है।

संयुक्त राष्ट्र के अनुसार, दुनिया भर में लगभग 70 मिलियन लोग संचार के मुख्य रूप के रूप में सांकेतिक भाषा का उपयोग करते हैं, और दुनिया भर में 300 से अधिक विभिन्न प्रकार की सांकेतिक भाषा का उपयोग किया जाता है। अकेले संयुक्त राज्य अमेरिका में, 500,000 लोग अमेरिकी सांकेतिक भाषा का उपयोग करते हैं।

इसलिए, साइनैप्स वर्तमान में जो कर रहा है वह वास्तव में बहुत सीमित है, इसमें केवल कुछ ही लोग शामिल हैं जो अमेरिकी और ब्रिटिश सांकेतिक भाषा का उपयोग करते हैं, और सीमित ऊर्ध्वाधर परिदृश्य हैं। पिछले दो वर्षों में, साइनैप्स ने हर दिन लगभग 5,000 ब्रिटिश सांकेतिक भाषा ट्रैफ़िक घोषणाएँ की हैं।

साइनैप्स को उम्मीद है कि भविष्य में उनकी सेवाएं अधिक सार्वभौमिक होंगी, शिक्षा और अन्य परिदृश्यों तक विस्तारित होंगी, और अधिक वैयक्तिकृत भी होंगी, जिससे उपयोगकर्ता वर्चुअल साइन लैंग्वेज दुभाषियों की उपस्थिति को अनुकूलित कर सकेंगे।

पर्यावरण और परिस्थितियाँ AI का समर्थन करती हैं, और प्रमुख घरेलू निर्माताओं के पास भी समान सांकेतिक भाषा उत्पाद हैं।

एआई सांकेतिक भाषा एंकर टेनसेंट के ऑनर ऑफ किंग्स लाइव प्रसारण कक्ष और हुआवेई के डेवलपर सम्मेलन में दिखाई दिए हैं।

2022 के शीतकालीन ओलंपिक में, सीसीटीवी न्यूज और Baidu इंटेलिजेंट क्लाउड Xilin द्वारा संयुक्त रूप से बनाया गया AI साइन लैंग्वेज एंकर लॉन्च किया गया था, और तियानजिन यूनिवर्सिटी ऑफ टेक्नोलॉजी के बधिरों के लिए आर्टिफिशियल इंटेलिजेंस स्कूल ने साइन लैंग्वेज सामग्री एनोटेशन में भाग लिया था।

AI साइन लैंग्वेज एंकर के पीछे, Baidu इंटेलिजेंट क्लाउड Xiling का AI साइन लैंग्वेज प्लेटफॉर्म भी अस्पतालों, स्टेशनों, बैंकों आदि जैसे विभिन्न परिदृश्यों में तेजी से साइन लैंग्वेज अनुवाद की जरूरतों को पूरा कर सकता है, जो कि साइनैप हीरो के समान है।

अधिक सहज यात्रा, अधिक गहन देखने का अनुभव, अधिक बाधा-मुक्त सेवाएँ…

यदि सांकेतिक भाषा की व्याख्या में सुधार की गुंजाइश समुद्र से भी अधिक गहरी है, तो कम से कम जिस तरह से श्रवण-बाधित लोग सार्वजनिक जानकारी प्राप्त करते हैं, उसे एआई द्वारा बदला जा रहा है, जिसमें दृश्य तरंगें लगातार बढ़ रही हैं।

सांकेतिक भाषा की दुनिया में डुओलिंगो लोग

क्या श्रवण-बाधित लोगों को भी संगीत "सुनने" की ज़रूरत है? क्या श्रवण-बाधित लोगों के लिए पाठ पढ़ना पर्याप्त है? लोगों के तर्क सुनने के नजरिए से यह एक विशिष्ट समस्या मानी जाती है।

वास्तव में, हमें दूसरे तरीके से पूछना चाहिए: श्रवण-बाधित लोगों में भी संगीत समारोहों में भागीदारी की भावना कैसे हो सकती है? श्रवण-बाधित लोगों के लिए इंटरनेट सर्फिंग को और अधिक मनोरंजक कैसे बना सकता है?

इसलिए, ऐसा नहीं है कि व्यस्त स्टेशन पर अतिरिक्त स्क्रीन होती है, बल्कि स्क्रीन होनी चाहिए।

अधिक कंपनियाँ और अधिक व्यक्ति सांकेतिक भाषा को अधिक से अधिक प्रासंगिक बनाने के लिए प्रौद्योगिकी की शक्ति का लाभ उठा रहे हैं।

सुनने वाले लोगों को सांकेतिक भाषा सीखने देना सोचने में आसान विचारों में से एक है।

पॉपसाइन खेलते समय सांकेतिक भाषा सीखने के लिए एक ऐप है। यह एआई सांकेतिक भाषा मॉडल का उपयोग करता है और इसे Google, रोचेस्टर इंस्टीट्यूट ऑफ टेक्नोलॉजी और जॉर्जिया इंस्टीट्यूट ऑफ टेक्नोलॉजी द्वारा संयुक्त रूप से विकसित किया गया है। इसका उपयोग मुख्य उपयोगकर्ता समूह द्वारा किया जा सकता है सुनने में अक्षम बच्चे।

पाठ से सीखना कि शब्दों को याद रखना "त्याग" (छोड़ना) से शुरू होता है और छोड़ने के साथ समाप्त होता है, पॉपसाइन उबाऊ सांकेतिक भाषा वीडियो नहीं चलाता है, लेकिन सांकेतिक भाषा सीखने में आपकी रुचि और आत्मविश्वास को बढ़ाने के लिए मिनी गेम का उपयोग करता है डुओलिंगो, जो आपको चेक-इन करने के लिए आग्रह करता है।

SLAIT नामक एक अमेरिकी कंपनी भी है जो सांकेतिक भाषा की दुनिया में "डुओलिंगो" बनना चाहती है। वे गहन इंटरैक्टिव पाठ्यक्रम और परीक्षण भी प्रदान करते हैं यदि आप इसे सही पाते हैं, तो एआई ट्यूटर आपको वास्तविक समय पर प्रतिक्रिया देगा और सही मात्रा में भावनात्मक मूल्य प्रदान करेगा।

हालाँकि, SLAIT के लिए सांकेतिक भाषा पढ़ाना दूसरा सबसे अच्छा विकल्प है। शुरुआत में वे जो करना चाहते थे वह वास्तव में वास्तविक समय के वीडियो चैट और अनुवाद के लिए एक AI सांकेतिक भाषा उपकरण था।

लेकिन चावल के बिना भोजन बनाना कठिन है। SLAIT पर्याप्त डेटा या धन के बिना एक छोटी टीम है। सांकेतिक भाषा के वाक्यों का सीधे अनुवाद करने की तुलना में, व्यक्तिगत सांकेतिक भाषा शब्दावली सिखाना आसान है, लेकिन उतना ही मूल्यवान भी है।

सांकेतिक भाषा की व्याख्या करने का कठिन काम अमीर दिग्गजों पर छोड़ दिया गया है।

अगस्त 2023 में, लेनोवो ब्राज़ील ने पुर्तगाली सांकेतिक भाषा का अनुवाद करने के लिए एक एआई-आधारित वास्तविक समय चैट अनुवाद ऐप विकसित किया, और भविष्य में दुनिया भर में और अधिक सांकेतिक भाषाओं को कवर करने की योजना बनाई है।

जब कोई श्रवण-बाधित व्यक्ति डिवाइस के कैमरे के सामने हस्ताक्षर करता है, तो एल्गोरिदम तुरंत इसे पुर्तगाली पाठ में अनुवाद करेगा और दूसरे छोर पर प्राप्तकर्ता को भेज देगा।

यथासंभव ऐसे कई उपकरण होने चाहिए, जो सांकेतिक भाषा शिक्षण सेवाओं के पूरक हों और सुनने में अक्षम लोगों को अधिक सक्रिय स्थिति लेने और बातचीत के अधिक आरंभकर्ता बनने की अनुमति दें।

Google अधिक उत्पाद-उन्मुख है और उसने 2023 कागल एआई साइन लैंग्वेज रिकग्निशन प्रतियोगिता लॉन्च की है।

इस प्रतियोगिता का विषय बहुत दिलचस्प है – प्रतियोगी एक फिंगर-स्पेलिंग मॉडल बनाते हैं जो सुनने में अक्षम लोगों की सेल्फी से प्राप्त 3 मिलियन से अधिक फिंगर-स्पेलिंग वर्णों के आधार पर उंगलियों, हथेलियों और चेहरों को तुरंत ट्रैक करने के लिए स्मार्ट कैमरों का उपयोग करता है।

फिंगर स्पेलिंग एक प्रकार की सांकेतिक भाषा है जो अक्षरों को दर्शाने के लिए उंगलियों के विभिन्न आकार और स्थिति का उपयोग करती है। कई विकलांग लोगों के लिए, स्मार्टफोन के वर्चुअल कीबोर्ड पर टाइप करने की तुलना में उंगली से वर्तनी लिखना बहुत तेज़ होता है।

इसलिए, सांकेतिक भाषा की पहचान में सुधार और उंगली-वर्तनी मॉडल बनाने का उद्देश्य श्रवण-बाधित लोगों को टाइप करने और बोलने के बजाय सीधे सांकेतिक भाषा का उपयोग करने और अपने मोबाइल पर खोज, मानचित्र और पाठ संदेश जैसे कार्यों का उपयोग करने की अनुमति देना है। फ़ोन.

इसके अलावा, इससे सांकेतिक भाषा-से-वाक् अनुप्रयोगों को विकसित करने में भी मदद मिलेगी, जिससे श्रवण-बाधित लोगों के लिए डिजिटल सहायकों को बुलाने के लिए आवाज का उपयोग करने में असमर्थता का गतिरोध दूर हो जाएगा।

दूसरे शब्दों में, कई वॉयस-फर्स्ट उत्पादों ने उन उपयोगकर्ताओं पर विचार नहीं किया है जो शुरू से ही बोलने में अच्छे नहीं हैं, अब कमियों को भरने का समय आ गया है।

Google के मुख्य पहुंच अनुसंधान उत्पाद प्रबंधक सैम सेपा ने फोर्ब्स के साथ एक साक्षात्कार में उल्लेख किया कि उनका लक्ष्य Google उत्पादों का उपयोग करते समय सांकेतिक भाषा को एक सार्वभौमिक भाषा विकल्प बनाना है।

दरअसल, पूरे इंटरनेट का लक्ष्य भी यही होना चाहिए- डिजिटल दुनिया में सांकेतिक भाषा को सार्वभौमिक भाषा बनाना।

एक भाषा सीखने के सॉफ्टवेयर के रूप में, डुओलिंगो सभी को समान शैक्षिक अवसर प्रदान करता है। एआई सांकेतिक भाषा उत्पाद लोगों को यह महसूस कराते हैं कि जो प्रतिबंध नहीं होने चाहिए थे, उन्हें हटाया जा रहा है और लोग हर जगह एक-दूसरे के साथ संवाद कर सकते हैं।

AI जितना अधिक शक्तिशाली होगा, हमें मानवता को उतना ही अधिक महत्व देना होगा

मई में, जब GPT-4o जारी किया गया था, तो एक डेमो वीडियो बहुत ही मार्मिक था, GPT-4o ने आँखों की तरह काम किया, जिससे दृष्टिबाधितों को आसपास के वातावरण को "देखने" की अनुमति मिली।

दृष्टिबाधित व्यक्ति एआई के मुंह से जानता है कि बकिंघम पैलेस पर झंडे लहरा रहे हैं, बत्तखें नदी में इत्मीनान से खेल रही हैं, और एक टैक्सी आने वाली है, एआई के हर्षित स्वर के जवाब में उसके मुंह के कोने ऊपर उठ जाते हैं।

जैसा कि कहा जाता है, प्रौद्योगिकी एक नई दुनिया का द्वार खोलती है, क्या इसे इसके विपरीत समझा जा सकता है कि विकलांग लोग मूल रूप से ऐसी दुनिया में रहते थे जो उनके लिए नहीं बनाई गई थी?

डब्ल्यूएचओ के आंकड़ों से पता चलता है कि दुनिया भर में 430 मिलियन लोगों को अक्षम श्रवण हानि के समाधान के लिए पुनर्वास उपचार की आवश्यकता है। संयुक्त राज्य अमेरिका में सांकेतिक भाषा दुभाषियों की संख्या पर्याप्त नहीं है, श्रवण-बाधित उपयोगकर्ताओं और अमेरिकी सांकेतिक भाषा दुभाषियों का अनुपात लगभग 50 से 1 है।

तो अभी के लिए, एआई सांकेतिक भाषा केवल एक पूरक और सोने पर सुहागा की भूमिका निभाती है, और अभी तक "नौकरियां चुराने" के बिंदु पर नहीं है।

ऊपर उल्लिखित एआई सांकेतिक भाषा उत्पाद मूल रूप से छोटे पैमाने के, ऊर्ध्वाधर और विशिष्ट क्षेत्रों में निहित हैं, जो मानव दुभाषियों की दुर्गमता को पूरा करते हैं।

पिछले महीने, मैंने एक बढ़िया AI सांकेतिक भाषा उत्पाद भी देखा।

रटगर्स विश्वविद्यालय और कार्नेगी मेलन विश्वविद्यालय सहित कई विश्वविद्यालयों के शोधकर्ताओं ने सार्वजनिक सांकेतिक भाषा वीडियो को 8 सांकेतिक भाषाओं वाले डेटा सेट में संसाधित किया और पहले बहुभाषी सांकेतिक भाषा पीढ़ी मॉडल, साइनएलएलएम को प्रशिक्षित किया।

यह विभिन्न प्रकार की सांकेतिक भाषाओं को शामिल करता है और टेक्स्ट प्रॉम्प्ट शब्दों के माध्यम से सांकेतिक भाषाएँ उत्पन्न कर सकता है। क्या यह बहुत सुविधाजनक नहीं है? हालांकि, शोधकर्ताओं ने कहा कि बाहरी दुनिया को उनके शोध परिणामों को बढ़ा-चढ़ाकर पेश नहीं करना चाहिए। प्रदर्शन वीडियो मॉडल का प्रत्यक्ष आउटपुट नहीं है, और इसे वास्तव में उत्पादित करना अभी भी बहुत परेशानी भरा है।

साथ ही, कुछ श्रवण-बाधित विशेषज्ञ आगे आए हैं और कहा है कि इन वीडियो में सांकेतिक भाषा अनुवाद की गुणवत्ता अलग-अलग है, कुछ आधे-अधूरे हैं, कुछ पूरी तरह से समझ में नहीं आते हैं, और परियोजना में चेहरे के भावों की कमी है सुधार की जरूरत है.

सबसे महत्वपूर्ण बात यह है कि श्रवण-बाधित उपयोगकर्ताओं को भाग लेने, अपनी राय व्यक्त करने और संयुक्त रूप से उत्पाद में सुधार करने की अनुमति देना है, क्योंकि "हमारी भागीदारी के बिना, हमारे बारे में कोई निर्णय नहीं होगा।"

एक सूक्ष्म भावना यह है कि बाधा-मुक्त उत्पादों को "सेक्सी" बनाना मुश्किल लगता है।

वे अक्सर बड़े मॉडल और एआई हार्डवेयर के रिलीज के समान रोमांचक नहीं होते हैं। वे हमेशा आपको बताते हैं कि उनके पास क्या कार्य हैं और वे किसकी सेवा करते हैं। वे भविष्य में बेहतर प्रदर्शन करने की उम्मीद करते हैं और "जितना वे चबा सकते हैं उससे अधिक नहीं काटेंगे।"

और उद्यम पूंजी की नजर में, वे भी विशिष्ट हैं, उनमें अज्ञात क्षमता है, और निवेश पर रिटर्न नहीं हो सकता है।

लेकिन "एआई गॉडमदर" ली फेइफी ने एक बार कहा था कि एआई लोगों की मदद करने के लिए है। एआई जितना अधिक शक्तिशाली होगा, हमें मानवता को उतना ही अधिक महत्व देना चाहिए।

हर किसी को उड़ान छूटने का डर नहीं होना चाहिए, हर किसी को उत्पादों के साथ बातचीत करने में सक्षम होना चाहिए, और हर किसी को संगीत समारोहों का आनंद लेना चाहिए।

जो चीजें कभी अदृश्य और अनसुनी थीं, उन्हें भी तकनीक की रोशनी से रोशन किया जाना चाहिए। आइए प्रतिध्वनि में अपनी उंगलियां चटकाएं, ताकि अधिक लोगों की ज़रूरतें पूरी हो सकें, अधिक लोगों की क्षमताओं को बढ़ाया जा सके, ताकि हम अधिक प्राप्त कर सकें और कम खो सकें।

यह शरद ऋतु की ठंढ के समान तीव्र है और बुरी आपदाओं को दूर कर सकता है। कार्य ईमेल: [email protected]

# Aifaner के आधिकारिक WeChat सार्वजनिक खाते का अनुसरण करने के लिए आपका स्वागत है: Aifaner (WeChat ID: ifanr) आपको जल्द से जल्द अधिक रोमांचक सामग्री प्रदान की जाएगी।

ऐ फ़ैनर | मूल लिंक · टिप्पणियाँ देखें · सिना वीबो