कैट स्पीच ट्रांसलेशन ऐप्स कैसे काम करते हैं?

आपने शायद ऐसे ऐप्स देखे हैं जो दावा करते हैं कि आपकी बिल्ली क्या कह रही है। लेकिन क्या वे वास्तव में आपकी बिल्ली की म्याऊ का अंग्रेजी में अनुवाद कर सकते हैं? संक्षिप्त उत्तर हां, की तरह है। यह मुश्किल है कि प्रत्येक बिल्ली की "भाषा" कितनी अनोखी है, लेकिन वे आधुनिक तकनीक के साथ बहुत करीब हो सकते हैं।

MeowTalk जैसे कैट अनुवाद एप्लिकेशन भाषण मान्यता के एक प्रकार का उपयोग करते हैं जो मशीन सीखने पर जोर देता है। आइए करीब से देखें।

भाषण पहचान और मशीन लर्निंग

स्पीच रिकग्निशन भाषण को रिकॉर्ड करके और ऑडियो को डिजिटल डेटा फ़ाइल में बदलकर काम करता है। यह डेटा और पिच और वॉल्यूम जैसे डेटा को इंगित करता है क्योंकि ऐप विश्लेषण कर सकता है और अर्थ के साथ मेल खा सकता है। डीपीए माइक्रोफोन यह बताता है कि ये डेटा पॉइंट पृष्ठभूमि की आवाज़ और किसी शब्द के बोलने के तरीके के आधार पर बहुत भिन्न दिख सकते हैं।

हम कभी-कभी आवाज पहचानने की अनुमति देते हैं, लेकिन यह प्रौद्योगिकी का एक अविश्वसनीय पराक्रम है। विशेष रूप से यह देखते हुए कि मानव भाषण कितना जटिल है। जैसा कि द साइंटिस्ट बताते हैं, प्रत्येक शब्द में कई तरह की ध्वनियाँ होती हैं या "फ़ोनेम्स" एक दूसरे में मिश्रित होते हैं। भाषण समझने के लिए कंप्यूटर प्राप्त करना बहुत मुश्किल है। बिल्ली की आवाज़ की नई सीमा और भी कठिन होगी।

एप्लिकेशन जो वाक् पहचान का उपयोग करते हैं, उन्हें एक शब्दकोष की "शब्दावली" के साथ क्रमादेशित किया जाता है। ऐप तब आपके भाषण को उसकी डेटा-शब्दावली में निकटतम विकल्प से मेल खाता है।

जब यह एक गलती करता है, तो आप इसे सही करते हैं, और यह अगली बार उस डेटा को बचाता है। यह मशीन लर्निंग का हिस्सा है। यह है कि कैसे एक कार्यक्रम भाषण को पहचानना सीखता है, भले ही यह उस डेटासेट के समान न हो जो इसके साथ शुरू हुआ था।

संबंधित: मशीन लर्निंग एल्गोरिदम क्या हैं? यहां बताया गया है कि वे कैसे काम करते हैं

आवाज पहचान में अभी भी समस्याएं हैं, विशेष रूप से भाषण बाधाओं और लहजे के साथ। कुछ कंपनियां इन मुद्दों को दूर करने के लिए मशीन लर्निंग में सुधार कर रही हैं , हालांकि। समय के साथ, मशीन लर्निंग वाक् पहचान को एक शक्तिशाली उपकरण में बदल सकती है।

इस तरह भाषण मान्यता मनुष्यों के लिए काम करती है। लेकिन क्या यह बिल्लियों के लिए काम करता है?

भाषण मान्यता बनाम मेव मान्यता

सबसे पहले, हमें यह समझने की ज़रूरत है कि "मैं भूखा हूँ" के रूप में एक निश्चित प्रकार के म्याऊ का अनुवाद करना मानव भाषण का विश्लेषण करने से अलग क्यों है। समस्या ज्यादातर यह है कि बिल्ली संचार आसन जैसे अशाब्दिक संकेतों पर अधिक निर्भर करता है। एक और समस्या एक सार्वभौमिक "बिल्ली भाषा" की अनुपस्थिति है।

ASPCA के अनुसार, वयस्क मादा बिल्लियाँ कभी भी एक-दूसरे पर हाथ नहीं उठाती हैं, केवल लोगों पर। ह्यूमेन सोसाइटी के अन्य शोध कहते हैं कि वे आवाज़ें "शून्य में नहीं होती हैं।" हमें उनकी व्याख्या बॉडी लैंग्वेज और अन्य संदर्भों के साथ करनी चाहिए। कई मामलों में, ये मूक संकेत एक म्याऊ के बीच का एकमात्र अंतर है जिसका अर्थ है "मैं भूखा हूं" और एक का अर्थ है "मैं खेलना चाहता हूं।"

इस समस्या को जोड़ते हुए, किसी भी दो बिल्लियों की एक ही भाषा नहीं है। बिल्लियाँ अपने मालिकों के लिए व्यक्तिगत "भाषाएं" विकसित करती हैं। ये आंशिक रूप से मालिक की आवाज़ की नकल पर और आंशिक रूप से बिल्ली के व्यक्तित्व पर आधारित हैं। कोई भी दो बिल्लियाँ समान ध्वनि नहीं करती हैं, यहाँ तक कि एक ही चाहत या आवश्यकता को व्यक्त करते समय भी। तो उन सभी के लिए एक ऐप की स्पीच शब्दावली का अनुवाद कैसे किया जा सकता है?

बिल्लियों के लिए लचीली मशीन सीखना

हालांकि जैसे कुछ आभासी सहायकों ओटो स्वर और भावनाओं को समझने का प्रयास, भाषण मान्यता अभी भी अशाब्दिक संकेतों पर भयानक है। लेकिन इसका मतलब यह नहीं है कि उन्हें व्याख्या करना असंभव है।

MeowTalk इन मुद्दों को दूर करने में मदद करने के लिए अधिक लचीली तरह की मशीन सीखने का उपयोग करता है।

Download: Android के लिए MeowTalk | iOS (निःशुल्क)

मेवॉकल को जेवियर सांचेज ने बनाया था, जो एलेक्सा टीम में भी काम करते थे। उन्होंने स्मार्ट कॉलर की ओर एक कदम के रूप में ऐप की कल्पना की। ये कॉलर मानव ध्वनियों में बिल्ली की आवाज़ का अनुवाद करेंगे, जटिल मशीन सीखने की रणनीतियों पर ड्राइंग करेंगे ताकि मनुष्यों को अपनी बिल्लियों के लिए बेहतर समझ और देखभाल मिल सके।

मेवॉक टीम ने प्रत्येक बिल्ली के लिए अधिक विशिष्ट प्रोफाइल बनाकर विशिष्टता मुद्दों की भरपाई की। ऐप में, आप प्रत्येक बिल्ली को अलग से पंजीकृत करते हैं। विज्ञान नॉर्वे की रिपोर्ट है कि बिल्ली के बच्चे वयस्क बिल्लियों की तुलना में अलग तरह से म्याऊ करते हैं, इसलिए ऐप बिल्ली के जन्मदिन के लिए भी पूछता है। प्रत्येक प्रोफ़ाइल बिल्ली के लिए एक अद्वितीय डेटा नेटवर्क उत्पन्न करता है, जिसमें मशीन सीखने में थोड़ी सी गहराई शामिल होती है।

संबंधित: डीप लर्निंग बनाम मशीन लर्निंग बनाम एआई: वे एक साथ कैसे चलते हैं?

शब्दावली के लिए, MeowTalk अपने डेटासेट में 10 साउंड प्रोफाइल से शुरू होता है। प्रत्येक का एक अलग अर्थ जुड़ा होता है, जैसे "खुश" या "शिकार"। जब ऐप ध्वनि सुनता है और गलत हो जाता है, तो आप इसे सही कर सकते हैं या एक नई व्याख्या बना सकते हैं।

आधार सही शब्दावली को नई ध्वनि के साथ बदलने के लिए एप्लिकेशन को बताता है।

उदाहरण के लिए, आप एक लंबी यॉर्ल के बजाय शॉर्ट हिरप्स को "हंटिंग" से मैच करने के लिए ऐप बता सकते हैं। इस तरह का सुधार एक ध्वनि के साथ मेल खाने के लिए कई ध्वनियों को जोड़ने से अधिक उपयोगी है, जिस तरह से भाषण मान्यता डो, जो ऐप को यह बताने जैसा होगा कि एक लंबी yowl और छोटी दोनों chirps का अर्थ है "मदर कॉल।"

स्पीच रिकग्निशन ऐप्स में मशीन लर्निंग आमतौर पर इस प्रकार की ओवरराइटिंग का विरोध करती है। यह सिरी को सिखाने की कोशिश करने जैसा होगा कि जब आप कहते हैं "प्रौद्योगिकी ब्लॉग," आप वास्तव में "नाशपाती" का मतलब है। लेकिन मशीन लर्निंग का अधिक लचीला रूप जो मेवॉक का उपयोग करता है, इस सुधार को अधिक आसानी से संभाल सकता है।

एक नई व्याख्या बनाना एक अर्थ जोड़ता है जो पहले एनकोडेड नहीं था। उदाहरण के लिए, यदि आपकी पसंदीदा खिलौना के लिए आपकी बिल्ली को एक विशिष्ट कॉल है, तो आप एक विकल्प के रूप में "मुझे अपना माउस चाहिए" जोड़ सकते हैं। यह आपके स्वतः पूर्ण शब्दकोश में एक शब्द जोड़ने के समान है।

संबंधित: एंड्रॉइड पर अपनी खुद की स्वतः पूर्ण शब्दों को कैसे परिभाषित करें

समय के साथ, आप अपनी बिल्ली के लिए एक अत्यधिक व्यक्तिगत भाषण प्रोफ़ाइल विकसित कर सकते हैं। आखिरकार, यह पालतू जानवरों के लिए उपयोगी होने या व्यवहार संबंधी मुद्दों को हल करने के लिए पर्याप्त परिष्कृत हो सकता है। अगर और कुछ नहीं, तो यह बिल्ली मालिकों को अपने पालतू जानवरों के प्रति अधिक चौकस रहने में मदद करता है।

फैसला: क्या कैट ट्रांसलेशन ऐप्स काम करते हैं?

अंत में, "बिल्ली अनुवाद" अभी भी ऐप सिखाने वाले उपयोगकर्ता पर बहुत अधिक निर्भर करता है कि उनकी बिल्ली कैसे बात करती है। शायद यह हमेशा मामला होगा क्योंकि प्रत्येक बिल्ली का संचार कितना अनूठा है।

लेकिन तथ्य यह है कि मशीन लर्निंग अब तक आया है कि डेवलपर्स भी आंशिक रूप से सफल हो सकते हैं यह अविश्वसनीय है। मशीन लर्निंग और एआई ब्रेकनेक गति से आगे बढ़ रहे हैं, और हम यह देखने के लिए इंतजार नहीं कर सकते कि वे आगे कहां जाते हैं।