फेसबुक ने एक नए ओपन-सोर्स एआई मॉडल का अनावरण किया जिसमें 100 विभिन्न भाषाओं के बीच अनुवाद करने की क्षमता है। इसके एआई मॉडल को और अधिक कुशल और सटीक अनुवाद के लिए अनुमति देते हुए, मौजूदा पाठ को अंग्रेजी में बदलने की आवश्यकता नहीं है।
प्रस्तुत है टेक्स्ट ट्रांसलेट करने का एक नया तरीका
अबाउट फ़ेसबुक पोस्ट में, प्लेटफ़ॉर्म ने अपने नए बहुभाषी मशीन अनुवाद (MMT) मॉडल को विस्तृत किया, जिसे M2M-100 के रूप में भी जाना जाता है। प्रभावशाली रूप से, यह ओपन-सोर्स मशीन लर्निंग मॉडल "अंग्रेजी डेटा पर भरोसा किए बिना 100 भाषाओं के किसी भी जोड़े के बीच अनुवाद कर सकता है।"
हालांकि यह अभी भी एक शोध परियोजना है, यह बहुत सारे वादे को दर्शाता है। फेसबुक पर अनुसंधान सहायक एंजेला फैन ने कहा कि "विशिष्ट" मशीन अनुवाद मॉडल हर भाषा के लिए विभिन्न मॉडलों का उपयोग करते हैं, जिससे वे फेसबुक जैसे बड़े प्लेटफार्मों के लिए अविश्वसनीय रूप से अक्षम हो जाते हैं।
यहां तक कि उन्नत मॉडल भी इसे नहीं काटते हैं, क्योंकि वे अंग्रेजी का उपयोग भाषाओं के बीच एक बिचौलिए के रूप में करते हैं। इसका मतलब यह है कि सिस्टम को पहले स्रोत पाठ को अंग्रेजी में अनुवाद करना होगा, और उसके बाद लक्ष्य भाषा में अनुवाद करना होगा।
अंग्रेजी-संबंधित मॉडल सर्वश्रेष्ठ अनुवाद का उत्पादन नहीं करते हैं। फैन ने ध्यान दिया कि अंग्रेजी को तस्वीर से बाहर निकालने से, फेसबुक की एमएमटी प्रणाली अधिक सटीक अनुवाद प्रस्तुत कर सकती है:
अनुवाद करते समय, चीनी से फ्रेंच में, अधिकांश अंग्रेजी-केंद्रित बहुभाषी मॉडल चीनी से अंग्रेजी और अंग्रेजी से फ्रेंच पर प्रशिक्षण देते हैं, क्योंकि अंग्रेजी प्रशिक्षण डेटा सबसे व्यापक रूप से उपलब्ध है। हमारा मॉडल सीधे चीनी से लेकर फ्रांसीसी डेटा तक बेहतर अर्थ को संरक्षित करने के लिए प्रशिक्षित करता है।
इसलिए एक पुल के रूप में अंग्रेजी का उपयोग करने के बजाय, फेसबुक का एमएमटी मॉडल 100 अलग-अलग भाषाओं के बीच आगे और पीछे अनुवाद कर सकता है। फैन के अनुसार, फेसबुक ने "सबसे विविध कई-से-कई एमएमटी डेटा सेट अप टू डेट हैं", जिसमें 100 भाषाओं के लिए 7.5 बिलियन वाक्य जोड़े शामिल हैं।
इस उपलब्धि को पूरा करने के लिए, अनुसंधान टीम ने वेब पर भाषा अनुवाद डेटा का खनन किया, सबसे पहले "सबसे अधिक अनुवाद अनुरोधों के साथ" भाषाओं पर ध्यान केंद्रित किया। शोधकर्ताओं ने उन भाषाओं को साझा विशेषताओं के आधार पर 14 समूहों में वर्गीकृत किया।
यहां से, शोधकर्ताओं ने प्रत्येक समूह के लिए पुल भाषाओं की स्थापना की, और सभी संभव संयोजनों के लिए प्रशिक्षण डेटा का खनन किया। इसके परिणामस्वरूप 2,200 दिशाओं में 7.5 बिलियन समानांतर वाक्य बने।
और उन भाषाओं के लिए जो व्यापक नहीं हैं, फेसबुक ने सिंथेटिक अनुवाद बनाने के लिए बैक-ट्रांसलेशन नामक कुछ का उपयोग किया।
यह पूरी प्रक्रिया फेसबुक एआई टीम को एक "एकल मॉडल बनाने के अपने लक्ष्य के करीब ला रही है जो सभी भाषाओं, बोलियों और तौर-तरीकों का समर्थन करता है।"
बेहतर अनुवाद प्रदान करने के लिए फेसबुक क्लोजर हो जाता है
फेसबुक पहले से ही अपने न्यूज फीड पर हर दिन 20 बिलियन अनुवाद करता है, और फेसबुक एआई केवल प्रक्रिया को और अधिक कुशल बनाएगा। हालांकि नए अनुवाद मॉडल को अभी तक लागू नहीं किया गया है, यह निश्चित रूप से अंतरराष्ट्रीय फेसबुक उपयोगकर्ताओं के लिए काम आएगा, जिन्हें विशिष्ट अनुवादों की आवश्यकता है।