कुछ महीनों में Ai को लेकर कई बड़े बजलाव देखने को मिले हैं।
मेटा नें सिलसिले को जारी रखते हुए मेटा ने भी एक नया एक मॉडल पेश किया है।
1,100 से अधिक भाषाओं के लिए स्पीच-टू-टेक्स्ट, टेक्स्ट-टू-स्पीच एआई मॉडल पेश किए , जो ओपन सोर्स डेटा भी साझा करता है। जी हां अधिकांश अन्य बड़ी टेक कंपनियों की तरह,
(एआई) पर बड़ा दांव लगा रही है। AI के लिए कंपनी का दृष्टिकोण Google और Microsoft से थोड़ा अलग रहा है। आइये, इसके बारे में जानते हैं।
दुनिया भर की भाषाओं को संरक्षित करने के उद्देश्य से एक नए लार्ज लैंग्वेज मॉडल (LLM) का अनावरण किया। इसे Massively Multilingual Speech (MMS) कहा जाता है।
स्पीच-टू-टेक्स्ट तकनीक को लगभग 100 भाषाओं से 1,100 से अधिक तक बढ़ा दिया है, जो पहले की तुलना में 10 गुना अधिक है। इसके साथ ही यह 4,000 से अधिक बोली जाने वाली भाषाओं की पहचान भी कर सकता है, ,
दुनिया की कई भाषाएं लुप्त होने के खतरे में हैं, इस प्रवृत्ति को और तेज करेंगी। कंपनी ने ब्लॉग में कहा कि हम लोगों के लिए अपनी पसंदीदा...
आज हम आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल की एक सीरीज की घोषणा कर रहे हैं, जो उन्हें ऐसा करने में मदद कर सकती है।
सबसे बड़ी चुनौती सबसे बड़ा मौजूदा भाषण डेटासेट अधिकतम 100 भाषाओं को कवर करता है। उदाहरण के लिए, धार्मिक ग्रंथों, जैसे कि बाइबिल, का कई अलग-अलग भाषाओं में अनुवाद किया गया है
अध्ययन किया गया है। मेटा में इन अनुवादों में विभिन्न भाषाओं में इन ग्रंथों को पढ़ने वाले लोगों की ऑडियो रिकॉर्डिंग सार्वजनिक रूप से उपलब्ध है।
MMS प्रोजेक्ट के तहत हमने 1,100 से अधिक भाषाओं में न्यू टेस्टामेंट के रीडिंग का डेटासेट बनाया, जो प्रति भाषा औसतन 32 घंटे डेटा देता है। ईसाई धार्मिक रीडिंग के लेबल रहित रिकॉर्डिंग पर विचार किया और 4,000 से अधिक उपलब्ध भाषाओं की संख्या में वृद्धि की।
एक विशिष्ट डोमेन से है और अक्सर पुरुष वक्ताओं द्वारा पढ़ा जाता है, हमारे से पता चलता है कि हमारे मॉडल पुरुष और महिला आवाजों के लिए समान रूप से अच्छा काम करते हैं।
हमारे विश्लेषण से पता चलता है कि यह मॉडल को और अधिक धार्मिक भाषा बनाने के लिए पक्षपात नहीं करता है।