باسم "نماذج الكلام الضخمة المتعددة اللغات" (MMS)، والتي تستطيع التعرف على أكثر من 4000 لغة حول العالم. وتأتي هذه الخطوة في إطار حملة الشركة للحفاظ على اللغات من الانقراض، وتوفير خدمات تعرف الكلام وتوليدها بلغات مختلفة.
وتعتمد تقنية MMS على الذكاء الاصطناعي لتحويل النص إلى كلام والعكس بأكثر من 1100 لغة، بزيادة عشرة أضعاف على ما كان متاحًا في السابق، وتستقدم خدمات متعددة للمستخدمين، مثل خدمات المراسلة وتقنيات الواقع الافتراضي والواقع المعزز، بحيث ستفهم كل الأصوات، وتخدم المستخدم بلغته المفضلة.
وتشير ميتا إلى أن تدريب نماذج تعرّف الكلام وتحويل النص إلى كلام يتطلب آلاف الساعات من التسجيلات الصوتية مع النصوص المفرّغة المصاحبة لها، وهذا أمر ضروري للغاية، حتى تفهم الخوارزميات النصوصَ وتصنفها بشكل صحيح.
ولجأت الشركة إلى استخدام طرق غير تقليدية من أجل جمع التسجيلات الصوتية للغات الأقل انتشارًا، حيث جمعت التسجيلات الصوتية للنصوص الدينية المترجمة إلى مختلف اللغات، وأرفقت تلك التسجيلات مع الترجمات المعتمدة، مما سمح للشركة بالحصول على 32 ساعة من البيانات للغات الأقل انتشارًا، وزيادة إجمالي اللغات في النماذج إلى أكثر من 4000 لغة.