“ميتا” تكشف عن نماذج ذكاء اصطناعي جديدة تتعرف على أكثر من 4000 لغة

أعلنت شركة “ميتا” المالكة لموقعي فيسبوك وإنستغرام للتواصل الاجتماعي، عن نماذج ذكاء اصطناعي جديدة (AI) مفتوحة المصدر، قادرة على معرفة أكثر من 4000 لغة منطوقة حول العالم، وهي زيادة تقدر بـ40 ضعفا مقارنة بأي تقنيات سابقة معروفة.
وقالت الشركة في بيان نشرته عبر موقعها الرسمي “تتعرض العديد من لغات العالم لخطر الاختفاء، ولن تؤدي القيود المفروضة على تقنية تعرف الكلام وتوليده حاليًّا إلا إلى تسريع هذا الاتجاه”.
وقد جعلت “ميتا” نماذجها الجديدة مفتوحة المصدر، حتى يتمكن الباحثون من الوصول إليها والمساهمة في تطويرها، من أجل المساعدة على الحفاظ على لغات العالم، وتقريب العالم بعضه من بعض.
A Meta apresentou hoje um modelo de IA capaz de identificar mais de 1.100 línguas. Isso é gigante, se a gente pensar que os modelos anteriores trabalhavam com 100 línguas.
Mas gostei mesmo da sacada que tiveram para treinar o modelo. Vou explicar. +https://t.co/Z6XzkFo1VV
— Diogo Cortiz (@DiogoCortiz) May 23, 2023
تحويل النص إلى كلام والعكس
وتعمل نماذج الكلام المتعدد اللغات (MMS) هذه على توسيع تقنية تحويل النص إلى كلام وتحويل الكلام إلى نص من حوالي 100 لغة إلى أكثر من 1100 لغة -أي أكثر مما كان متاحًا من قبل بـ10 أضعاف- وهو ما يجعلها توفر في المتوسط 32 ساعة من البيانات لكل لغة. كما يمكن استخدام هذا النوع من التكنولوجيا لتطبيقات VR وAR باللغة المفضلة للشخص التي يمكنها فهم أصوات الجميع.
وهناك العديد من المجالات التي قد تستخدم فيها تقنيات الكلام المستندة إلى الذكاء الاصطناعي، مثل خدمات المراسلة وتقنيات الواقع الافتراضي والواقع المعزز، إذ ستفهم كل الأصوات وتخدم المستخدم بلغته المفضلة.
تحدي اللهجات
وتتطلب نماذج تعرف الكلام وتحويل النص إلى كلام تدريبًا على آلاف الساعات من التسجيلات الصوتية مع النصوص المفرغة المصاحبة لها وهذا أمر ضروري للغاية، حتى تفهم الخوارزميات النصوص وتصنفها بشكل صحيح.
وتسعى “ميتا” مستقبلًا إلى دعم المزيد من اللغات في نماذجها اللغوية المعتمدة على الذكاء الاصطناعي، إضافة إلى جعلها قادرة على التعامل مع اللهجات المختلفة لكل لغة، الأمر الذي لا يزال يشكل تحديًا صعبًا لتقنية الكلام الحالية.