شركة ميتا تطلق أول نظام ترجمة الخطاب الشفهي مدعوم من الذكاء الاصطناعي للغة غير مكتوبة
أعلنت شركة (ميتا) إطلاق أول نظام ترجمة الخطاب الشفهي مدعوم من الذكاء الاصطناعي للغة غير مكتوبة.
وأوضحت (ميتا) اليوم الأربعاء أنه حتى الآن، ركزت ترجمة الذكاء الاصطناعي على اللغات المكتوبة. ومع ذلك، من بين أكثر من 7,000 لغة حية، فإن أكثر من 40٪ من اللغات تعد لغات شفهية ومنطوقة في المقام الأول، وليس لديها نظام قياسي أو معروف على نطاق واسع للكتابة.
وأشارت إلى أن مشروع مترجم الخطاب الشفهي العالمي (UST) من ميتا يركز على تطوير أنظمة ذكاء اصطناعي توفر ترجمة من-الخطاب-إلى-الخطاب (speech-to-speech) الفورية عبر جميع اللغات، حتى اللغات المنطوقة بشكل أساسي.
ونوهت الشركة إلى أن القدرة على التحدث إلى البشر بلغات مختلفة دون الحاجة لقضاء سنوات من الدراسة هو حلم طال انتظاره. يمكن أن تساعد الاتصالات المنطوقة في كسر الحواجز وجمع البشر معاً أينما كانوا – حتى في الميتافيرس. لقد اتخذنا خطوة أخرى نحو هذا الهدف مع UST، وهو أول نظام ترجمة من الخطاب-إلى-الخطاب مدعوم بالذكاء الاصطناعي تم تطويره للغة غير مكتوبة.
وقام باحثو ميتا في مجال الذكاء الاصطناعي ببناء أنظمة ترجمة مفتوحة المصدر للغة الهوكين، وهي واحدة من اللغات الرسمية في تايوان ويتم التحدث بها على نطاق واسع داخل منطقة الشتات الصيني، ولكنها تفتقر إلى شكل قياسي مكتوب.
وأوضحت ميتا أن هذه التقنية تسمح للمتحدثين بلغة الهوكين بإجراء محادثات مع الأشخاص الذين يتحدثون الإنجليزية.. ولتطوير نظام الترجمة الجديد هذا والمخصص للخطاب الشفهي فقط، كان على باحثي الذكاء الاصطناعي في ميتا التغلب على العديد من التحديات في أنظمة الترجمة الآلية التقليدية، بما في ذلك جمع البيانات، تصميم النماذج، والتقييم.
وتابعت ميتا: “كان جمع البيانات الكافية عقبة كبيرة واجهناها عند الشروع في بناء نظام ترجمة الهوكين. الهوكين هي ما يعرف باسم لغة ناقصة الموارد، مما يعني أنه لا توجد إمدادات كافية من بيانات التدريب المتاحة بسهولة، مقارنة بالإسبانية أو الإنجليزية على سبيل المثال.
بالإضافة إلى ذلك، هناك عدد قليل نسبياً من المترجمين البشريين من اللغة الإنجليزية إلى الهوكين، مما يجعل من الصعب جمع البيانات وتفسيرها لتدريب النموذج.. قمنا بالاستفادة من لغة الماندرين كلغة وسيطة لبناء تسميات مستعارة، حيث قمنا أولاً بترجمة الخطاب بالإنجليزية (أو الهوكين) إلى نص بلغة الماندرين، ثم ترجمنا إلى الهوكين (أو الإنجليزية) وأضفناه إلى بيانات التدريب. حسنت هذه الطريقة بشكل كبير من أداء النموذج عبر الاستفادة من البيانات من لغة مماثلة عالية الموارد”.
ولفتت إلى أن استخراج الخطاب هو نهج آخر للتدريب على زيادة البيانات. باستخدام برنامج تشفير الخطاب المدرب مسبقاً، ويمكن تشفير تضمينات خطاب الهوكين في نفس المساحة الدلالية مثل تضمين النص الإنجليزي، وموائمة خطاب الهوكين مع النصوص الإنجليزية التي تتشابه تضميناتها الدلالية.. وتوليف الخطاب الإنجليزي من النصوص، ما يؤدي إلى خطاب متوازي ما بين الهوكين والإنجليزية.
كما تعتمد العديد من أنظمة ترجمة الخطاب على النص المكتوب، أو هي بالأساس أنظمة تحويل الخطاب إلى نص، ولكن اللغات غير المكتوبة ليس لها أشكال قياسية مكتوبة.. وهذا يعني أن إنتاج نص منسوخ كناتج ترجمة ليس منطقيًا، وبالتالي، نركز على الترجمة من الخطاب إلى الخطاب.
المصدر : أ ش أ