Loading...

  • 21 Sep, 2024

میٹا کی AI درجنوں کم وسائل والی زبانوں کا ترجمہ کر سکتی ہے

میٹا کی AI درجنوں کم وسائل والی زبانوں کا ترجمہ کر سکتی ہے

میٹا کے مصنوعی ذہانت ماڈل کی ٹیکنالوجی، جو 200 مختلف زبانوں کا ترجمہ کر سکتی ہے، نیچر میں شائع ہونے والے ایک مقالے میں بیان کی گئی ہے۔ یہ ماڈل مشین ترجمے کے ذریعے ترجمہ کی جانے والی زبانوں کی تعداد میں اضافہ کرتا ہے۔

نیورل مشین ترجمے کے ماڈل زبانوں کا ترجمہ کرنے کے لئے مصنوعی نیورل نیٹ ورکس کا استعمال کرتے ہیں۔ ان ماڈلز کو تربیت دینے کے لئے عام طور پر بڑی مقدار میں آن لائن دستیاب ڈیٹا کی ضرورت ہوتی ہے، جو بعض زبانوں کے لیے عوامی، سستا یا عام طور پر دستیاب نہیں ہو سکتا، جنہیں "کم وسائل والی زبانیں" کہا جاتا ہے۔ ایک ماڈل کی لسانی آؤٹ پٹ میں اضافہ، یعنی وہ زبانوں کی تعداد جس کا وہ ترجمہ کرتا ہے، ماڈل کے ترجموں کے معیار کو منفی طور پر متاثر کر سکتا ہے۔

مارٹا کوسٹا-جسا اور نو لینگویج لیفٹ بیہائنڈ (NLLB) ٹیم نے ایک کراس-لینگویج اپروچ تیار کی ہے، جو نیورل مشین ترجمے کے ماڈلز کو کم وسائل والی زبانوں کا ترجمہ کرنا سکھاتی ہے، ان کی پہلے سے موجود اعلی وسائل والی زبانوں کے ترجمے کی صلاحیت کا استعمال کرتے ہوئے۔

اس کے نتیجے میں، محققین نے ایک آن لائن کثیر لسانی ترجمے کا ٹول تیار کیا ہے، جسے NLLB-200 کہا جاتا ہے، جو 200 زبانیں شامل کرتا ہے، ان میں سے تین گنا زیادہ کم وسائل والی زبانیں ہیں جتنی کہ زیادہ وسائل والی زبانیں، اور پچھلے سسٹمز سے 44% بہتر کارکردگی کا مظاہرہ کرتا ہے۔

چونکہ محققین کو بہت سی کم وسائل والی زبانوں کے صرف 1,000–2,000 نمونوں تک رسائی حاصل تھی، NLLB-200 کے لیے تربیتی ڈیٹا کے حجم میں اضافہ کرنے کے لیے انہوں نے ایک زبان کی شناخت کے نظام کا استعمال کیا تاکہ ان مخصوص بولیوں کے زیادہ نمونے تلاش کیے جا سکیں۔ ٹیم نے انٹرنیٹ آرکائیوز سے دو لسانی متنی ڈیٹا بھی نکالا، جس سے NLLB-200 کے فراہم کردہ ترجموں کے معیار کو بہتر بنانے میں مدد ملی۔

مصنفین نوٹ کرتے ہیں کہ یہ ٹول شاذ و نادر ہی ترجمہ کی جانے والی زبانیں بولنے والے لوگوں کو انٹرنیٹ اور دیگر ٹیکنالوجیز تک رسائی میں مدد دے سکتا ہے۔ مزید برآں، وہ تعلیم کو ایک خاص اہمیت کی درخواست کے طور پر اجاگر کرتے ہیں، کیونکہ یہ ماڈل کم وسائل والی زبانیں بولنے والوں کو مزید کتابیں اور تحقیقی مضامین تک رسائی میں مدد دے سکتا ہے۔ تاہم، کوسٹا-جسا اور ان کے شریک مصنفین تسلیم کرتے ہیں کہ غلط ترجمے اب بھی ہو سکتے ہیں۔