Google Translate добавя 110 нови езика, сред които и ромския, съобщиха от компанията.
Тъй като езиците имат огромно количество вариации – регионални разновидности, диалекти, различни правописни стандарти, подходът на Google е да даде приоритет на най-често използваните разновидности на всеки език.
Например ромският е език, който има много диалекти в цяла Европа. Moделите произвеждат текст, който е най-близък до южновлашкия ромски, често използван вариант онлайн. Но също така смесва елементи от други, като северен влашки и балкански ромски.
„Google Translate премахва езиковите бариери, за да помогне на хората да се свържат и да разберат по-добре света около тях. Ние винаги прилагаме най-новите технологии, така че повече хора да имат достъп до този инструмент. Сега използваме AI, за да разширим разнообразието от езици, които поддържаме. Благодарение на нашия голям езиков модел PaLM 2, ние пускаме 110 нови езика в Google Translate, нашето най-голямо разширение досега“, обявиха от компанията.
На новите езици за превод говорят повече от 600 млн. души или близо 8% от населението на света.
Някои са основни световни езици с над 100 милиона говорещи. Други пък се говорят от малки общности от коренно население, а за някои почти няма носители на езика, но се полагат активни усилия за съживяването му.
Около една четвърт от новите езици идват от Африка, което представлява най-голямото ни разширяване на африканските езици до момента, включително фон, киконго, луо, га, свати, венда и уолоф.