От няколко дни Google проговори и на ромски език, макар ромите да си нямат писменост. Платформата пусна превод на нови 110 езика, на които говорят повече от 614 милиона души.
Пламен от столичния кв. „Христо Ботев” разказа пред Нова тв, че на ромски език се учат от малки, макар първите му думи като „мама” и „тате” да са били на български.
„Първата дума „мамо”, „татко”, това е. Като се говори в самия дом непрекъснато цигански и човек научава. Някои казват, че има писменост, но е скрита. Навремето се е говорило, че има циганска азбука, но къде е, какво е, що е никой не знае”, каза Пламен.
„Дете – чаво, а „чхай си” е момиче.”
„Жена как е? Миронли."
„Обичам те как е? Дехав тут”
Любопитното е, че изрази като „здравей, как си или какво правиш” ги превежда като „со керес”.
Google признава, че преводът на езици не е лесен поради регионални вариации, диалекти и разлики в правописа. Някои езици, като ромския, с неговите много диалекти, нямат една стандартна форма, което прави превода сложен.
Големият езиков модел PalM 2 на Google беше полезен при разширяването на Translate. Той научава сродни езици, което позволява добавянето на подобни на хинди езици като авадхи и марвади, както и френски креолски езици като сейшелски и мавритански.
Добавянето на широко използвани езици като кантонски идва със собствени предизвикателства поради споделените писмени знаци с мандарин. Въпреки тези пречки ангажиментът на Google към езиковото многообразие е ясен. Пример е включването на мански, келтски език от остров Ман, който почти изчезна през 1974 г. Благодарение на усилията за съживяване, броят на говорещите свободно нарасна до хиляди.
Това разширение включва и пенджаби, написан на шрифта Shahmukhi, персийско-арабски вариант, използван в Пакистан, където е най-разпространеният език.
Преди това разширение най-голямата актуализация на Google Translate беше през май 2022 г. с въвеждането на Zero-Shot машинен превод. Тази технология позволява на модела да учи нови езици, без да има нужда от съществуващи преведени примери. Това беше голям напредък в машинния превод, който помогна на Google да преодолее допълнително езиковите бариери.
Това разширение е голяма стъпка към инициативата на Google за 1000 езика, която има за цел да използва модели на изкуствен интелект за поддръжка на 1000 от най-важните езици в света.
Още от категорията
Земетресение до Раднево