💳 Trustee Plus: розраховуйся криптою за допомогою платіжної картки. Ліміт: 50 000 євро 🚀

В «Google Перекладачі» з'явиться кримськотатарська та ще понад 100 нових мов

Компанія Google зробила найбільше розширення в історії свого сервісу  перекладу Google Translate, додавши 110 нових мов включно з кримськотатарською. Для цього компанія використала велику мовну модель штучного інтелекту PaLM 2.

Оставить комментарий
В «Google Перекладачі» з'явиться кримськотатарська та ще понад 100 нових мов

Компанія Google зробила найбільше розширення в історії свого сервісу  перекладу Google Translate, додавши 110 нових мов включно з кримськотатарською. Для цього компанія використала велику мовну модель штучного інтелекту PaLM 2.

«Ми постійно впроваджуємо новітні технології, щоб більше людей мали доступ до цього інструменту: у 2022 році ми додали 24 нові мови, використовуючи підхід Zero-Shot Machine Translation, де модель машинного навчання вчиться перекладати на іншу мову, навіть якщо не бачить прикладу. Ми також анонсували ініціативу „1000 мов“, яка передбачає створення моделей штучного інтелекту, що підтримуватимуть 1000 найпоширеніших мов світу», — йдеться в блозі Google.

В ньому вказується, що додавання 110 нових мов є найбільше розширення в історії «Google Перекладача». Ними розмовляють понад 614 мільйонів носіїв, що відкриває доступ до перекладу для близько 8% населення світу. Деякі з цих мов є одними з найбільших світових мов з більш ніж 100 мільйонами носіїв. Іншими мовами розмовляють невеликі громади корінних народів, а деякі майже не мають носіїв мови, але тривають активні зусилля щодо їхнього відродження.

Близько чверті нових мов походять з Африки, що є нашим найбільшим розширенням африканських мов сьогодні, зокрема фон, кіконго, луо, га, сваті, венда та волоф.

Деякі з нових мов, які будуть підтримуватись в «Google Перекладачі»

  • Афар — це тональна мова, якою розмовляють у Джибуті, Еритреї та Ефіопії. З усіх мов, запущених цього разу, афар мала найбільший внесок від спільноти волонтерів.
  • Кантонська мова вже давно є однією з найбільш запитуваних мов для «Google Перекладача». Але є певні складності, оскільки на письмі вона часто перетинається з мандаринською, що ускладнює пошук даних та навчання моделей.
  • Кримськотатарська мова — тюркська мова, рідна мова кримських татар. Сьогодні кримськотатарська належить до мов, що потребує додаткового захисту за класифікацією UNESCO. У січні 2023 року в Україні було створено Національну комісію з питань кримськотатарської мови, що має її захищати.
  • Менська — це кельтська мова острова Мен. Вона майже зникла зі смертю останнього носія мови у 1974 році. Але завдяки руху з відродження мови на острові, зараз нею розмовляють тисячі людей.
  • Нко — це стандартизована форма західноафриканських мов мандінка, яка об'єднує багато діалектів в одну спільну мову. Її унікальний алфавіт був винайдений у 1949 році, і сьогодні вона має активну дослідницьку спільноту, яка розробляє для неї ресурси та технології.

В Google відзначають, що керуються багатьма факторами, які враховують при додаванні нових мов до «Перекладача». 

«Наш підхід полягає в тому, щоб надавати пріоритет найбільш вживаним різновидам кожної мови. Наприклад, ромська мова має багато діалектів по всій Європі. Наші моделі створюють текст, найбільш близький до південно-влахської ромської, різновиду, який широко використовується в Інтернеті. Але він також містить елементи з інших діалектів, таких як північно-влахська та балканська ромська», — пояснюють в компанії.

Зазначається, що PaLM 2 є ключовим елементом головоломки, який  допомагає «Перекладачу» ефективніше вивчати мови, тісно пов’язані одна з одною, зокрема мови, близькі до хінді, як-от авадхі та марваді. В компанії обіцяють, що в майбутньому сервіс підтримуватиме ще більше мовних різновидів і правил правопису.

Нагадаємо, що раніше 17-річний український розробник Тарас Іванов створив сервіс «Вільний Відеоперекладач», який безплатно перекладає й озвучує відеоролики з YouTube на українську та кримськотатарську мови, і працює через Telegram-бота. Тарас продовжує розвивати свій проєкт і нещодавно випустив оновлення для сайту і бота.

Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
«Усе зводиться до того щоб мати найкращу технологію». Як працює DeepL — один із найкращих ШІ-перекладачів у світі
«Усе зводиться до того, щоб мати найкращу технологію». Як працює DeepL — один із найкращих ШІ-перекладачів у світі
По темi
«Усе зводиться до того, щоб мати найкращу технологію». Як працює DeepL — один із найкращих ШІ-перекладачів у світі
«Перекладач із бюрократичної» та «генератор виправдань». 9 цікавих GPT-асистентів від українського ентузіаста ШІ-технологій
«Перекладач із бюрократичної» та «генератор виправдань». 9 цікавих GPT-асистентів від українського ентузіаста ШІ-технологій
По темi
«Перекладач із бюрократичної» та «генератор виправдань». 9 цікавих GPT-асистентів від українського ентузіаста ШІ-технологій
Розробники ШІ-застосунку ConnectAbility який навчає людей із порушенням слуху мови жестів хочуть додати підтримку англійської мови та озвучення перекладу
Розробники ШІ-застосунку ConnectAbility, який навчає людей із порушенням слуху мови жестів, хочуть додати підтримку англійської мови та озвучення перекладу
По темi
Розробники ШІ-застосунку ConnectAbility, який навчає людей із порушенням слуху мови жестів, хочуть додати підтримку англійської мови та озвучення перекладу
Читайте также
Головоломка киевлянина Quadline победила на фестивале инди-игр Google Play
Головоломка киевлянина Quadline победила на фестивале инди-игр Google Play
Головоломка киевлянина Quadline победила на фестивале инди-игр Google Play
Харьковская художница нарисовала новый дудл для Google в День Независимости Украины
Харьковская художница нарисовала новый дудл для Google в День Независимости Украины
Харьковская художница нарисовала новый дудл для Google в День Независимости Украины
Специалистов Google теперь будут кормить роботы. Они также умеют давать полезные (и не очень) советы
Специалистов Google теперь будут кормить роботы. Они также умеют давать полезные (и не очень) советы
Специалистов Google теперь будут кормить роботы. Они также умеют давать полезные (и не очень) советы
Конец эпохи. Поисковик Google больше не будет отвечать на бессмысленные запросы
Конец эпохи. Поисковик Google больше не будет отвечать на бессмысленные запросы
Конец эпохи. Поисковик Google больше не будет отвечать на бессмысленные запросы

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментариев пока нет.