Реклама партнера — Название партнёра
UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

Мінцифри й «Київстар» обрали ШІ-модель, на якій тренуватимуть національну LLM

Мінцифри спільно з «Київстар» обрали велику мовну модель, на якій попередньо навчатимуть національну українську LLM. 

Залишити коментар
Мінцифри й «Київстар» обрали ШІ-модель, на якій тренуватимуть національну LLM

Мінцифри спільно з «Київстар» обрали велику мовну модель, на якій попередньо навчатимуть національну українську LLM. 

Про це повідомили в Мінцифри. 

Що вплинуло на вибір

Цією великою мовною моделлю стане Gemma 3 від Google. За словами міністерства, під час вибору орієнтувалися на те, наскільки якісно модель уже опрацьовує тексти українською мовою та її контрольованість під час навчання.

«Це допоможе мінімізувати лінгвістичні та етичні ризики в нашій LLM», — зазначив Данило Цьвок, Chief AI Officer Мінцифри й CEO WINWIN AI Center of Excellence.

Ключовими перевагами у виборі моделі стали: 

  • Оптимальний баланс продуктивності та ресурсів — Gemma забезпечує високу якість при оптимальних інфраструктурних вимогах. Це одна з найкращих серед відкритих моделей з погляду співвідношення розміру та якості.
  • Багатомовна підтримка — модель уже має українську мову у своєму діапазоні та легко адаптується через донавчання.
  • Мультимодальність — модель може сприймати й аналізувати не лише текст, а й зображення.
  • Розширений токенайзер — обсяг токенів забезпечує точне та ефективне опрацювання текстів та донавчання. Модель має довге контекстне вікно — це 128 000 токенів.
  • Наявність кількох розмірностей дозволяє гнучко обирати розмір моделі під конкретну сферу застосування.
  • Успішні приклади та досвід використання Gemma для створення українськомовних LLM, зокрема Lapa LLM та MamayLM.

Що далі

Gemma 3 адаптують до української мови, зокрема планується:

  • вдосконалити український токенайзер — це покращить роботу моделі з українською мовою, зменшить помилки під час створення україномовних текстів й оптимізує обчислювальні витрати при використанні моделі;
  • донавчити модель на унікальних україномовних текстах, які зараз збирають експерти; 
  • створити бенчмарки (тести) для більш точного налаштування моделі для подальшого використання.

Нагадаємо, що минулої п’ятниці Мінцифри й «Київстар» оголосили, що шукають назву для національної української LLM. До 5 грудня українці можуть запропонувати свої варіанти, а за кращі ідеї отримати призи.

Мінцифри разом із NVIDIA розробляють власну мовну модель Diia AI LLM та ШІ-інфраструктуру в Україні
Мінцифри разом із NVIDIA розробляють власну мовну модель Diia AI LLM та ШІ-інфраструктуру в Україні
По темi
Мінцифри разом із NVIDIA розробляють власну мовну модель Diia AI LLM та ШІ-інфраструктуру в Україні
Відкрита українська мовна модель Lapa LLM отримала публічний реліз
Відкрита українська мовна модель Lapa LLM отримала публічний реліз
По темi
Відкрита українська мовна модель Lapa LLM отримала публічний реліз
Kyivstar.Tech набирає людей для роботи над національною LLM. Які потрібні фахівці
Kyivstar.Tech набирає людей для роботи над національною LLM. Які потрібні фахівці
По темi
Kyivstar.Tech набирає людей для роботи над національною LLM. Які потрібні фахівці
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Читайте також
«Київстар» відновлює пошук айтішників для розробки власних діджитал продуктів. Кого шукають
«Київстар» відновлює пошук айтішників для розробки власних діджитал продуктів. Кого шукають
«Київстар» відновлює пошук айтішників для розробки власних діджитал продуктів. Кого шукають
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
«Київстар» достроково погасив борги перед банками на 4,8 млрд грн
«Київстар» достроково погасив борги перед банками на 4,8 млрд грн
«Київстар» достроково погасив борги перед банками на 4,8 млрд грн
«Київстар» втратив більше мільйона абонентів. Відток клієнтів може продовжиться
«Київстар» втратив більше мільйона абонентів. Відток клієнтів може продовжиться
«Київстар» втратив більше мільйона абонентів. Відток клієнтів може продовжиться

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.