Реклама партнера — Название партнёра
UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

Українські дослідники представили Lapa LLM — першу національну ШІ-модель для міркування

Lapa LLM позиціонується як перша українська велика мовна модель, спеціально налаштована на міркування (reasoning), що узгоджена з національними цінностями. За внутрішніми бенчмарками, модель вже демонструє кращі результати, ніж Gemma 3. 

Залишити коментар
Українські дослідники представили Lapa LLM — першу національну ШІ-модель для міркування

Lapa LLM позиціонується як перша українська велика мовна модель, спеціально налаштована на міркування (reasoning), що узгоджена з національними цінностями. За внутрішніми бенчмарками, модель вже демонструє кращі результати, ніж Gemma 3. 

Команда українських та польських дослідників з Українського католицького університету, Київського політехнічного інституту та Гірничо-металургійної академії Кракова (AGH) анонсувала амбітний проєкт — Lapa LLM. Велику мовну модель представив Юрій Панів, аспірант УКУ та фахівець із даних у Nortal під час виступу на IT Arena 2025.

Розробка Lapa LLM мотивована низкою критичних проблем, які не вирішуються наявними відкритими моделями. Ключові цілі проєкту містять:

  1. Національна безпека та конфіденційність: Модель розробляється для роботи з конфіденційними даними в оборонному секторі та у великих компаніях, яким потрібно обробляти інформацію в закритому контурі, без виправляння її хмарним провайдерам.

  2. Культурна узгодженість: Lapa LLM навчається з фокусом на українських цінностях і контексті. Автоматична фільтрація даних використовується для запобігання російській пропаганді та дезінформації, а також для уникнення «галюцинацій» щодо знань про Україну.

  3. Висока продуктивність: Проєкт прагне розв’язати проблему незадовільної продуктивності для української мови, характерної для багатьох відкритих LLM.

В основі Lapa LLM лежить модель Gemma від Google, розміром 12 млрд параметрів. Цей вибір забезпечує високий баланс між розміром і можливостями та дозволяє запускати модель на доступних пристроях.

Ключовим технічним успіхом стало розроблення передового українського токенізатора. Це призвело до зменшення кількості токенів у 1,5 раза при обробці українського тексту, що робить Lapa LLM швидшою та дешевшою в експлуатації. За внутрішніми бенчмарками, модель вже демонструє кращі результати, ніж навіть більша Gemma 3 на 27 млрд параметрів.

Для навчання використовувалися високоякісні набори даних та матеріали з бібліотеки Гарвардського університету.

Реліз Lapa LLM заплановано на початок жовтня 2025 року. Команда має намір випустити модель, набори даних та навчальні скрипти під ліцензією MIT.

Проєкт отримав значну підтримку: обчислювальні ресурси (тримісячний доступ до восьми вузлів з H100) надала компанія Comand AI, а Hugging Face забезпечив безплатну корпоративну підписку.

Українська відповідь ChatGPT. Як «Київстар» із Мінцифри будуватимуть національну LLM для України: інсайти й міжнародний ШІ-досвід VEON
Українська відповідь ChatGPT. Як «Київстар» із Мінцифри будуватимуть національну LLM для України: інсайти й міжнародний ШІ-досвід VEON
По темi
Українська відповідь ChatGPT. Як «Київстар» із Мінцифри будуватимуть національну LLM для України: інсайти й міжнародний ШІ-досвід VEON
Українські дослідники перевірили 27 LLM різних країн на  «дружність до України»: канадські розробки виявилися найбільш проукраїнськими найнижчий показник у Китаю
Українські дослідники перевірили 27 LLM різних країн на «дружність до України»: канадські розробки виявилися найбільш проукраїнськими, найнижчий показник у Китаю
По темi
Українські дослідники перевірили 27 LLM різних країн на «дружність до України»: канадські розробки виявилися найбільш проукраїнськими, найнижчий показник у Китаю
«Я вчився Data Science із 4 років. Кожен урок математики був важливим». Історія математичного генія з невеличкого села на Волині що нині створює LLM для Lyft Reface та AppFlame
«Я вчився Data Science із 4 років. Кожен урок математики був важливим». Історія математичного генія з невеличкого села на Волині, що нині створює LLM для Lyft, Reface та AppFlame
По темi
«Я вчився Data Science із 4 років. Кожен урок математики був важливим». Історія математичного генія з невеличкого села на Волині, що нині створює LLM для Lyft, Reface та AppFlame
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
3 коментарі
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
2 коментарі
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті. 

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.