Олег Онопрієнко ШІ 3 жовтня 2025, 12:09

Українські дослідники представили Lapa LLM — першу національну ШІ-модель для міркування

Lapa LLM позиціонується як перша українська велика мовна модель, спеціально налаштована на міркування (reasoning), що узгоджена з національними цінностями. За внутрішніми бенчмарками, модель вже демонструє кращі результати, ніж Gemma 3.

Залишити коментар

Українські дослідники представили Lapa LLM — першу національну ШІ-модель для міркування

Lapa LLM позиціонується як перша українська велика мовна модель, спеціально налаштована на міркування (reasoning), що узгоджена з національними цінностями. За внутрішніми бенчмарками, модель вже демонструє кращі результати, ніж Gemma 3.

Команда українських та польських дослідників з Українського католицького університету, Київського політехнічного інституту та Гірничо-металургійної академії Кракова (AGH) анонсувала амбітний проєкт — Lapa LLM. Велику мовну модель представив Юрій Панів, аспірант УКУ та фахівець із даних у Nortal під час виступу на IT Arena 2025.

Розробка Lapa LLM мотивована низкою критичних проблем, які не вирішуються наявними відкритими моделями. Ключові цілі проєкту містять:

Національна безпека та конфіденційність: Модель розробляється для роботи з конфіденційними даними в оборонному секторі та у великих компаніях, яким потрібно обробляти інформацію в закритому контурі, без виправляння її хмарним провайдерам.
Культурна узгодженість: Lapa LLM навчається з фокусом на українських цінностях і контексті. Автоматична фільтрація даних використовується для запобігання російській пропаганді та дезінформації, а також для уникнення «галюцинацій» щодо знань про Україну.
Висока продуктивність: Проєкт прагне розв’язати проблему незадовільної продуктивності для української мови, характерної для багатьох відкритих LLM.

В основі Lapa LLM лежить модель Gemma від Google, розміром 12 млрд параметрів. Цей вибір забезпечує високий баланс між розміром і можливостями та дозволяє запускати модель на доступних пристроях.

Ключовим технічним успіхом стало розроблення передового українського токенізатора. Це призвело до зменшення кількості токенів у 1,5 раза при обробці українського тексту, що робить Lapa LLM швидшою та дешевшою в експлуатації. За внутрішніми бенчмарками, модель вже демонструє кращі результати, ніж навіть більша Gemma 3 на 27 млрд параметрів.

Для навчання використовувалися високоякісні набори даних та матеріали з бібліотеки Гарвардського університету.

Реліз Lapa LLM заплановано на початок жовтня 2025 року. Команда має намір випустити модель, набори даних та навчальні скрипти під ліцензією MIT.

Проєкт отримав значну підтримку: обчислювальні ресурси (тримісячний доступ до восьми вузлів з H100) надала компанія Comand AI, а Hugging Face забезпечив безплатну корпоративну підписку.

Українська відповідь ChatGPT. Як «Київстар» із Мінцифри будуватимуть національну LLM для України: інсайти й міжнародний ШІ-досвід VEON

Українські дослідники перевірили 27 LLM різних країн на «дружність до України»: канадські розробки виявилися найбільш проукраїнськими найнижчий показник у Китаю

«Я вчився Data Science із 4 років. Кожен урок математики був важливим». Історія математичного генія з невеличкого села на Волині що нині створює LLM для Lyft Reface та AppFlame

Читайте головні IT-новини країни в нашому Telegram

Залишити коментар

Текст: Олег Онопрієнко Теги: lapa llm, штучний інтелект, llm

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

Розміщення реклами

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Штучний інтелект почав озвучувати фільми на MEGOGO

3 коментарі

Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

2 коментарі

«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого

Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар