Українські дослідники представили Lapa LLM — першу національну ШІ-модель для міркування
Lapa LLM позиціонується як перша українська велика мовна модель, спеціально налаштована на міркування (reasoning), що узгоджена з національними цінностями. За внутрішніми бенчмарками, модель вже демонструє кращі результати, ніж Gemma 3.
Lapa LLM позиціонується як перша українська велика мовна модель, спеціально налаштована на міркування (reasoning), що узгоджена з національними цінностями. За внутрішніми бенчмарками, модель вже демонструє кращі результати, ніж Gemma 3.
Команда українських та польських дослідників з Українського католицького університету, Київського політехнічного інституту та Гірничо-металургійної академії Кракова (AGH) анонсувала амбітний проєкт — Lapa LLM. Велику мовну модель представив Юрій Панів, аспірант УКУ та фахівець із даних у Nortal під час виступу на IT Arena 2025.
Розробка Lapa LLM мотивована низкою критичних проблем, які не вирішуються наявними відкритими моделями. Ключові цілі проєкту містять:
Національна безпека та конфіденційність: Модель розробляється для роботи з конфіденційними даними в оборонному секторі та у великих компаніях, яким потрібно обробляти інформацію в закритому контурі, без виправляння її хмарним провайдерам.
Культурна узгодженість: Lapa LLM навчається з фокусом на українських цінностях і контексті. Автоматична фільтрація даних використовується для запобігання російській пропаганді та дезінформації, а також для уникнення «галюцинацій» щодо знань про Україну.
Висока продуктивність: Проєкт прагне розв’язати проблему незадовільної продуктивності для української мови, характерної для багатьох відкритих LLM.
В основі Lapa LLM лежить модель Gemma від Google, розміром 12 млрд параметрів. Цей вибір забезпечує високий баланс між розміром і можливостями та дозволяє запускати модель на доступних пристроях.
Ключовим технічним успіхом стало розроблення передового українського токенізатора. Це призвело до зменшення кількості токенів у 1,5 раза при обробці українського тексту, що робить Lapa LLM швидшою та дешевшою в експлуатації. За внутрішніми бенчмарками, модель вже демонструє кращі результати, ніж навіть більша Gemma 3 на 27 млрд параметрів.
Для навчання використовувалися високоякісні набори даних та матеріали з бібліотеки Гарвардського університету.
Реліз Lapa LLM заплановано на початок жовтня 2025 року. Команда має намір випустити модель, набори даних та навчальні скрипти під ліцензією MIT.
Проєкт отримав значну підтримку: обчислювальні ресурси (тримісячний доступ до восьми вузлів з H100) надала компанія Comand AI, а Hugging Face забезпечив безплатну корпоративну підписку.
Українські дослідники перевірили 27 LLM різних країн на «дружність до України»: канадські розробки виявилися найбільш проукраїнськими, найнижчий показник у Китаю
«Я вчився Data Science із 4 років. Кожен урок математики був важливим». Історія математичного генія з невеличкого села на Волині, що нині створює LLM для Lyft, Reface та AppFlame
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.
Хочете повідомити важливу новину? Пишіть у Telegram-бот
Головні події та корисні посилання в нашому Telegram-каналі