Реклама партнера — Название партнёра
UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

Розробники Lapa LLM створили лідерборд, який порівнює вправність роботи ШІ-моделей з українською мовою

Юрій Панів, один з розробників української національної ШІ-моделі Lapa LLM, повідомив про створення лідерборду, що містить заміри як добре працюють великі мовні моделі з українською мовою.

Залишити коментар
Розробники Lapa LLM створили лідерборд, який порівнює вправність роботи ШІ-моделей з українською мовою

Юрій Панів, один з розробників української національної ШІ-моделі Lapa LLM, повідомив про створення лідерборду, що містить заміри як добре працюють великі мовні моделі з українською мовою.

Його створили разом командою розробників LLM для української мови MamayLM. «Ми заміряли всі практичні відкриті мовні моделі, які користувач може запустити в себе на комп’ютері.  До того ж проєкт замірів повністю відкритий, інші дослідники можуть відтворити заміри самостійно для прозорості», — розповів Панів.

Лідерборд відображає показники ефективності мовних моделей на тестах української мови, які використовувалися під час розробки Lapa LLM. Він оцінює моделі за різними критеріями та завданнями з NLP (обробки природної мови) українською мовою. Оцінюються такі вміння:

  • Машинний переклад: FLORES-200 (en-uk, uk-en), LongFLORES (en-uk, uk-en), WMT-22 (en-uk, uk-en).
  • Підсумовування: XLSUM (uk).
  • Відповіді на питання в контексті: Belebele (uk), SQuAD (uk).
  • Міркування та знання: ZNO-Eval, Winogrande Challenge, Hellaswag, ARC Easy/Challenge, TriviaQA, MMLU.
  • Розв’язування математичних задач: GSM-8K.
    Виконання інструкцій: IFEval.

Наразі в лідерборді представлені такі LLM як Lapa LLM, MamayLM, Qwen, Llama та Gemma. В трійку кращих за середнім показником увійшли українські моделі Lapa LLM та MamayLM, а також Gemma від Google.

Найближчим часом розробники лідерборду планують додати заміри комерційних мовних моделей від OpenAI, Anthropic, Google, DeepSeek, порівняти як працюють моделі з обробкою зображень, що містять український текст, та додати заміри етичності моделей. Вони також хочуть завантажити повні логи бенчмарків (по 2 Гб на кожну модель), додати порівняння ефективності токенізаторів і збільшити кількість параметрів.

Лідерборд можна переглянути на Hugging Face, а його код доступний на GitHub.

Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
У півтора раза швидше ніж Gemma 3. Інтервю з лідером проєкту Lapa LLM — найефективнішою великою мовною моделлю для української мови 
У півтора раза швидше, ніж Gemma 3. Інтерв’ю з лідером проєкту Lapa LLM — найефективнішою великою мовною моделлю для української мови 
По темi
У півтора раза швидше, ніж Gemma 3. Інтерв’ю з лідером проєкту Lapa LLM — найефективнішою великою мовною моделлю для української мови 
Українці створили мовну модель для української мови MamayLM. Чим вона особлива кому корисна та як скористатися
Українці створили мовну модель для української мови MamayLM. Чим вона особлива, кому корисна та як скористатися
По темi
Українці створили мовну модель для української мови MamayLM. Чим вона особлива, кому корисна та як скористатися
Тепер ШІ говоритиме українською ліпше. Дослідники з УКУ та КНУ значно покращили якість синтезу українського мовлення
Тепер ШІ говоритиме українською ліпше. Дослідники з УКУ та КНУ значно покращили якість синтезу українського мовлення
По темi
Тепер ШІ говоритиме українською ліпше. Дослідники з УКУ та КНУ значно покращили якість синтезу українського мовлення
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Український розробник створив безоплатну гру в слова для лагідної українізації
Український розробник створив безоплатну гру в слова для лагідної українізації
Український розробник створив безоплатну гру в слова для лагідної українізації
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
3 коментарі
Блогер обурився «протидії російської мови» у Львові – на нього почали полювання. Чим завершився мовний скандал на заході України
Блогер обурився «протидії російської мови» у Львові – на нього почали полювання. Чим завершився мовний скандал на заході України
Блогер обурився «протидії російської мови» у Львові – на нього почали полювання. Чим завершився мовний скандал на заході України
Харківський блогер Дмитро Городецький, який з початку повномасштабної війни з росією мешкає у Львові, опублікував трихвилинне відео, у якому обурився ставленням до російської мови у місті. На це жорстко відреагував місцевий бізнесмен і власник футбольного клубу «Рух» Григорій Козловський. Розповідаємо головне про мовний скандал.

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.