Реклама партнера — Название партнёра
UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

Lapa LLM developers have created a leaderboard that compares the skill of AI models with the Ukrainian language

Yuriy Paniv, one of the developers of the Ukrainian national AI model Lapa LLM, announced the creation of a leaderboard containing measurements of how well large language models work with the Ukrainian language.

Leave a comment
Lapa LLM developers have created a leaderboard that compares the skill of AI models with the Ukrainian language

Yuriy Paniv, one of the developers of the Ukrainian national AI model Lapa LLM, announced the creation of a leaderboard containing measurements of how well large language models work with the Ukrainian language.

It was created together by the LLM development team for the Ukrainian language MamayLM. «We measured all practical open language models that a user can run on their computer. In addition, the measurement project is completely open, other researchers can reproduce the measurements themselves for transparency,» Paniv said.

The leaderboard displays the performance indicators of language models on Ukrainian language tests used during the development of Lapa LLM. It evaluates models according to various criteria and tasks in NLP (natural language processing) in Ukrainian. The following skills are evaluated:

  • Machine translation: FLORES-200 (en-uk, uk-en), LongFLORES (en-uk, uk-en), WMT-22 (en-uk, uk-en).
  • Summarization: XLSUM (uk).
  • Answers to questions in context: Belebele (uk), SQuAD (uk).
  • Reasoning and Knowledge: ZNO-Eval, Winogrande Challenge, Hellaswag, ARC Easy/Challenge, TriviaQA, MMLU.
  • Solving mathematical problems: GSM-8K.
    Execution of instructions: IFEval.

Currently, the leaderboard features such LLMs as Lapa LLM, MamayLM, Qwen, Llama, and Gemma. The top three in terms of average score include Ukrainian models Lapa LLM and MamayLM, as well as Gemma from Google.

In the near future, the leaderboard developers plan to add measurements of commercial language models from OpenAI, Anthropic, Google, DeepSeek, compare how models work with image processing containing Ukrainian text, and add measurements of model ethics. They also want to upload full benchmark logs (2 GB for each model), add a comparison of tokenizer efficiency, and increase the number of parameters.

The leaderboard can be viewed on Hugging Face, and its code is available on GitHub .

Read the country's main IT news in our Telegram
Read the country’s main IT news in our Telegram
On the topic
Read the country’s main IT news in our Telegram
One and a half times faster than Gemma 3. Interview with the leader of the Lapa LLM project — the most effective large language model for the Ukrainian language
One and a half times faster than Gemma 3. Interview with the leader of the Lapa LLM project — the most efficient large language model for the Ukrainian language
On the topic
One and a half times faster than Gemma 3. Interview with the leader of the Lapa LLM project — the most efficient large language model for the Ukrainian language
Ukrainians have created a language model for the Ukrainian language MamayLM. What makes it special, who is it useful for, and how to use it
Ukrainians have created a language model for the Ukrainian language MamayLM. What makes it special, who is it useful for, and how to use it
On the topic
Ukrainians have created a language model for the Ukrainian language MamayLM. What makes it special, who is it useful for, and how to use it
Now AI will speak Ukrainian better. Researchers from UCU and KNU have significantly improved the quality of Ukrainian speech synthesis
Now AI will speak Ukrainian better. Researchers from UCU and KNU have significantly improved the quality of Ukrainian speech synthesis
On the topic
Now AI will speak Ukrainian better. Researchers from UCU and KNU have significantly improved the quality of Ukrainian speech synthesis
Also Read
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Нейронні мережі для генерації зображень бачать світ по-своєму, їхню логіку зрозуміти часом зовсім неможливо. Але таки хочеться. На честь Дня Незалежності України редакція dev.ua вирішила провести невеликий експеримент. Ми задали чотирьом різним нейронним мережам п’ять однакових запитів: «прапор України», «День Незалежності України», «український Крим», «перемога України» та «українці». Отриманими результатами ми ділимося з вами нижче.
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok з’явилася нова функція «Розумний фон». З її допомогою як фон для тіктоків можна підставляти згенеровані нейромережею зображення. Редакція dev.ua протестувала цю технологію і ділиться своїми враженнями.
1 comment
Які IT-спеціальності будуть потрібні в найближчі п'ять років? Ми з'ясували у голови американського стартапу ADAM Дениса Гурака
Які IT-спеціальності будуть потрібні в найближчі п'ять років? Ми з'ясували у голови американського стартапу ADAM Дениса Гурака
Які IT-спеціальності будуть потрібні в найближчі п'ять років? Ми з'ясували у голови американського стартапу ADAM Дениса Гурака

Have important news to share? Message our Telegram bot

Key events and useful links in our Telegram channel

Discussion
No comments yet.