Вікторія Горбік ШІ 10 квітня 2025, 13:35

«Ми не розглядаємо китайські моделі та підходи». CTO ШІ-центру Мінцифри про розробку та ймовірну дату виходу національної LLM

На початку лютого Мінцифри запустило AI Center of Excellence, перший в Україні, який в тому числі працює над розробкою української великої мовної моделі (LLM). CTO AI Center of Excellence й AICTO Мінцифри Дмитро Овчаренко повідомив, що наразі відомо про розробку моделі і коли можна буде чекати її до виходу.

Залишити коментар

«Ми не розглядаємо китайські моделі та підходи». CTO ШІ-центру Мінцифри про розробку та ймовірну дату виходу національної LLM

На початку лютого Мінцифри запустило AI Center of Excellence, перший в Україні, який в тому числі працює над розробкою української великої мовної моделі (LLM). CTO AI Center of Excellence й AICTO Мінцифри Дмитро Овчаренко повідомив, що наразі відомо про розробку моделі і коли можна буде чекати її до виходу.

Про національну LLM

Національна велика мовна модель (LLM), за словами Дмитра Овчаренка, зазвичай базується на open-source архітектурах, таких як LLaMA, Mistral або Gemma, і доповнюється специфічними національними мовними корпусами, повідомив CTO AI Center of Excellence в інтервʼю для DOU.

Про розробку

Наразі команда ще не приступила до безпосередньої розробки моделі. Зараз за словами AICTO триває етап формування концепції: визначаємо задачі, формуємо оргструктуру, збираємо команду, оцінюємо бюджет і таймлайн, шукаємо партнерів і механізми залучення науковців, університетів і бізнесу. Крім того, він зазначив, що процес розробки точно буде максимально публічним.

«Єдине, що можу сказати точно: ми не розглядаємо китайські моделі та підходи», — заявив він та додав, що це буде pre-train на наявній архітектурі, а не розробка з нуля. Розробники будуть фокусуватись на маленьких мовних моделях (1-5 млрд параметрів) та середніх (12-16 млрд параметрів), враховуючи досвід Gemma та останніх версій LLaMA.

Про дата-сет

Для тренування національної мовної моделі, за словами Дмитра Овчаренка, будуть використані новини, Вікіпедія та інша інформація, зібрана та надана ком’юніті та університетами, які роками збирають відкриті джерела українською мовою. «Також є дата-сет „Малюк“. Він один з найбільших — 113 гігабайтів вичищеного тексту. Крім нього, є NER-UK, UA-GEC, БрУК та інші», — додає він. Всі дані проходитимуть перевірку експертами — істориками, лінгвістами, культурними діячами.

Про користувачів

Крім того, Дмитро Овчаренко додав, що українська модель буде у вільному доступі для некомерційного сектору — держави, університетів, шкіл, науковців. Щодо бізнесу, то ще думаємо над умовами.

Про гроші

Наразі команда в пошуку інвесторів для фінансування розробки національної LLM. Конкретну суму необхідних витрат Дмитро Овчаренко не називає, але за його словами, з досвіду інших країн скажу, що бюджет може коливатися від $1,5 до $8 млн.

Про строки та вихід

CTO AI Center of Excellence говорить, що команда планує розробку відповідно до Roadmap. «За ідеальних умов середня модель має вийти через дев’ять місяців. Тобто в кінці листопаді-грудні 2025 року», — заявляє він. Але Дмитро також додав, що планується до виходу не лише одна модель, а й guardrail, ембединги, токенайзер, тобто ціла екосистема певних моделей.

Про плани

Команда прагне до 2030 року увійти до трійки країн світу за розробкою та впровадженням AI у публічному секторі.

Дмитро Овчаренко впевнений, що AI створить попит на нові спеціальності та змінить традиційні підходи до роботи в різних галузях.

Читайте головні IT-новини країни в нашому Telegram

Мінцифри запустило перший в Україні AI Center Excellence який буде центром інтеграції ШІ-рішень. Що відомо про структуру і що вже зроблено

Новостворений AI Center of Excellence від Мінцифри в Києві набирає R&D-команду. Кого з фахівців шукають

AI Center of Excellence — надія або розпач. Що думають про новий український центр інтеграції ШІ-рішень AI-експерти

DeepSeek розробляє новий метод покращення можливостей міркувань LLM: він допоможе орієнтувати ШІ-моделі на людські вподобання

Мінцифри оголосило про старт розробки української великої мовної моделі (LLM). Що відомо зараз

Залишити коментар

Текст: Вікторія Горбік Теги: ai center of excellence, мінцифри, штучний інтелект

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

Розміщення реклами

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Штучний інтелект почав озвучувати фільми на MEGOGO

3 коментарі

Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

2 коментарі

«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого

Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар