UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉
Наталя ХандусенкоГаряченьке
10 квітня 2026, 17:17
2026-04-10
Укрдержархів передав 10 терабайтів даних для навчання національної мовної моделі «Сяйво»
Державна архівна служба України вперше передала дані для тренування національної мовної моделі. Ідеться про унікальні історичні матеріали, державні документи та наукові тексти.
Державна архівна служба України вперше передала дані для тренування національної мовної моделі. Ідеться про унікальні історичні матеріали, державні документи та наукові тексти.
Як пояснює Мінцифри, щоб національна мовна модель «Сяйво» стала надійним джерелом інформації, її навчають на українських даних. Базою для цього стануть 10 терабайтів матеріалів Укрдержархів, що за обсягом дорівнює 70 000 книжок.
«Ми маємо великий масив даних різних історичних епох, друкованих та рукописних, українською та іншими мовами. До кінця 2026 року кількість цифрових копій держархівів збільшаться зі 150 млн до понад 200 млн — це один із найвищих у світі темпів оцифрування архівної спадщини», — зауважив Анатолій Хромов, голова Укрдержархіву.
Наразі триває процес збору унікальних даних для «Сяйва». Свої матеріали надають вже понад 50 партнерів, серед яких медіа, університети, бібліотеки тощо.
«Щойно модель запрацює, ми оприлюднимо повний перелік інституцій і людей, які допомогли створити національний український ШІ», — додали у міністерстві.