Реклама партнера — Название партнёра
UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

Мінекономіки та Держархів навчають ШІ, щоб розпізнати «почерк лікарів»

Міністерство економіки України спільно з Державним архівом та іншими відомствами ініціювало масштабний проєкт зі збору бази україномовних рукописних даних. Головна мета — навчити штучний інтелект якісно розпізнавати складний рукописний текст, старі документи та медичні довідки.

Залишити коментар
Мінекономіки та Держархів навчають ШІ, щоб розпізнати «почерк лікарів»

Міністерство економіки України спільно з Державним архівом та іншими відомствами ініціювало масштабний проєкт зі збору бази україномовних рукописних даних. Головна мета — навчити штучний інтелект якісно розпізнавати складний рукописний текст, старі документи та медичні довідки.

Деталями цієї ініціативи поділився ML Lead застосунку «Мрія» та радник зі штучного інтелекту в Мінекономіки Дмитро Войтех у подкасті AI&I. За словами Войтеха, ініціатива дасть змогу суттєво пришвидшити цифровізацію державних послуг і відкриє шлях до глобального оцифрування історичних архівів.

Ідея створення національного дата-сету народилася під час роботи над проєктом «єДозвіл», який має на меті перевести видачу ліцензій для підприємців у цифровий формат через «Дію». Для автоматизації цього процесу алгоритмам потрібно аналізувати документи заявників.

Проте виявилося, що для отримання багатьох ліцензій необхідно завантажувати старі дипломи (подекуди ще з 90-х років), які часто заповнені від руки, погано сфотографовані або мають дефекти. За словами Дмитра Войтеха, готові OCR-рішення (системи оптичного розпізнавання символів), які існують на ринку, виявилися абсолютно безсилими перед українськими рукописами.

«Ми стикнулися з тим, що дуже недобре працює на українських рукописах, особливо враховуючи, що наші перші ліцензії пов’язані з медичними послугами. Ми всі розуміємо, як виглядає шрифт наших любих лікарів», — розповів Войтех про проблематику українських рукописних текстів.

Зіткнувшись із цією проблемою, розробники зрозуміли, що у відкритому доступі просто немає якісних і розмічених корпусів українського рукописного тексту. Щоб не чекати роками, поки система «єДозвіл» самостійно накопичить достатню кількість даних, Мінекономіки використало свій авторитет для об'єднання зусиль з іншими державними структурами.

Найбільшим партнером ініціативи став Державний архів України. Ця установа має колосальний інтерес у розвитку технології, адже їхня стратегічна мета — оцифрувати мільйони сторінок історичних документів. Замість того щоб годинами шукати інформацію фізично, як це відбувається зараз, якісна ШІ-модель дозволить перетворити архіви на зручну базу знань, де шукати інформацію можна буде так само легко, як у пошуковику.

У півтора раза швидше ніж Gemma 3. Інтервю з лідером проєкту Lapa LLM — найефективнішою великою мовною моделлю для української мови 
У півтора раза швидше, ніж Gemma 3. Інтерв’ю з лідером проєкту Lapa LLM — найефективнішою великою мовною моделлю для української мови 
По темi
У півтора раза швидше, ніж Gemma 3. Інтерв’ю з лідером проєкту Lapa LLM — найефективнішою великою мовною моделлю для української мови 
Українська відповідь ChatGPT. Як «Київстар» із Мінцифри будуватимуть національну LLM для України: інсайти й міжнародний ШІ-досвід VEON
Українська відповідь ChatGPT. Як «Київстар» із Мінцифри будуватимуть національну LLM для України: інсайти й міжнародний ШІ-досвід VEON
По темi
Українська відповідь ChatGPT. Як «Київстар» із Мінцифри будуватимуть національну LLM для України: інсайти й міжнародний ШІ-досвід VEON
«Триває найважливіша частина роботи». Федоров розповів на якому етапі розробки перебуває національна LLM
«Триває найважливіша частина роботи». Федоров розповів на якому етапі розробки перебуває національна LLM
По темi
«Триває найважливіша частина роботи». Федоров розповів на якому етапі розробки перебуває національна LLM
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
3 коментарі
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
2 коментарі
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті. 

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.