UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉
Валентин ШнайдерСтартап
8 серпня 2025, 10:30
2025-08-08
«Ми вчимо ШІ читати, а не тільки розуміти»: як український стартап Knowledgator автоматизує структурування даних
Український стартап Knowledgator створив платформу, яка витягує структуру з неструктурованих даних: з наукових статей, фінансових звітів, логів чи навіть юридичних документів. Його вже використовують великі фармацевтичні компанії, банки та технологічні стартапи.
Український стартап Knowledgator створив платформу, яка витягує структуру з неструктурованих даних: з наукових статей, фінансових звітів, логів чи навіть юридичних документів. Його вже використовують великі фармацевтичні компанії, банки та технологічні стартапи.
Knowledgator є одним із небагатьох українських стартапів, який фокусується не просто на генерації контенту, а на структурному розумінні текстів. Його технології допомагають перетворити хаос неструктурованих даних на впорядковану й зручну для аналізу інформацію. Про те, як саме це працює, які бізнеси вже користуються платформою та в чому її унікальність, dev.ua поспілкувався з CEO Knowledgator Ігорем Степановим.
«Ми навчаємо модель не просто знаходити ключові слова, а витягувати зв’язки, суть, структуру — фактично читати текст як людина», — розповідає він.
Як працює платформа
Knowledgator, по своїй суті, це універсальна платформа для обробки інформації. Користувач вводить текст (або масив документів), а також шаблон, який описує, які саме сутності потрібно знайти. Це може бути все що завгодно: назви компаній, дати транзакцій, згадки побічних ефектів тощо. На виході користувач отримує структуровані дані у вигляді таблиці або JSON.
«Наші моделі працюють із запитом zero-shot: не треба донавчати під кожне нове завдання. Наприклад, якщо користувачу потрібно витягти специфічні білки з наукових текстів — модель з цим справиться без додаткової підготовки», — пояснює Степанов.
Де це вже працює
Сьогодні Knowledgator використовують у кількох галузях:
Фармацевтика. Компанії аналізують тисячі наукових статей для виявлення нових механізмів хвороб або побічних ефектів. За словами Степанова, саме Knowledgator переміг у FDA Challenge — американському конкурсі з автоматичного пошуку згадок побічних ефектів у публікаціях.
Банки. Алгоритми Knowledgator обробляють фінансові транзакції, допомагають з KYC/AML і анонімізують чутливі дані.
Хмарні провайдери. Використовують платформу для анонімізації логів відповідно до регуляцій GDPR.
Стартапи. Інтегрують Knowledgator як частину власних продуктів для структурування клієнтських чи технічних даних.
«Однією з наших переваг є поєднання zero-shot екстракції та можливості донавчання. Якщо клієнт хоче ще вищу точність — ми надаємо інтерфейс для швидкого fine-tuning», — додає Степанов.
Яка точність і як підключитися
За словами CEO, точність моделей залежить від кейсу: для загальних завдань навіть у базовому режимі точність висока, а в критичних (типу обробки медичних документів) вона не може бути меншою за 99%.
«Точність — це ключ. Тому ми або використовуємо zero-shot, або навчаємо спеціалізовані моделі, але завжди на якісних даних», — підкреслює Степанов.
Платформа доступна у кількох форматах. Базові open-source моделі можна завантажити з Hugging Face. Потужніші рішення через API, а найближчим часом стартап відкриє дашборд, який спростить доступ і дозволить налаштовувати моделі під себе.
Хто стоїть за проєктом і куди він рухається
Команда Knowledgator складається з 12 осіб, переважно з України. Стартап отримав pre-seed раунд від Startup Wise Guys, гранти від Українського фонду стартапів та підтримку Google for Startups.
Наразі команда працює над мультимодальністю: окрім текстів, скоро платформа зможе працювати з аудіо та зображеннями. Також активно вдосконалюється підтримка понад 100 мов, серед них і українська.
«Нашою метою є стати лідерами у сфері information extraction. Це не просто моделі — це інфраструктура, яка допоможе світовим компаніям структуровано працювати з хаотичними даними», — підсумовує CEO Knowledgator.
Нагадаємо, у нас також виходив матеріал про те, як українські стартапи вперше отримали шанс позмагатися за фінансування від Єврокомісії окремо від європейських конкурентів. У липні ЄС оголосив новий конкурс, орієнтований винятково на deeptech-команди з України, які вже мають MVP і потенціал масштабування.
«Або це буде компанія з екзитом 10x і більше, або вона не вистрелить узагалі». Співзасновник венчурного фонду пояснив, чому є логіка інвестувати в більш ризикові стартапи
Вас також кусають комарі? Розповідаємо про пристрій від українських стартаперів, який може цьому зарадити
Як зауважив нещодавно один військовий, якой побажав залишитись невідомим, орки, може, й не поцілять, а комарі точно зʼїдять. І від них потерпають зараз багато українців.
Позбавитись від комарів назавжди ефективно й екологічно допоможе гаджет Mosqitter. Цей стартап заснували дві українки — Анастасія Романова та Ольга Дьячук.
Ми вирішили нагадати, що може Mosqitter, про принципи його роботи та особливості, на злобу дня.
(текст від 21 жовтня 2021 року)