Реклама партнера — Название партнёра
UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

«Ми вчимо ШІ читати, а не тільки розуміти»: як український стартап Knowledgator автоматизує структурування даних

Український стартап Knowledgator створив платформу, яка витягує структуру з неструктурованих даних: з наукових статей, фінансових звітів, логів чи навіть юридичних документів. Його вже використовують великі фармацевтичні компанії, банки та технологічні стартапи.

Залишити коментар
«Ми вчимо ШІ читати, а не тільки розуміти»: як український стартап Knowledgator автоматизує структурування даних

Український стартап Knowledgator створив платформу, яка витягує структуру з неструктурованих даних: з наукових статей, фінансових звітів, логів чи навіть юридичних документів. Його вже використовують великі фармацевтичні компанії, банки та технологічні стартапи.

Knowledgator є одним із небагатьох українських стартапів, який фокусується не просто на генерації контенту, а на структурному розумінні текстів. Його технології допомагають перетворити хаос неструктурованих даних на впорядковану й зручну для аналізу інформацію. Про те, як саме це працює, які бізнеси вже користуються платформою та в чому її унікальність, dev.ua поспілкувався з CEO Knowledgator Ігорем Степановим.

«Ми навчаємо модель не просто знаходити ключові слова, а витягувати зв’язки, суть, структуру — фактично читати текст як людина», — розповідає він.

Як працює платформа

Knowledgator, по своїй суті, це універсальна платформа для обробки інформації. Користувач вводить текст (або масив документів), а також шаблон, який описує, які саме сутності потрібно знайти. Це може бути все що завгодно: назви компаній, дати транзакцій, згадки побічних ефектів тощо. На виході користувач отримує структуровані дані у вигляді таблиці або JSON.

«Наші моделі працюють із запитом zero-shot: не треба донавчати під кожне нове завдання. Наприклад, якщо користувачу потрібно витягти специфічні білки з наукових текстів — модель з цим справиться без додаткової підготовки», — пояснює Степанов.

Де це вже працює

Сьогодні Knowledgator використовують у кількох галузях:

  • Фармацевтика. Компанії аналізують тисячі наукових статей для виявлення нових механізмів хвороб або побічних ефектів. За словами Степанова, саме Knowledgator переміг у FDA Challenge — американському конкурсі з автоматичного пошуку згадок побічних ефектів у публікаціях.
  • Банки. Алгоритми Knowledgator обробляють фінансові транзакції, допомагають з KYC/AML і анонімізують чутливі дані.
  • Хмарні провайдери. Використовують платформу для анонімізації логів відповідно до регуляцій GDPR.
  • Стартапи. Інтегрують Knowledgator як частину власних продуктів для структурування клієнтських чи технічних даних.

«Однією з наших переваг є поєднання zero-shot екстракції та можливості донавчання. Якщо клієнт хоче ще вищу точність — ми надаємо інтерфейс для швидкого fine-tuning», — додає Степанов.

Яка точність і як підключитися

За словами CEO, точність моделей залежить від кейсу: для загальних завдань навіть у базовому режимі точність висока, а в критичних (типу обробки медичних документів) вона не може бути меншою за 99%.

«Точність — це ключ. Тому ми або використовуємо zero-shot, або навчаємо спеціалізовані моделі, але завжди на якісних даних», — підкреслює Степанов.

Платформа доступна у кількох форматах. Базові open-source моделі можна завантажити з Hugging Face. Потужніші рішення через API, а найближчим часом стартап відкриє дашборд, який спростить доступ і дозволить налаштовувати моделі під себе.

Хто стоїть за проєктом і куди він рухається

Команда Knowledgator складається з 12 осіб, переважно з України. Стартап отримав pre-seed раунд від Startup Wise Guys, гранти від Українського фонду стартапів та підтримку Google for Startups.

Наразі команда працює над мультимодальністю: окрім текстів, скоро платформа зможе працювати з аудіо та зображеннями. Також активно вдосконалюється підтримка понад 100 мов, серед них і українська.

«Нашою метою є стати лідерами у сфері information extraction. Це не просто моделі — це інфраструктура, яка допоможе світовим компаніям структуровано працювати з хаотичними даними», — підсумовує CEO Knowledgator.

Нагадаємо, у нас також виходив матеріал про те, як українські стартапи вперше отримали шанс позмагатися за фінансування від Єврокомісії окремо від європейських конкурентів. У липні ЄС оголосив новий конкурс, орієнтований винятково на deeptech-команди з України, які вже мають MVP і потенціал масштабування.

Стартап ElevenLabs запустив ШІ-сервіс для генерації музики
Стартап ElevenLabs запустив ШІ-сервіс для генерації музики
По темi
Стартап ElevenLabs запустив ШІ-сервіс для генерації музики
Європейський інвестор InnoEnergy запустив хаб в Україні для підтримки енергостартапів
Європейський інвестор InnoEnergy запустив хаб в Україні для підтримки енергостартапів
По темi
Європейський інвестор InnoEnergy запустив хаб в Україні для підтримки енергостартапів
«Або це буде компанія з екзитом 10x і більше або вона не вистрелить узагалі». Співзасновник венчурного фонду пояснив чому є логіка інвестувати в більш ризикові стартапи
«Або це буде компанія з екзитом 10x і більше, або вона не вистрелить узагалі». Співзасновник венчурного фонду пояснив, чому є логіка інвестувати в більш ризикові стартапи
По темi
«Або це буде компанія з екзитом 10x і більше, або вона не вистрелить узагалі». Співзасновник венчурного фонду пояснив, чому є логіка інвестувати в більш ризикові стартапи
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Читайте також
Вас також кусають комарі? Розповідаємо про пристрій від українських стартаперів, який може цьому зарадити
Вас також кусають комарі? Розповідаємо про пристрій від українських стартаперів, який може цьому зарадити
Вас також кусають комарі? Розповідаємо про пристрій від українських стартаперів, який може цьому зарадити
Як зауважив нещодавно один військовий, якой побажав залишитись невідомим, орки, може, й не поцілять, а комарі точно зʼїдять. І від них потерпають зараз багато українців.  Позбавитись від комарів назавжди ефективно й екологічно допоможе гаджет Mosqitter. Цей стартап заснували дві українки — Анастасія Романова та Ольга Дьячук.  Ми вирішили нагадати, що може Mosqitter, про принципи його роботи та особливості, на злобу дня.  (текст від 21 жовтня 2021 року) 
2 коментарі
«Наша думка може бути суб'єктивною для вас». В Insoft Global відмовилися давати фідбек Project Manager після співбесіди
«Наша думка може бути суб'єктивною для вас». В Insoft Global відмовилися давати фідбек Project Manager після співбесіди
«Наша думка може бути суб'єктивною для вас». В Insoft Global відмовилися давати фідбек Project Manager після співбесіди
«IT Generation схоже на «Гру в кальмара». В мережі з'явилися відгуки кандидатів, які пройшли перші етапи відбору державної програми
«IT Generation схоже на «Гру в кальмара». В мережі з'явилися відгуки кандидатів, які пройшли перші етапи відбору державної програми
«IT Generation схоже на «Гру в кальмара». В мережі з'явилися відгуки кандидатів, які пройшли перші етапи відбору державної програми
Зібрали для вас думки потенційних студентів IT-шкіл.
«Віктор жалкує про зроблене». В DataArt відповіли на матеріал щодо проросійського айтішника
«Віктор жалкує про зроблене». В DataArt відповіли на матеріал щодо проросійського айтішника
«Віктор жалкує про зроблене». В DataArt відповіли на матеріал щодо проросійського айтішника
1 коментар

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.