Велика мовна модель від Мінцифри та «Київстар». Це просто політичний проєкт чи навпаки — справжній плацдарм для відбудови культурного коду українця
Під час зйомок останнього епізоду нашого подкасту про штучний інтелект «Шо по Ші» ми записали інтерв’ю з Мішею Нестером, директором із розробки Digital-продуктів «Київстар».
Під час зйомок останнього епізоду нашого подкасту про штучний інтелект «Шо по Ші» ми записали інтерв’ю з Мішею Нестером, директором із розробки Digital-продуктів «Київстар».
Ділимося з вами резюме цієї бесіди.
Декілька днів тому, під час ІТ Arena, CEO «Київстар» Олександр Комаров розповів, що за останні 6 років (з 2019 до 2025 року) команда розробників телеком-оператора зросла з нуля до 350 людей. Міша допоміг нам узагальнити інформацію про те, чим займається ІТ-підрозділ найбільшого оператору зв’язку і як «Київстар» разом із Мінцифрою розвиватимуть національну мовну модель, чи витримає вона конкуренцію з ChatGPT.
— Мішо, правильно казати, що ти очолюєш розробку всіх цифрових продуктів «Київстар»?
— Так, моя офіційна посада — директор із розробки Digital-продуктів. Але варто пояснити структуру. У нас є класичний IT-департамент, який відповідає за білінгові системи, мережеві рішення, тобто все, що ближче до телекомівського «заліза» та складних вендорських систем. Ми цим не займаємося.
Моя команда відповідає за все, що вище API layer: сервіси, мобільні додатки, вебсайти, self-service, інтерфейси для кол-центрів і магазинів, сервіси для B2B-клієнтів, M2M-керування SIM-картами, маркетингові SaaS-продукти, e-commerce, підписки. Це велика екосистема digital-рішень.
— Включно із ШІ?
— Так.
— А напрям Big Data теж у твоєму підпорядкуванні?
— Ні, це окремий департамент. Ми з ними тісно співпрацюємо, але вони існують автономно. Big Data в «Київстар» розвивається давно, традиційно на базі телекомівських даних.
— У багатьох організаціях зараз з’являються Chief AI Officer або Head of AI. У вас такої позиції немає. Чому?
— Я думаю, що сьогодні Head of AI — це щось на кшталт колишнього Head of Change чи Transformation. Це людина, яка ні за що конкретно не відповідає, але має «затягувати» нову тему в компанію.
В Україні ніхто не розробляє власні великі мовні моделі — це десятки мільярдів доларів інвестицій. Ми всі базуємося на open-source-архітектурах. Далі вже йдеться про fine-tuning і донавчання моделей на ексклюзивних даних. Тому AI — це скоріше прикладні речі в софті. Якщо в тебе є інженери з продуктовим мисленням, вони можуть інтегрувати AI у конкретні процеси.
— А як це виглядає на практиці в «Київстар»?
— Наприклад, внутрішня автоматизація — Help Desk, 4000 співробітників. І замість того, щоб бігати до HR чи писати листи в Outlook, вони відкривають чат та українською мовою оформлюють відпустку чи іншу заявку. Це внутрішні процеси з розпізнаванням природної мови, якими займається наш IT.
Є й інший кейс — чатботи для десятків мільйонів абонентів і B2B-клієнтів. Тут KPI зовсім інші: зменшення навантаження на кол-центри, швидкість вирішення проблем, іноді апсели. Це не просто база знань — бот інтегрований із білінгом і сервісами, може показати залишок на рахунку, запропонувати тариф і відразу підключити його.
— Тобто окремий AI-директор вам не потрібен?
— Так. Це якби ми шукали «директора по Java» чи «CTO по Javascript». У нас уже є спеціалісти, які розбираються в домені, і команди, що реалізовують потрібні рішення.
— Але ж у деяких компаніях Head of AI займається не технічним впровадженням, а просуванням AI-грамотності всередині, евангелізмом. У вас таке потрібно?
— У нас цим займаються CPO, CIO, керівник Big Data й інші технічні лідери. Вони «продають» ідеї всередині компанії, шукають кейси для автоматизації. З іншого боку, сам бізнес теж тисне — усі користуються ChatGPT чи Claude та приносять ідеї у свої команди. Це двосторонній рух.
— Хто першим вийшов з ініціативою створення національної мовної моделі: Мінцифра чи ви?
— Насправді — ні так, ні так. Ідея належить Мінцифрі. Міністр Федоров і його команда озвучили цю стратегію публічно, ще на майданчиках і в інтерв’ю. Держава вирішила: нам потрібна власна LLM як частина цифрового суверенітету.
Але в цей момент ми в «Київстар» теж уже думали в цьому напрямі. У нас є група компаній (VEON — ред.) — Бангладеш, Пакистан, Казахстан, великі ринки, де теж активно експериментують із мовними моделями. Ми бачили кейси, обговорювали це між собою, читали новини й вирішили: «Так, ми теж хочемо це робити».
Тому, коли Мінцифра почала рухатися, ми сконтактувалися. Спочатку спілкувалися перші особи, потім я вже долучився до перемовин.
— Як відбувався цей переговорний процес?
— Треба було синхронізувати дуже багато речей. Наприклад, домовитися, що модель буде open source й доступна державі, університетам, науковим інституціям. Важливі питання — безпека, відповідність ресурсів, прозорість. Після серії перемовин це закріпили у меморандумі, який підписали Михайло Федоров та Олександр Комаров від імені «Київстар».
— Для держави користь зрозуміла: цифровий суверенітет. А яка мотивація для вас, для бізнесу?
— Для нас це очевидно. Це унікальний проєкт, який в Україні ще ніхто не робив. Він дає нам нову експертизу, яку можна використати в майбутніх бізнес-продуктах. Це виклик — і нам цікаво його прийняти.
Це непросте завдання. Якби це було легко, її б робив хтось інший. А так ми розвиваємо внутрішню експертизу й водночас підсилюємо ринок. Адже що більше буде технологічних компаній в Україні, то цікавіше й для нас. Ми ж купуємо продуктові компанії, інвестуємо в розвиток екосистеми.
— Це інвестпроєкт? Ви вкладаєте великі гроші?
— Зараз це радше R&D історія, а не класичний інвестпроєкт. Ми попередньо анонсували, що мова йде про мільйони доларів. Це суттєво, але це інвестиції не у швидкий прибуток, а в експертизу й екосистему.
— Чи не можна назвати це політичною угодою з державою?
— Ні, це не політика. Це радше R&D-співпраця. Ми створюємо щось нове для країни й одночасно прокачуємо власні технології.
— Які практичні результати такі проєкти можуть давати?
— Ось, наприклад, ми розвиваємо свою платформу чатботів. Раніше були вендорські рішення, тепер це повністю інхаус-розробка. І от ми зараз маємо нову власну NLP і поступово розкатуємо всередині генеративний AI (на початку липня ми почали міграцію зі старого рішення). Для клієнтів це непомітно, але ми вже тестуємо текстову взаємодію.
— І коли користувачі «Київстар» це відчують?
— Частково вже зараз. Текстові сервіси працюють, а у наступному році ми додаємо голосові сценарії. Це поступовий процес, але він уже йде.
Це щось на кшталт нового покоління IVR: не треба натискати «1» чи «2», ти просто говориш — і агент розуміє тебе майже як жива людина.
Я бачив демо у глобальних вендорів: 97% людей не відрізняють, що спілкуються не з оператором, а з ботом. І це не просто «поговорити» — агент може підключити послугу, нарахувати платіж, підтягнути інформацію з білінгу. Це зовсім інший рівень.
— І все ж не всі користувачі готові спілкуватися з ботами. Є ті, хто хоче «живої» взаємодії.
— Це нормально. Є завжди частина людей, які хочуть крафтового досвіду — щоб їх обслуговувала касирка чи продавець за прилавком. Але поступово таких менше. Як і з касами самообслуговування: спочатку їх не любили, тепер вони стали нормою. З голосовими агентами буде так само.
— Але є й скептики. Вони ставлять під сумнів сенс створення національної LLM. Як ви це сприймаєте?
— Це нормально, нові ідеї завжди викликають критику. Але ми переконані: така модель потрібна. І поясню, чому. Сказати «просто візьмемо готову модель» може тільки людина, яка ніколи не намагалася запустити продакшн-рішення високого навантаження. У будь-якому застосуванні — від розпізнавання документів і перекладів до customer support чи sales-скриптів — vanilla-моделі не витягують українську.
Візьміть, наприклад, юридичні тексти. Якщо попросити англомовну модель зробити адаптацію під українське законодавство, вона починає вигадувати слова, пропускати терміни. Для кулінарного рецепта в ChatGPT цього досить. Але для реального бізнес-рішення — ні.
— Тобто ключ у локалізації під українську мову й контекст?
— Саме так. Generic-моделі навчаються на тому, що є у відкритому інтернеті. А що там з української історії чи культури? Україна завжди була частиною імперій, і масив текстів з української точки зору — у меншості. Якщо ми залишимо все як є, наші діти питатимуть про історію, а модель відповідатиме: «Не все так однозначно». Ми ж хочемо, щоб було однозначно: український контекст, мова, культура.
— Але ж є скепсис: як змусити людину користуватися саме українською LLM, а не ChatGPT?
— Тут ключова ідея: ми не мислимо категоріями B2C. Це B2B2C або B2G2C. Умовно: людина користується «Дією», державними чи освітніми сервісами — а під капотом працює українська LLM. Ніхто нікому нічого не нав’язує. Просто ми створюємо альтернативу, яка стане фундаментом для екосистеми державних і комерційних сервісів.
— Тобто завдання — не масмаркет, а інфраструктура?
— Абсолютно. Це як з медіа. Якщо ти присутній у медіаполі — у тебе є свій голос, своя перспектива. Якщо ні — тебе просто немає. Ми хочемо, щоб Україна була представлена на мапі AI-продуктів.
— Але ринок LLM дуже конкурентний. Світові гравці інвестують мільярди. Як не «випасти з перегонів»?
— Це справді нескінченний процес. Але давайте подивимося реалістично. По-перше, більшість топових гравців зараз субсидуються. Усі «дешеві токени», які ми маємо, — це маркетингові бюджети венчурів. Колись інвестори попросять прибутковість.
По-друге, вартість комп’юту падає з кожною новою ітерацією GPU. Те, що сьогодні коштує мільйони, через два роки буде значно дешевше.
По-третє, досвід і дата-сети. Коли ти один раз пройшов шлях — зібрав команду, емелопсів, лінгвістів, зробив бенчмарки, розмітку даних, ти вже можеш швидко адаптуватися під нову архітектуру. Сьогодні це LLaMA, завтра Gemma чи інша open source-модель. Повторна ітерація коштує значно дешевше, ніж перша.
— Тобто ви бачите це як довгострокову інвестицію в експертизу?
— Саме так. Ми не робимо закритий комерційний продукт. Це open source-ініціатива, яка насамперед потрібна державі, освіті, оборонці. Це база для «Дії», цифрової освіти, дослідницьких центрів. Ми будуємо інфраструктуру, на якій можна розвивати екосистему українських AI-рішень.
— Далі ви передаєте результати в ком’юніті та ринок, і вже інші підхоплюють?
— Саме так. Ми не єдині, хто має тягнути це 5 років. Це постійне взаємозбагачення. І це одна з наших ключових мотивацій. Чим більше таких ініціатив буде, тим помітнішою стане Україна на світовій мапі технологій.
— Але ж ви плануєте й заробляти на цьому?
— Безумовно. Уже зараз ми маємо готові інструменти. Наприклад, чатбот платформу з Agent-можливостями, яку зробили in-house. Ми нікому не платимо ліцензій — це наша розробка. Автоматизація саппорта на масштабах «Київстару» — це великі гроші. І далі ми плануємо продавати цей досвід іншим компаніям в Україні, які мають масові процеси підтримки: у фінтеку, e-commerce, медицині. Ми зможемо зробити це швидше й дешевше, ніж якщо вони почнуть із нуля.
— Але ж над подібними рішеннями працює й Vodafone. Це конкуренція?
— Це абсолютно нормально. Конкуренція є й буде. Vodafone теж має свої розробки й може заявляти, що в них є крута модель, яку вони хочуть продавати. Це бізнес.
— Тобто Мінцифра віддаватиме всі проєкти вам, а не їм?
— Ні, так питання не стоїть. Мінцифра має власні внутрішні команди, свою інфраструктуру. Ми не є підрядниками Мінцифри. Тут радше про партнерство. Ми самі проявили ініціативу. Ніхто не забороняв іншим компаніям зробити те саме.
— Ви згадали, що маєте міжнародний досвід. Розкажіть детальніше.
— Минулого року ми реалізували великий проєкт у Казахстані. Це був 12-місячний R&D із залученням семи національних університетів, десятків лінгвістів. Ми працювали з LLaMA як базовою моделлю, робили великий pre-training і fine-tuning. Для нас це була цінна школа, і тепер ми хочемо використати цей досвід для України.
— Яку базову модель ви плануєте брати для України?
— Зараз остаточного рішення немає. Це може бути LLaMA від Meta, Gemma від Google чи інша open source-модель. Ми залишаємо цей процес публічним і прозорим, рішення ухвалюватимемо разом із партнерами з AI Center.
— У чому головне непорозуміння навколо LLM?
— Багато хто плутає LLM із чатботом. Але чатбот — це лише софт, який має інтерфейс і вміє працювати з intent recognition: зрозуміти, чого хоче користувач, зіставити це з портфоліо продуктів чи послуг компанії й видати відповідь. LLM у цьому процесі використовується як один із інструментів — наприклад, для парсингу запитів чи генерації текстів.
Далі в гру вступають інтеграції: білінг, CRM, API-виклики. Це складна архітектура, яка має швидко масштабуватись, а не щось, що збирається «на коліні». Саме таку платформу ми будуємо.
— Тобто можна використовувати різні моделі залежно від завдання?
— Саме так. Наприклад, для простих запитів достатньо маленької й дешевої LLM. Для складних — дорожчої й потужнішої. Один із американських вендорів показував мені демо: у них під капотом працює 13 моделей, кожна для свого завдання. Але користувач цього не помічає, усе відбувається seamless.
— Де відбувається навчання моделей і як потім вони деплояться?
— Навчання відбувається там, де зовнішній доступ неможливий. Результатом є швидка LLM у вигляді бінарника, яку можна деплоїти будь-де: у клауді чи on-premises в Україні, у дата-центрі клієнта. Це не «або-або» — ми робимо там, де зручно клієнту. Наприклад, якщо банк хоче запустити модель у своєму Enterprise-акаунті AWS, ми можемо задеплоїти. Якщо ж у клієнта український дата-центр із власним обладнанням — теж не проблема.
Сьогодні йде «битва за долю ринку»: моделі та знання стають комодіті, вони дешевшають і поширюються. Тому важливо бути там, де ти зараз, і закріпитися на ринку. Це вже не про R&D чи Data Science — це звичайний бізнес: хто краще продає, робить сапорт, інтегрується й має менше багів, той виграє.