UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉
Марія БровінськаШІ
15 квітня 2026, 09:15
2026-04-15
Вам теж набридло слово LLM? Ось просте пояснення головних AI-термінів без булшіту від dev.ua
Якщо вам здається, що в останні кілька років усі раптом почали говорити якоюсь новою мовою — вам не здається. На мітингах, у вакансіях і навіть у звичайних робочих чатах постійно з’являються дивні слова: LLM, inference, токени, галюцинації, агенти.
І проблема навіть не в тому, що вони складні. А в тому, що їх часто використовують так, ніби всі й так усе розуміють. Пояснюємо, що це за диво-терміни та як їх розуміти.
Якщо вам здається, що в останні кілька років усі раптом почали говорити якоюсь новою мовою — вам не здається. На мітингах, у вакансіях і навіть у звичайних робочих чатах постійно з’являються дивні слова: LLM, inference, токени, галюцинації, агенти.
І проблема навіть не в тому, що вони складні. А в тому, що їх часто використовують так, ніби всі й так усе розуміють. Пояснюємо, що це за диво-терміни та як їх розуміти.
Зміст
Що таке LLM і чому всі про них говорять
LLM — це, по суті, те, з чим ви спілкуєтесь, коли відкриваєте будь-який сучасний AI-чат. Це велика мовна модель, яка «прочитала» гігантську кількість текстів і навчилася помічати закономірності в мові.
Коли ви ставите їй запитання, вона не шукає правильну відповідь у базі знань. Вона генерує найбільш імовірне продовження вашого запиту. Саме тому іноді здається, що вона розумна, а іноді — що говорить повну нісенітницю.
Сам підхід називається deep learning. Завдяки йому модель не просто виконує інструкції, а вчиться на прикладах і помилках.
Всередині цієї системи є weights — числові параметри, які визначають, що важливіше, а що ні. По суті, це і є «пам’ять» моделі.
AGI, мультимодальність і куди це все рухається
Окремо часто згадують AGI — це такий умовний «святий Грааль» індустрії. Ідея в тому, щоб створити ШІ, який зможе виконувати більшість задач не гірше за людину. Проблема в тому, що навіть у самій індустрії немає єдиного визначення, що це означає.
Натомість більш реальна історія сьогодні — це multimodal AI. Тобто моделі, які працюють не тільки з текстом, а й із зображеннями, відео і звуком. Один інтерфейс — багато типів даних.
Чому AI «вигадує», і це нормально (майже)
Ця нісенітниця має окрему назву — hallucinations. На практиці це означає, що модель вигадує: може послатися на вигадане дослідження, придумати факт або дати дуже впевнену, але неправильну відповідь.
І головне — вона не знає, що помиляється. Для неї це просто ще один «імовірний» варіант. Саме тому всі сервіси просять перевіряти відповіді, навіть якщо вони звучать переконливо.
Щоб це виправити, використовують RAG — підхід, коли модель підтягує реальні дані з баз або інтернету перед відповіддю.
Паралельно існує цілий напрям alignment — спроба зробити поведінку моделей безпечнішою і більш передбачуваною.
Як модель вчиться: training, fine-tuning і distillation
До того як почати відповідати, модель проходить training — навчання на величезних масивах даних.
Але майже ніхто не тренує моделі з нуля. Замість цього використовують transfer learning — беруть готову модель і адаптують її. Це доопрацювання називається fine-tuning. А якщо потрібно зробити модель дешевшою — застосовують distillation: «переливають» знання великої моделі в меншу.
За що ви насправді платите: що таке токени
Коли йдеться про платний AI, дуже швидко з’являється слово «токени». Саме через них списуються гроші.
Якщо спростити, токени — це шматочки тексту, які модель обробляє. Що довший ваш запит і що довша відповідь, то більше таких шматків потрібно. А отже — то дорожче це коштує.
Є ще context window — обсяг тексту, який модель може «пам’ятати» в межах діалогу. Якщо ви виходите за цей ліміт, вона починає забувати попередні частини розмови.
Що відбувається, коли модель «думає»
Коли ви пишете запит і чекаєте на відповідь, запускається процес, який називається inference. Це момент, коли модель реально працює: аналізує запит і генерує відповідь.
Саме тут відчувається швидкість сервісу. Якщо все відбувається повільно — це питання інфраструктури й навантаження, а не тільки «розумності» моделі.
У цей момент працюють embeddings — спеціальні векторні представлення, які дозволяють моделі розуміти сенс слів, а не просто їх форму.
А щоб відповіді були точнішими, іноді використовують chain of thought — модель «думає кроками», як людина, яка розв’язує задачу на папері.
До того, як почати відповідати на запити, модель проходить етап training — навчання на величезних масивах даних. Це складний і дорогий процес, який можуть дозволити собі лише великі компанії.
Тому більшість продуктів працює інакше: вони беруть уже готову модель і додатково навчають її під конкретні завдання. Це називається fine-tuning. Саме так з’являються AI-рішення для медицини, юриспруденції чи сапорту.
Навіщо моделі «думають кроками»
Щоб зробити відповіді точнішими, іноді використовують підхід, що називається chain of thought. У цьому випадку модель не відповідає одразу, а ніби розкладає завдання на кілька кроків і проходить їх послідовно.
Це займає більше часу, зате результат зазвичай кращий — особливо в завданнях, де є логіка або обчислення.
Чому важливо вміти правильно формулювати запити
Звідси з’явився окремий навик — prompt engineering. Це вміння чітко пояснити моделі, що ви від неї хочете.
Є навіть підходи типу zero-shot і few-shot. У першому випадку ви просто ставите задачу, у другому — додаєте приклади, щоб модель краще зрозуміла, що від неї очікується.
А ще існує system prompt — це «невидимі інструкції», які задають поведінку моделі ще до того, як ви почали діалог.
Генерація зображень, кеш і трохи магії
Якщо говорити про картинки, тут працює diffusion — технологія, яка збирає зображення буквально з шуму.
Щоб все працювало швидше, використовується memory cache — модель зберігає частину обчислень і не рахує їх заново щоразу.
Окремий клас моделей — GAN — працює як змагання двох нейромереж, що дозволяє створювати дуже реалістичний контент.
Що таке AI-агенти та чому про них так багато говорять
AI-агенти — це спроба зробити наступний крок. Якщо звичайний AI відповідає на запитання, то агент має виконувати дії.
Наприклад, щось знайти, забронювати, зібрати або навіть написати код і запустити його. Звучить як логічна еволюція, але поки що ця технологія ще формується, і навколо неї значно більше хайпу, ніж стабільних рішень.
Що стоїть за всім цим: compute
Уся ця магія працює не сама по собі. За нею стоїть те, що в індустрії називають compute — обчислювальні потужності. Ідеться про сервери, відеокарти, дата-центри — усю інфраструктуру, що дає змогу моделям навчатися та працювати. І сьогодні це один із ключових ресурсів у світі AI: більше потужностей — більше можливостей.
І тут починається дефіцит. Настільки, що з’явився навіть термін RAMageddon — коли пам’яті не вистачає через попит з боку AI-компаній.
Ще один тренд — open weights. Компанії відкривають доступ до моделей, але не до всіх деталей їх створення.
Чому всі цими словами так легко розкидаються
У результаті з’являється відчуття, що AI — це щось дуже складне й майже недоступне для розуміння. Хоча насправді більшість цих термінів описують доволі прості речі.
Проблема не в самих словах, а в тому, як їх використовують — часто без пояснень і з зайвим пафосом.
Але є й хороша новина: щоб орієнтуватися в цій темі, не потрібно бути дослідником AI. Достатньо розуміти базові принципи й не боятися ставити прості запитання.
Бо дуже швидко стає помітно, хто дійсно розуміє, про що говорить, а хто просто повторює модні слова.
32-годинний робочий тиждень, нова податкова система та «майже комунізм». OpenAI рекомендувала урядам готуватися до змін через тотальне впровадження ШІ. 5 ключових тез із документу
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.
Хочете повідомити важливу новину? Пишіть у Telegram-бот
Головні події та корисні посилання в нашому Telegram-каналі