Реклама партнера — Название партнёра
UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

Вам теж набридло слово LLM? Ось просте пояснення головних AI-термінів без булшіту від dev.ua

Якщо вам здається, що в останні кілька років усі раптом почали говорити якоюсь новою мовою — вам не здається. На мітингах, у вакансіях і навіть у звичайних робочих чатах постійно з’являються дивні слова: LLM, inference, токени, галюцинації, агенти.

І проблема навіть не в тому, що вони складні. А в тому, що їх часто використовують так, ніби всі й так усе розуміють. Пояснюємо, що це за диво-терміни та як їх розуміти. 

Залишити коментар
Вам теж набридло слово LLM? Ось просте пояснення головних AI-термінів без булшіту від dev.ua

Якщо вам здається, що в останні кілька років усі раптом почали говорити якоюсь новою мовою — вам не здається. На мітингах, у вакансіях і навіть у звичайних робочих чатах постійно з’являються дивні слова: LLM, inference, токени, галюцинації, агенти.

І проблема навіть не в тому, що вони складні. А в тому, що їх часто використовують так, ніби всі й так усе розуміють. Пояснюємо, що це за диво-терміни та як їх розуміти. 

Зміст

Що таке LLM і чому всі про них говорять

LLM — це, по суті, те, з чим ви спілкуєтесь, коли відкриваєте будь-який сучасний AI-чат. Це велика мовна модель, яка «прочитала» гігантську кількість текстів і навчилася помічати закономірності в мові.

Коли ви ставите їй запитання, вона не шукає правильну відповідь у базі знань. Вона генерує найбільш імовірне продовження вашого запиту. Саме тому іноді здається, що вона розумна, а іноді — що говорить повну нісенітницю.

Сам підхід називається deep learning. Завдяки йому модель не просто виконує інструкції, а вчиться на прикладах і помилках.

Всередині цієї системи є weights — числові параметри, які визначають, що важливіше, а що ні. По суті, це і є «пам’ять» моделі.

AGI, мультимодальність і куди це все рухається

Окремо часто згадують AGI — це такий умовний «святий Грааль» індустрії. Ідея в тому, щоб створити ШІ, який зможе виконувати більшість задач не гірше за людину. Проблема в тому, що навіть у самій індустрії немає єдиного визначення, що це означає.

Натомість більш реальна історія сьогодні — це multimodal AI. Тобто моделі, які працюють не тільки з текстом, а й із зображеннями, відео і звуком. Один інтерфейс — багато типів даних.

Чому AI «вигадує», і це нормально (майже)

Ця нісенітниця має окрему назву — hallucinations. На практиці це означає, що модель вигадує: може послатися на вигадане дослідження, придумати факт або дати дуже впевнену, але неправильну відповідь.

І головне — вона не знає, що помиляється. Для неї це просто ще один «імовірний» варіант. Саме тому всі сервіси просять перевіряти відповіді, навіть якщо вони звучать переконливо.

Щоб це виправити, використовують RAG — підхід, коли модель підтягує реальні дані з баз або інтернету перед відповіддю.

Паралельно існує цілий напрям alignment — спроба зробити поведінку моделей безпечнішою і більш передбачуваною.

Як модель вчиться: training, fine-tuning і distillation

До того як почати відповідати, модель проходить training — навчання на величезних масивах даних.

Але майже ніхто не тренує моделі з нуля. Замість цього використовують transfer learning — беруть готову модель і адаптують її. Це доопрацювання називається fine-tuning. А якщо потрібно зробити модель дешевшою — застосовують distillation: «переливають» знання великої моделі в меншу.

За що ви насправді платите: що таке токени

Коли йдеться про платний AI, дуже швидко з’являється слово «токени». Саме через них списуються гроші.

Якщо спростити, токени — це шматочки тексту, які модель обробляє. Що довший ваш запит і що довша відповідь, то більше таких шматків потрібно. А отже — то дорожче це коштує.

Є ще context window — обсяг тексту, який модель може «пам’ятати» в межах діалогу. Якщо ви виходите за цей ліміт, вона починає забувати попередні частини розмови.

Що відбувається, коли модель «думає»

Коли ви пишете запит і чекаєте на відповідь, запускається процес, який називається inference. Це момент, коли модель реально працює: аналізує запит і генерує відповідь.

Саме тут відчувається швидкість сервісу. Якщо все відбувається повільно — це питання інфраструктури й навантаження, а не тільки «розумності» моделі.

У цей момент працюють embeddings — спеціальні векторні представлення, які дозволяють моделі розуміти сенс слів, а не просто їх форму.

А щоб відповіді були точнішими, іноді використовують chain of thought — модель «думає кроками», як людина, яка розв’язує задачу на папері.

До того, як почати відповідати на запити, модель проходить етап training — навчання на величезних масивах даних. Це складний і дорогий процес, який можуть дозволити собі лише великі компанії.

Тому більшість продуктів працює інакше: вони беруть уже готову модель і додатково навчають її під конкретні завдання. Це називається fine-tuning. Саме так з’являються AI-рішення для медицини, юриспруденції чи сапорту.

Навіщо моделі «думають кроками»

Щоб зробити відповіді точнішими, іноді використовують підхід, що називається chain of thought. У цьому випадку модель не відповідає одразу, а ніби розкладає завдання на кілька кроків і проходить їх послідовно.

Це займає більше часу, зате результат зазвичай кращий — особливо в завданнях, де є логіка або обчислення.

Чому важливо вміти правильно формулювати запити

Звідси з’явився окремий навик — prompt engineering. Це вміння чітко пояснити моделі, що ви від неї хочете.

Є навіть підходи типу zero-shot і few-shot. У першому випадку ви просто ставите задачу, у другому — додаєте приклади, щоб модель краще зрозуміла, що від неї очікується.

А ще існує system prompt — це «невидимі інструкції», які задають поведінку моделі ще до того, як ви почали діалог.

Генерація зображень, кеш і трохи магії

Якщо говорити про картинки, тут працює diffusion — технологія, яка збирає зображення буквально з шуму.

Щоб все працювало швидше, використовується memory cache — модель зберігає частину обчислень і не рахує їх заново щоразу.

Окремий клас моделей — GAN — працює як змагання двох нейромереж, що дозволяє створювати дуже реалістичний контент.

Що таке AI-агенти та чому про них так багато говорять

AI-агенти — це спроба зробити наступний крок. Якщо звичайний AI відповідає на запитання, то агент має виконувати дії.

Наприклад, щось знайти, забронювати, зібрати або навіть написати код і запустити його. Звучить як логічна еволюція, але поки що ця технологія ще формується, і навколо неї значно більше хайпу, ніж стабільних рішень.

Що стоїть за всім цим: compute

Уся ця магія працює не сама по собі. За нею стоїть те, що в індустрії називають compute — обчислювальні потужності. Ідеться про сервери, відеокарти, дата-центри — усю інфраструктуру, що дає змогу моделям навчатися та працювати. І сьогодні це один із ключових ресурсів у світі AI: більше потужностей — більше можливостей.

І тут починається дефіцит. Настільки, що з’явився навіть термін RAMageddon — коли пам’яті не вистачає через попит з боку AI-компаній.

Ще один тренд — open weights. Компанії відкривають доступ до моделей, але не до всіх деталей їх створення.

Чому всі цими словами так легко розкидаються

У результаті з’являється відчуття, що AI — це щось дуже складне й майже недоступне для розуміння. Хоча насправді більшість цих термінів описують доволі прості речі.

Проблема не в самих словах, а в тому, як їх використовують — часто без пояснень і з зайвим пафосом.

Але є й хороша новина: щоб орієнтуватися в цій темі, не потрібно бути дослідником AI. Достатньо розуміти базові принципи й не боятися ставити прості запитання.

Бо дуже швидко стає помітно, хто дійсно розуміє, про що говорить, а хто просто повторює модні слова.

Штучний інтелект може залишити без роботи 14 млн українців і завдати бюджету збитків на 242 млрд грн
Штучний інтелект може залишити без роботи 1,4 млн українців і завдати бюджету збитків на 242 млрд грн
По темi
Штучний інтелект може залишити без роботи 1,4 млн українців і завдати бюджету збитків на 242 млрд грн
Штучний інтелект не знищить ті робочі місця де є «міцний професійний пакет компетенцій» — стверджують у дослідженні. Що це означає?
Штучний інтелект не знищить ті робочі місця, де є «міцний професійний пакет компетенцій» — стверджують у дослідженні. Що це означає?
По темi
Штучний інтелект не знищить ті робочі місця, де є «міцний професійний пакет компетенцій» — стверджують у дослідженні. Що це означає?
32-годинний робочий тиждень нова податкова система та «майже комунізм». OpenAI рекомендувала урядам готуватися до змін через тотальне впровадження ШІ. 5 ключових тез із документу
32-годинний робочий тиждень, нова податкова система та «майже комунізм». OpenAI рекомендувала урядам готуватися до змін через тотальне впровадження ШІ. 5 ключових тез із документу
По темi
32-годинний робочий тиждень, нова податкова система та «майже комунізм». OpenAI рекомендувала урядам готуватися до змін через тотальне впровадження ШІ. 5 ключових тез із документу
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
3 коментарі
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
2 коментарі
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті. 

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.