Чому GPT-4 краще ніж ChatGPT. Ось п'ять основних відмінностей
Нова модель штучного інтелекту GPT-4 від OpenAI була презентована вчора. Вона вже працює в усіх сферах діяльності: від віртуального волонтера для людей із вадами зору до вдосконаленого бота для вивчення мови в Duolingo.
Нова модель штучного інтелекту GPT-4 від OpenAI була презентована вчора. Вона вже працює в усіх сферах діяльності: від віртуального волонтера для людей із вадами зору до вдосконаленого бота для вивчення мови в Duolingo.
Але що відрізняє GPT-4 від попередніх версій, таких як ChatGPT і GPT-3.5? Ось п’ять найбільших відмінностей між цими системами, на які звернуло увагу американське видання TechCrunch.
1. GPT-4 може бачити та розуміти зображення
Найбільш помітною зміною в цій універсальній системі машинного навчання є те, що вона є «мультимодальною», тобто може розуміти більше ніж одну «модальність» інформації. ChatGPT і GPT-3 були обмежені текстом: вони вміли читати і писати, але на цьому все (хоча для багатьох програм більш ніж достатньо).
Однак GPT-4 можна надати зображення, і він оброблятиме їх, щоб знайти відповідну інформацію. Звичайно, ви можете просто попросити його описати те, що зображено на картинці, але, що важливіше, його розуміння виходить за рамки цього. Приклад, наданий OpenAI, насправді пояснює жарт із зображенням надзвичайно великого роз’єму iPhone.
А партнерство з Be My Eyes, додатком, який використовують сліпі люди та люди зі слабким зором, дозволить описувати те, що бачить їхній телефон.
У відео для Be My Eyes GPT-4 описує візерунок на сукні, визначає рослину, пояснює, як дістатися до певного тренажера в спортзалі, перекладає етикетку (і пропонує рецепт), читає карту та виконує низку інших завдань, які показують, що він справді отримує те, що на зображенні — якщо йому поставити правильні запитання. Він знає, як виглядає сукня, але може не знати, чи підходить це вбрання для вашої співбесіди.
Незважаючи на те, що сучасні чат-боти вміють правильно ухилятися, їх, як правило, легко ввести в оману. Трохи вмовляння може переконати їх, що вони просто пояснюють, що зробив би «поганий штучний інтелект».
GPT-4 був навчений використовувати багато-багато зловмисних підказок, які користувачі люб’язно надсилали OpenAI протягом останніх року чи двох. Зважаючи на це, нова модель набагато краща за своїх попередників щодо «фактичності, керованості та відмови від „виїзду за поручні“».
Як це описує OpenAI, GPT-3.5 (на якому базується ChatGPT) був «тестовим запуском» нової архітектури навчання, і тепер вони застосували ці уроки до нової версії, яка була «безпрецедентно стабільною». Вони також змогли краще передбачити його можливості, що зменшило кількість сюрпризів.
3. GPT-4 має довший обсяг пам’яті
Великі мовні моделі навчаються на мільйонах веб-сторінок, книг та інших текстових даних, але коли вони фактично ведуть розмову з користувачем, існує обмеження щодо того, скільки вони можуть, так би мовити, «тримати в пам’яті». Це обмеження для GPT-3.5 і старої версії ChatGPT становило 4096 «токенів», що становить приблизно 8000 слів, або приблизно чотири-п’ять сторінок книги.
GPT-4 має максимальну кількість токенів 32 768. Це приблизно 64 000 слів або 50 сторінок тексту, яких достатньо для цілої п’єси чи оповідання.
Це означає, що під час розмови чи генерування тексту він зможе запам’ятовувати приблизно 50 сторінок. Тож він запам’ятає, про що ви говорили 20 сторінок чату назад. Або ж, пишучи оповідання чи есе, він може посилатися на події, які відбулися 35 сторінок тому.
4. GPT-4 більш багатомовний
У світі штучного інтелекту домінують англомовні люди, і все, що з цим пов’язано: від даних до тестування та дослідницьких статей. Але, звісно, можливості великих мовних моделей були застосовані в будь-якій письмовій мові і повинні бути доступними в них.
GPT-4 робить великий крок у цьому напрямі, демонструючи, що він здатний відповісти на тисячі запитань з вибором відповідей з високою точністю 26 мовами, від італійської до української та корейської. Найкраще за все він робить завдання для романських і германських мов, але добре генералізує і для інших.
5. GPT-4 має різні «особистості»
«Керованість» — це цікаве поняття в ШІ, яке стосується їх здатності змінювати поведінку моделі на вимогу. Це може бути корисно, наприклад, якщо ШІ має роль співчуваючого слухача, або небезпечно, наприклад, коли люди переконують модель, що вона зла чи депресивна.
GPT-4 інтегрує функцію керованості більш оригінально, ніж GPT-3.5. І користувачі зможуть змінити «класичну особистість ChatGPT із фіксованою багатослівністю, тоном і стилем» на щось більше відповідне їхнім потребам. «У тих межах, які встановлені», — швидко зауважує команда.
Я розумію, що ви просто переклали статтю з TechCrunch, але 8000 слів - це не 4-5 сторінок, а близько 32-х. Можливо, що замість слів там мали бути знаки
Я розумію, що ви просто переклали статтю з TechCrunch, але 8000 слів - це не 4-5 сторінок, а близько 32-х. Можливо, що замість слів там мали бути знаки