Реклама партнера — Название партнёра
UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

Загадкова ШІ-модель Hunter Alpha заінтригувала розробників: невже це новий блокбастер від DeepSeek?

Анонімна поява потужної ШІ-моделі Hunter Alpha на платформі для розробників OpenRouter спровокувала припущення, що китайський стартап DeepSeek може таємно тестувати свою систему наступного покоління перед офіційним релізом.

Leave a comment
Загадкова ШІ-модель Hunter Alpha заінтригувала розробників: невже це новий блокбастер від DeepSeek?

Анонімна поява потужної ШІ-моделі Hunter Alpha на платформі для розробників OpenRouter спровокувала припущення, що китайський стартап DeepSeek може таємно тестувати свою систему наступного покоління перед офіційним релізом.

11 березня на ШІ-платформі OpenRouter з’явилася безплатна модель під назвою Hunter Alpha без жодної інформації про розробника. Пізніше платформа схарактеризувала її як приховану модель, пише Reuters.

Під час тестів, проведених агентством Reuters, чат-бот Hunter Alpha назвав себе «китайською моделлю ШІ, переважно навченою китайською мовою» та зазначив, що його навчальні дані актуальні станом на травень 2025 року, що збігається з показниками моделі DeepSeek. 

При цьому система ухилилася від прямої відповіді на питання про розробника. «Мені відомі лише моє ім’я, кількість параметрів та розмір контекстного вікна», — заявив бот».

Ані DeepSeek, ані OpenRouter не назвали творця моделі й не відповіли на запити про коментарі. На сторінці профілю Hunter Alpha описується як модель з 1 трлн параметрів. Це означає, що вона була навчена з використанням приблизно одного трильйона регульованих значень, які визначають, як система обробляє мову та генерує відповіді. Моделі з більшою кількістю параметрів зазвичай потребують значно більше обчислювальних потужностей для роботи. Система також заявляє про контекстне вікно розміром до одного мільйона токенів.

«Поєднанням, яке вразило найбільше, стали контекст Hunter Alpha в 1 мільйон токенів у парі зі здатністю до міркування та безплатним доступом», — зазначив Набіль Хауам, інженер, який розробляє системи ШІ-агентів. — «Більшість передових моделей із таким контекстним вікном коштують чимало при масштабуванні».

Ці характеристики збігаються з очікуваннями місцевих ЗМІ щодо моделі DeepSeek наступного покоління — V4, реліз якої, за даними китайських видань, може відбутися вже у квітні. DeepSeek, як і багато її китайських конкурентів, має солідне фінансування, хоча й вирізняється нетиповою структурою: її материнською компанією є кількісний хедж-фонд, а не технологічний конгломерат.

Хоча такі збіги не доводять прямого зв’язку, вони посилили припущення серед розробників, що анонімна система може бути ранньою тестовою версією майбутнього релізу DeepSeek.

«Найбільше модель видає характерний ланцюжок міркувань», — пояснює ШІ-інженер Деніел Дьюхерст, наголошуючи на специфічній логіці відповідей бота. — «Стиль міркування важко приховати, і він зазвичай відображає те, як саме навчалася модель».

Масштаб і обсяг пам’яті Hunter Alpha також відповідають характеристикам DeepSeek V4. Проте деякі розробники застерігають, що докази зв’язку моделі з DeepSeek залишаються непереконливими.

«Мій аналіз свідчить про те, що Hunter Alpha, найімовірніше, не є DeepSeek V4», — зазначив Умур Озкул, який проводить незалежні бенчмарк-тести ШІ, посилаючись на відмінності в роботі з токенами та архітектурних патернах порівняно з наявними системами DeepSeek.

Він зазначив, що припущення про зв’язок моделі з DeepSeek цілком зрозумілі, враховуючи час її появи та заявлені можливості.

Анонімні запуски моделей не є рідкістю, оскільки такі платформи, як OpenRouter, дозволяють розробникам надсилати запити до десятків моделей ШІ через єдиний інтерфейс, що робить їх популярним полігоном для випробування нових систем.

Наприклад, анонімна модель під назвою Pony Alpha з’явилася на OpenRouter у лютому, а вже за п’ять днів китайська компанія Zhipu AI підтвердила, що та була частиною її системи GLM-5.

У профілі Hunter Alpha зазначено, що всі промпти та відповіді моделі «реєструються провайдером і можуть бути використані для її вдосконалення». Це підкреслює поширену в індустрії практику використання прихованих запусків для отримання неупередженого зворотного зв’язку. 

DeepSeek знайшла новий підхід до навчання LLM-моделей який може знову перевернути ШІ-ринок
DeepSeek знайшла новий підхід до навчання LLM-моделей, який може знову перевернути ШІ-ринок
По темi
DeepSeek знайшла новий підхід до навчання LLM-моделей, який може знову перевернути ШІ-ринок
DeepSeek представив нову ШІ-модель V3.1-Exp яку назвав «проміжним кроком до архітектури наступного покоління»
DeepSeek представив нову ШІ-модель V3.1-Exp, яку назвав «проміжним кроком до архітектури наступного покоління»
По темi
DeepSeek представив нову ШІ-модель V3.1-Exp, яку назвав «проміжним кроком до архітектури наступного покоління»
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Also Read
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
3 comments
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
2 comments
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті. 

Have important news to share? Message our Telegram bot

Key events and useful links in our Telegram channel

Discussion
No comments yet.