Марія Бровінська ШІ 24 червня 2026, 09:05

Empero випустила нецензуровану модель Qwythos-9B — і заявила, що навчала її на даних закритої Claude Mythos

Компанія Empero AI опублікувала на HuggingFace відкриту модель Qwythos-9B — компактну reasoning-модель на базі Qwen3.5-9B із повним файн-тюнінгом і навмисно відключеними обмеженнями. Технічно модель цікава, але її поява одразу порушила болюче питання для AI-індустрії: чи законно навчати моделі на синтетичних даних, згенерованих закритими комерційними системами?

Залишити коментар

Empero випустила нецензуровану модель Qwythos-9B — і заявила, що навчала її на даних закритої Claude Mythos

Компанія Empero AI опублікувала на HuggingFace відкриту модель Qwythos-9B — компактну reasoning-модель на базі Qwen3.5-9B із повним файн-тюнінгом і навмисно відключеними обмеженнями. Технічно модель цікава, але її поява одразу порушила болюче питання для AI-індустрії: чи законно навчати моделі на синтетичних даних, згенерованих закритими комерційними системами?

Що таке Qwythos

Qwythos-9B — це повністю файн-тюнінгована версія Qwen3.5-9B, пост-натренована на понад 500 мільйонах токенів із chain-of-thought трейсами, які Empero генерувала власним інструментом rethink. Головні технічні характеристики:

Контекстне вікно 1 048 576 токенів (~1M) — завдяки YaRN rope-scaling із коефіцієнтом ×4 відносно нативної архітектури. Одне з найдовших вікон серед відкритих 9B-моделей, що дозволяє тримати в контексті цілі кодові бази, десятки наукових статей або довгі агентні сесії.
Нативний function calling за специфікацією Qwen3.5 — без додаткового файн-тюнінгу під інструменти.
Самокорекція з інструментами — у власних тестах Empero на 7 складних промптах (математика, кібербезпека, клінічна фармакологія, біохімія) модель коректно відповіла на всі 7, використовуючи Python-executor і web search та наводячи джерела.
Бенчмарки проти базової Qwen3.5-9B: +34.3 бали MMLU, +30 gsm8k-strict, +19 gsm8k-flex. Втім, на gpqa_diamond модель показала −5 балів відносно бази — що важливо не замовчувати.

Для роботи з повним 1M-контекстом потрібна розподілена інфраструктура: один H100/H200 впевнено тримає 256k–512k токенів, але мільйон вимагає tensor-parallel multi-GPU або агресивного KV-cache offload.

Головна суперечність — дані Claude Mythos

Empero відкрито заявляє, що модель «пост-натренована на трейсах Claude Mythos і Claude Fable». Тут є принципова проблема.

Claude Mythos — це закрита frontier-модель Anthropic, яка не виходила у відкритий доступ. Anthropic не публікувала ні модель, ні датасети на її основі. Це означає, що Empero, найімовірніше, отримала «трейси» одним із двох способів: або через масову генерацію синтетичних даних через API (тобто фактично дистиляцію закритої моделі), або через якийсь несанкціонований доступ.

Перший варіант — пряме порушення Terms of Service Anthropic, які забороняють використовувати відповіді моделей для навчання конкуруючих систем. Саме через це OpenAI подавала позов проти компаній, що займались дистиляцією GPT-4. Empero поки що не прокоментувала, яким саме чином отримала ці дані.

«Intentionally uncensored» — для кого і навіщо

Empero позиціонує відсутність обмежень як ключову перевагу для дослідників і розробників, що працюють у кібербезпеці, біомедицині та фармакології — тобто в областях, де «надмірно вирівняні» моделі часто відмовляють або видають беззмістовні disclaimers замість реальної відповіді.

Це реальна проблема: надмірна цензура в AI-моделях дійсно обмежує їхню корисність для легітимних завдань — пентестерів, медичних дослідників, токсикологів. Але повна відсутність будь-яких обмежень — це вже інший полюс із власними ризиками, особливо якщо модель доступна для завантаження будь-ким без верифікації.

Де доступна

Qwythos-9B вже доступна на HuggingFace під повністю відкритою ліцензією без обмежень на комерційне використання. Harness для відтворення тестів на tool use Empero обіцяє опублікувати на GitHub.

Українську мовну модель «Сяйво» почали тестувати в закритому режимі

Google випустила ШІ-модель Gemma 4 12B яку можна запустити на звичайному ноутбуці із 16 ГБ памяті

Читайте головні IT-новини країни в нашому Telegram

Залишити коментар

Текст: Марія Бровінська Теги: штучний інтелект

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

Розміщення реклами

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Штучний інтелект почав озвучувати фільми на MEGOGO

3 коментарі

Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

2 коментарі

«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого

Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар