💳 Потрібна європейська картка з лімітом 50к євро? Встановлюй Trustee Plus 👉

Китайська Alibaba Qwen випустила конкурента ШІ-агента Operator від OpenAI, який може керувати ПК і телефоном

ШІ-підрозділ Qwen китайської компанії Alibaba, який є головним внутрішнім конкурентом DeepSeek, випустив нове сімейство моделей штучного інтелекту Qwen2.5-VL. Ці моделі можуть аналізувати файли, розуміти відео, рахувати об'єкти на зображеннях, а також керувати комп’ютером — подібно до ШІ-агента Operator від  OpenAI. Звісно, ШІ має певні обмеження щодо тем, які йому дозволено обговорювати.

Залишити коментар
Китайська Alibaba Qwen випустила конкурента ШІ-агента Operator від OpenAI, який може керувати ПК і телефоном

ШІ-підрозділ Qwen китайської компанії Alibaba, який є головним внутрішнім конкурентом DeepSeek, випустив нове сімейство моделей штучного інтелекту Qwen2.5-VL. Ці моделі можуть аналізувати файли, розуміти відео, рахувати об'єкти на зображеннях, а також керувати комп’ютером — подібно до ШІ-агента Operator від  OpenAI. Звісно, ШІ має певні обмеження щодо тем, які йому дозволено обговорювати.

За результатами порівняльного аналізу, проведеного командою Qwen, найкраща модель Qwen2.5-VL перевершує GPT-4o від OpenAI, Claude 3.5 Sonnet від Anthropic і Gemini 2.0 Flash від Google за різними показниками розуміння відео, математики, аналізу документів і оцінювання відповідей на запитання, пише TechCrunch.

Джерело: TechCrunch

Qwen2.5-VL доступний для тестування в програмі Alibaba Qwen Chat і для завантаження з платформи розробників штучного інтелекту Hugging Face. Може аналізувати діаграми та графіки, витягувати дані зі сканованих рахунків-фактур і форм, а також «осягати» багатогодинне відео, каже команда Qwen. Також може розпізнавати «IP-адреси з фільмів і серіалів, а також широкий спектр продуктів», за словами команди, що свідчить про те, що моделі могли частково навчатися на роботах, захищених авторським правом.

Qwen2.5-VL, як будь-який китайський ШІ, має певні обмеження щодо тем, які він може обговорюватиме. Коли журналіст TechCrunch попросив найбільшу та найпотужнішу модель із сімейства, Qwen2.5-VL-72B, розповісти про «помилки Сі Цзіньпіна», Qwen Chat видав повідомлення про помилку.

Однією з найцікавіших особливостей Qwen2.5-VL є його здатність взаємодіяти з програмним забезпеченням — як на ПК, так і на мобільних пристроях. Відео, опубліковане на X Філіпом Шмідом, технічним керівником Hugging Face, показало, як Qwen2.5-VL запускає додаток Booking.com для Android і бронює рейс з Чунціна до Пекіна.


На відео нижче модель Qwen2.5-VL керує програмами на робочому столі Linux, але, схоже, не робить нічого, окрім перемикання вкладок. Можливо, показовим є те, що за результатами бенчмаркінгу Qwen, Qwen2.5-VL отримала низькі бали в OSWorld, тесті, який намагається імітувати реальне комп’ютерне середовище.

Дві менш складні моделі серії Qwen2.5-VL, Qwen2.5-VL-3B і Qwen2.5-VL-7B, доступні за дозвільною ліцензією. Флагманська модель Qwen2.5-VL-72B, має спеціальну ліцензію Alibaba, яка вимагає, щоб компанії та розробники з більш ніж 100 млн активних користувачів щомісяця запитували дозвіл у Qwen/Alibaba, перш ніж розгортати модель на комерційній основі.

Нагадаємо, що китайська лабораторія ШІ DeepSeek привернула до себе купи уваги після того, як її чатбот піднявся на вершину чартів Apple App Store. Це хвилювання спровокувало падіння цін на акції технологічних компаній, включно з топовим виробником графічних процесорів Nvidia, а Марк Цукерберг поспішив із заявою, що Meta планує вкласти $60 млрд у 2025 році в розвиток ШІ.

Станом на вечір понеділка акції технологічних компаній втратили приблизно $1 трлн після прогресу китайського ШІ-стартапу DeepSeek.

Раніше dev.ua зробив детальний розбір того, як DeepSeek вдалося перевершити конкурентів.

Китайський техгігант Alibaba представив 100 нових ШІ-моделей з відкритим кодом та технологію перетворення тексту у відео
Китайський техгігант Alibaba представив 100 нових ШІ-моделей з відкритим кодом та технологію перетворення тексту у відео
По темi
Китайський техгігант Alibaba представив 100 нових ШІ-моделей з відкритим кодом та технологію перетворення тексту у відео
Alibaba закриває дослідницьку лабораторію квантових обчислень поки її співзасновник запускає новий бізнес із продажу харчових продуктів
Alibaba закриває дослідницьку лабораторію квантових обчислень, поки її співзасновник запускає новий бізнес із продажу харчових продуктів
По темi
Alibaba закриває дослідницьку лабораторію квантових обчислень, поки її співзасновник запускає новий бізнес із продажу харчових продуктів
Telegram продовжує залишатися головною соцмережею з якої українці отримують новини
Telegram продовжує залишатися головною соцмережею, з якої українці отримують новини
По темi
Telegram продовжує залишатися головною соцмережею, з якої українці отримують новини
Підключай Megogo зі знижками за акційними тарифами.

від 99 гривень на місяць

Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті. 

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.