💳 Потрібна європейська картка з лімітом 50к євро? Встановлюй Trustee Plus 👉
Наталя ХандусенкоШІ
28 січня 2025, 10:04
2025-01-28
Китайська Alibaba Qwen випустила конкурента ШІ-агента Operator від OpenAI, який може керувати ПК і телефоном
ШІ-підрозділ Qwen китайської компанії Alibaba, який є головним внутрішнім конкурентом DeepSeek, випустив нове сімейство моделей штучного інтелекту Qwen2.5-VL. Ці моделі можуть аналізувати файли, розуміти відео, рахувати об'єкти на зображеннях, а також керувати комп’ютером — подібно до ШІ-агента Operator від OpenAI. Звісно, ШІ має певні обмеження щодо тем, які йому дозволено обговорювати.
ШІ-підрозділ Qwen китайської компанії Alibaba, який є головним внутрішнім конкурентом DeepSeek, випустив нове сімейство моделей штучного інтелекту Qwen2.5-VL. Ці моделі можуть аналізувати файли, розуміти відео, рахувати об'єкти на зображеннях, а також керувати комп’ютером — подібно до ШІ-агента Operator від OpenAI. Звісно, ШІ має певні обмеження щодо тем, які йому дозволено обговорювати.
За результатами порівняльного аналізу, проведеного командою Qwen, найкраща модель Qwen2.5-VL перевершує GPT-4o від OpenAI, Claude 3.5 Sonnet від Anthropic і Gemini 2.0 Flash від Google за різними показниками розуміння відео, математики, аналізу документів і оцінювання відповідей на запитання, пише TechCrunch.
Джерело: TechCrunch
Qwen2.5-VL доступний для тестування в програмі Alibaba Qwen Chat і для завантаження з платформи розробників штучного інтелекту Hugging Face. Може аналізувати діаграми та графіки, витягувати дані зі сканованих рахунків-фактур і форм, а також «осягати» багатогодинне відео, каже команда Qwen. Також може розпізнавати «IP-адреси з фільмів і серіалів, а також широкий спектр продуктів», за словами команди, що свідчить про те, що моделі могли частково навчатися на роботах, захищених авторським правом.
Qwen2.5-VL, як будь-який китайський ШІ, має певні обмеження щодо тем, які він може обговорюватиме. Коли журналіст TechCrunch попросив найбільшу та найпотужнішу модель із сімейства, Qwen2.5-VL-72B, розповісти про «помилки Сі Цзіньпіна», Qwen Chat видав повідомлення про помилку.
Однією з найцікавіших особливостей Qwen2.5-VL є його здатність взаємодіяти з програмним забезпеченням — як на ПК, так і на мобільних пристроях. Відео, опубліковане на X Філіпом Шмідом, технічним керівником Hugging Face, показало, як Qwen2.5-VL запускає додаток Booking.com для Android і бронює рейс з Чунціна до Пекіна.
Don’t Miss @Alibaba_Qwen 2.5 VL! Despite all the Deepseek Hype, Qwen just dropped the best open Multimodal! Qwen 2.5 VL is a Vision Language Model that can control your computer, similar to the @OpenAI operator, extract structured information from charts, and more!
На відео нижче модель Qwen2.5-VL керує програмами на робочому столі Linux, але, схоже, не робить нічого, окрім перемикання вкладок. Можливо, показовим є те, що за результатами бенчмаркінгу Qwen, Qwen2.5-VL отримала низькі бали в OSWorld, тесті, який намагається імітувати реальне комп’ютерне середовище.
LMAO Qwen 2.5 VL can perform Computer Use, out of the box, taking on OpenAI Operator HEAD ON! 🐐 pic.twitter.com/lwMECXzNSu
Дві менш складні моделі серії Qwen2.5-VL, Qwen2.5-VL-3B і Qwen2.5-VL-7B, доступні за дозвільною ліцензією. Флагманська модель Qwen2.5-VL-72B, має спеціальну ліцензію Alibaba, яка вимагає, щоб компанії та розробники з більш ніж 100 млн активних користувачів щомісяця запитували дозвіл у Qwen/Alibaba, перш ніж розгортати модель на комерційній основі.
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.
Хочете повідомити важливу новину? Пишіть у Telegram-бот
Головні події та корисні посилання в нашому Telegram-каналі