💳 Потрібна європейська картка з лімітом 50к євро? Встановлюй Trustee Plus 👉

Топ-10 крупных языковых моделей ИИ по рейтингу LMSYS Chatbot Arena: удалось ли Claude превзойти GPT4

Открытая краудсорсинговая платформа для оценки крупных языковых моделей (LLM) LMSYS Chatbot Arena обновила 7 марта рейтинг моделей ИИ. Рейтинг составлен на основе отметок более 300 000 пользователей по системе рейтинга Elo.

Оставить комментарий
Топ-10 крупных языковых моделей ИИ по рейтингу LMSYS Chatbot Arena: удалось ли Claude превзойти GPT4

Открытая краудсорсинговая платформа для оценки крупных языковых моделей (LLM) LMSYS Chatbot Arena обновила 7 марта рейтинг моделей ИИ. Рейтинг составлен на основе отметок более 300 000 пользователей по системе рейтинга Elo.

Рейтинг LMSYS Chatbot Arena состоит из 71 большой языковой модели ИИ, которую возглавила GPT4 от OpenAI: GPT-4 (1106-preview) — I место и GPT-4 (0125-preview) — II место.

Claude 3 не удалось преодолеть GPT4, хотя стартап Anthropic утверждал, что их модель превосходит модели конкурентов Google и OpenAI. Claude 3 Opus заняла третье место.

На четвёртом месте оказалась модель Bard (Gemini Pro) от Google.

Все эти модели получили рейтинг Elo более 1200:

  • обе версии GPT4 получили по 1251;
  • Claude 3 — 1233;
  • Bard (Gemini Pro) — 1203.

Далее в десятку лучших моделей ИИ вошли:

  • 5 место — GPT4 0314 (1185);
  • 6 место — Claude 3 Sonnet (1180);
  • 7 место — GPT4 0613 (1161);
  • 8 место — Mistral Large 2402 французской компании Mistral (1155);
  • 9 место — Mistral Medium (1147);
  • 10 место — Owen1.5-72B-Chat от Alibaba (1147).
Читайте главные IT-новости страны в нашем Telegram
Читайте главные IT-новости страны в нашем Telegram
По теме
Читайте главные IT-новости страны в нашем Telegram
Google обновляет алгоритмы для уменьшения спама и ШИ-контента в поисковой выдаче на 40%
Google обновляет алгоритмы, чтобы уменьшить спам и ШИ-контент в поисковой выдаче на 40%
По теме
Google обновляет алгоритмы, чтобы уменьшить спам и ШИ-контент в поисковой выдаче на 40%
Підключай Megogo зі знижками за акційними тарифами.

від 99 гривень на місяць

Читайте также
Искусственный интеллект DALL-E научился дорисовывать картины. Как это выглядит
Искусственный интеллект DALL-E научился дорисовывать картины. Как это выглядит
Искусственный интеллект DALL-E научился дорисовывать картины. Как это выглядит
Искусственный интеллект начал озвучивать фильмы на MEGOGO
Искусственный интеллект начал озвучивать фильмы на MEGOGO
Искусственный интеллект начал озвучивать фильмы на MEGOGO
Искусственный интеллект научился реставрировать старые фотографии, превращая их в качественные изображения: видео
Искусственный интеллект научился реставрировать старые фотографии, превращая их в качественные изображения: видео
Искусственный интеллект научился реставрировать старые фотографии, превращая их в качественные изображения: видео
«Есть ли у меня талант, если компьютер может имитировать меня?». Искусственный интеллект пишет книги авторам Amazon Kindle. The Verge пообщался с авторами и обнаружил много интересного
«Есть ли у меня талант, если компьютер может имитировать меня?». Искусственный интеллект пишет книги авторам Amazon Kindle. The Verge пообщался с авторами и обнаружил много интересного
«Есть ли у меня талант, если компьютер может имитировать меня?». Искусственный интеллект пишет книги авторам Amazon Kindle. The Verge пообщался с авторами и обнаружил много интересного
Писатели-романисты используют искусственный интеллект для создания своих произведений. Издание о технологиях The Verge пообщалось с писательницей Дженнифер Лепп, выпускающей новую книгу каждые девять недель, и узнало о том, как работает искусственный интеллект для написания романов. Приводим адаптированный перевод статьи.

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментариев пока нет.