Новый рейтинг ИИ: OpenAI, Anthropic и Google делят лидерство

·  чтения ·  · 
Новый рейтинг ИИ: OpenAI, Anthropic и Google делят лидерство

Компания Artificial Analysis опубликовала обновленную версию 4.0 своего рейтинга Intelligence Index, в котором оценивает возможности современных моделей искусственного интеллекта.

В тройку лидеров вошли: GPT-5.2 от OpenAI (50 баллов), Claude Opus 4.5 от Anthropic (49 баллов) и Gemini 3 Pro от Google (48 баллов). Интересно, что в этот раз максимальные оценки оказались значительно ниже предыдущей версии рейтинга — 50 баллов против 73.

Оценка проводилась по четырем равнозначным категориям: работа с агентами, программирование, научное мышление и общие способности. В новой версии рейтинга были представлены три новых теста:

  • AA-Omniscience для проверки знаний по 40 темам и выявления ложной информации

  • GDPval-AA для оценки практических навыков в 44 профессиях

  • CritPt для решения задач в области физических исследований

Если говорить о стоимости использования этих моделей, самой дорогой оказалась GPT-5.2 в максимальной конфигурации — $2,322. За ней следуют Grok 4 ($1,574) и Claude 4.5 Opus ($1,510). Gemini 3 Pro оказалась заметно дешевле — $988.

Все тесты проводились независимо по стандартизированной методике, с полным соблюдением протокола тестирования.

Смотрите также

Логотип Telegram

Будьте в курсе новых нейросетей — подпишитесь на наш Telegram-канал!

Ежедневные обзоры свежих AI-инструментов, лайфхаки и инструкции прямо в вашем мессенджере.

AILibri – главная страница
Ctrl / ⌘+K