Новый рейтинг ИИ: OpenAI, Anthropic и Google делят лидерство
Последнее исследование Artificial Analysis показало, что три ведущих компании идут вровень в разработке искусственного интеллекта, с минимальным отрывом друг от друга.
Компания Artificial Analysis опубликовала обновленную версию 4.0 своего рейтинга Intelligence Index, в котором оценивает возможности современных моделей искусственного интеллекта.
В тройку лидеров вошли: GPT-5.2 от OpenAI (50 баллов), Claude Opus 4.5 от Anthropic (49 баллов) и Gemini 3 Pro от Google (48 баллов). Интересно, что в этот раз максимальные оценки оказались значительно ниже предыдущей версии рейтинга - 50 баллов против 73.
Оценка проводилась по четырем равнозначным категориям: работа с агентами, программирование, научное мышление и общие способности. В новой версии рейтинга были представлены три новых теста:
-
AA-Omniscience для проверки знаний по 40 темам и выявления ложной информации
-
GDPval-AA для оценки практических навыков в 44 профессиях
-
CritPt для решения задач в области физических исследований
Если говорить о стоимости использования этих моделей, самой дорогой оказалась GPT-5.2 в максимальной конфигурации - $2,322. За ней следуют Grok 4 ($1,574) и Claude 4.5 Opus ($1,510). Gemini 3 Pro оказалась заметно дешевле - $988.
Все тесты проводились независимо по стандартизированной методике, с полным соблюдением протокола тестирования.
Смотрите также
-
ИИ-агент·Apple думает пустить ИИ-агентов в App Store
-
Ассистенты·Алиса от Яндекса в 2026: обзор нейросети, тарифы, агенты
-
Ассистенты·Apple интегрирует ChatGPT в Siri и создаст отдельное приложение
-
Ассистенты·Anthropic случайно раскрыл свой самый мощный ИИ
-
Ассистенты·iOS 27: Apple получит полный доступ к Gemini для Siri
-
Автоматизация·Claude управляет вашим Mac — и Anthropic признаёт риски
-
Чат-боты·ChatGPT превращается в витрину магазина
-
Чат-боты·MiniMax M2.7 помогал разрабатывать сам себя
-
ИИ-агент·Бывшие сотрудники Anthropic запустили AI-стартап Mirendil с фокусом на науку