Компания Artificial Analysis опубликовала обновленную версию 4.0 своего рейтинга Intelligence Index, в котором оценивает возможности современных моделей искусственного интеллекта.
В тройку лидеров вошли: GPT-5.2 от OpenAI (50 баллов), Claude Opus 4.5 от Anthropic (49 баллов) и Gemini 3 Pro от Google (48 баллов). Интересно, что в этот раз максимальные оценки оказались значительно ниже предыдущей версии рейтинга — 50 баллов против 73.
Оценка проводилась по четырем равнозначным категориям: работа с агентами, программирование, научное мышление и общие способности. В новой версии рейтинга были представлены три новых теста:
-
AA-Omniscience для проверки знаний по 40 темам и выявления ложной информации
-
GDPval-AA для оценки практических навыков в 44 профессиях
-
CritPt для решения задач в области физических исследований
Если говорить о стоимости использования этих моделей, самой дорогой оказалась GPT-5.2 в максимальной конфигурации — $2,322. За ней следуют Grok 4 ($1,574) и Claude 4.5 Opus ($1,510). Gemini 3 Pro оказалась заметно дешевле — $988.
Все тесты проводились независимо по стандартизированной методике, с полным соблюдением протокола тестирования.
Смотрите также
-
OpenAI рассказала о своих планах по внедрению рекламы
-
ChatGPT Go: новая доступная подписка от OpenAI
-
Opera One R3: новый браузер с цветными вкладками и умным ИИ
-
Google запустил бета-версию персонального помощника Gemini
-
Google представляет новый протокол для онлайн-торговли с поддержкой Walmart и Shopify
-
Почему у ИИ нет единого «я» и почему это нормально
-
Google тестирует новый инструмент Gemini Auto Browse для Chrome
-
Обновления в API Gemini: увеличенные лимиты и новые способы загрузки файлов
-
Apple переходит на Google Gemini для улучшения Siri