Claude Opus 4.8: честнее, быстрее, дешевле
Anthropic выпустила Claude Opus 4.8 - модель стала в 4 раза честнее в оценке своего кода и втрое дешевле в быстром режиме. Разбираем, что изменилось.
Anthropic тихо, без особой помпы выпустила Claude Opus 4.8. Не революция - скорее планомерное улучшение. Но несколько деталей здесь действительно заслуживают внимания.
Главное изменение - честность модели. Звучит странно применительно к языковой модели, но проблема реальная: ИИ-ассистенты склонны уверенно рапортовать об успехе там, где на самом деле всё шатко. Opus 4.8 стал в четыре раза реже замалчивать баги в собственном коде по сравнению с предшественником. То есть вместо «готово, всё работает» модель теперь чаще говорит «вот что я сделал, но вот здесь я не уверен» - и это, пожалуй, важнее любого прироста в бенчмарках.

Команда по выравниванию Anthropic отдельно отметила, что модель лучше поддерживает автономию пользователя и реже демонстрирует нежелательное поведение вроде обмана или содействия злоупотреблениям.
Что ещё появилось в этом релизе
Вместе с Opus 4.8 вышло несколько новых функций. В Claude Code появились «динамические воркфлоу» - теперь модель может запускать сотни параллельных субагентов в рамках одной сессии. Это открывает возможность для масштабных миграций кодовой базы - буквально сотни тысяч строк от старта до мержа. Функция доступна для планов Enterprise, Team и Max.

Пользователи claude.ai получили контроль над «усилием» модели: можно выбрать, насколько глубоко Claude думает над ответом. Больше усилий - лучше результат, но медленнее и дороже по лимитам. Меньше - быстрее и экономнее. Разумный компромисс, который давно просился.
Быстрый режим (fast mode) подешевел втрое по сравнению с Opus 4.7 - $10 за миллион входящих токенов и $50 за выходящие. Стандартные цены остались прежними: $5 и $25 соответственно.

Отдельная история - Project Glasswing и модель Claude Mythos Preview, которую сейчас тестирует небольшое число организаций в сфере кибербезопасности. Anthropic обещает вывести модели этого класса в широкий доступ «в ближайшие недели» - после того как будут готовы необходимые защитные механизмы. Судя по всему, это следующий уровень интеллекта, заметно превосходящий линейку Opus.
Смотрите также
-
Ассистенты·WWDC26: новый Siri, родительский контроль и быстрее на 80%
-
ИИ-агент·Meta запускает платного ИИ-агента за $200 в месяц
-
Ассистенты·Hinge защищает ИИ-подсказки для робких зумеров
-
Автоматизация·Обновлённое приложение Samsung Health с ИИ
-
Opensource·Kimi K2.6 - открытая модель с роем агентов
-
Ассистенты·Claude получит файловую память вместо заметок
-
Opensource·Stability AI выпустила модель для генерации 6-минутных треков
-
Инструменты разработчика·Anthropic готовит Mythos 1 для Claude Code и Security
-
Автоматизация·E-paper планшет Cuneflow с ИИ для конспектов встреч