12 февраля 2026 года OpenAI выкатила GPT-5.3-Codex-Spark - первую модель, заточенную под редактирование кода в реальном времени прямо внутри Codex. Это младший брат GPT-5.3-Codex, настроенный на мгновенные правки и быстрые итерации. Модель крутится на железе с ультранизкой задержкой и выдаёт больше 1000 токенов в секунду.
Целевая аудитория - разработчики, которым нужны короткие циклы обратной связи: точечные правки, переделка логики, доводка интерфейса с мгновенным результатом, без томительного ожидания. По умолчанию Codex-Spark работает в облегчённом режиме, фокусируясь на минимальных целевых изменениях и не запуская тесты, пока вы сами не попросите. На старте модель работает только с текстом, контекстное окно - 128 тысяч токенов, лимиты запросов отдельные и не влияют на стандартные квоты. OpenAI предупреждает, что в пиковые часы возможны очереди, пока мощности наращиваются.

Сначала доступ получили пользователи ChatGPT Pro через последнюю версию приложения Codex, CLI и расширение для VS Code. API пока открыт только узкому кругу партнёров, тестирующих интеграции. OpenAI называет это ранним доступом - пока дорабатывают опыт использования и расширяют серверные мощности. Более широкий доступ обещают в ближайшие недели.

Интересно, что OpenAI переработала весь конвейер запрос-ответ, а не просто ускорила модель. Теперь для Codex-Spark по умолчанию используется постоянное WebSocket-соединение, плюс оптимизации снизили накладные расходы на каждый запрос на 80%, на токен - на 30%, а время до первого токена - вдвое. Этот низколатентный путь скоро станет стандартом и для других моделей.


Главная фишка - железо: Codex-Spark работает на Cerebras Wafer-Scale Engine 3, специализированном чипе размером с целую кремниевую пластину. Это первый результат партнёрства OpenAI и Cerebras, анонсированного в январе. Cerebras видит в этом способ открыть новые сценарии использования благодаря сверхбыстрому выводу, а команда OpenAI подчёркивает, что вафельная архитектура дополняет их GPU-парк для задач, чувствительных к задержкам.
По безопасности OpenAI заверяет: Codex-Spark прошла ту же подготовку, что и основные модели, включая обучение на киберугрозах, и стандартную оценку перед развёртыванием. Компания не ожидает, что модель достигнет порога высоких возможностей в кибербезопасности или биологии по их Preparedness Framework.
Стратегически Codex-Spark дополняет режим "работай часами" у GPT-5.3-Codex. Идея OpenAI - двухрежимный Codex: быстрая коллаборация в реальном времени для итераций и долгосрочное рассуждение с выполнением для глубокой работы. В планах - объединить оба режима в одном рабочем процессе.
Смотрите также
-
Qualcomm и Arduino показали мощный конкурент Raspberry Pi с автономным ИИ
-
Runpod раскрыл правду: какие AI-модели реально используют разработчики
-
Anthropic тестирует ИИ-ревью кода на своих разработчиках
-
Cursor запустил AI-агентов, которые работают круглосуточно и убирают рутину разработчиков
-
Google выпустил CLI для интеграции OpenClaw и других AI-агентов в Workspace
-
Claude от Anthropic нашёл более 100 уязвимостей в Firefox
-
Cursor запустил Automations - агентов, которые работают, пока вы спите
-
Perplexity выпустила эмбеддинг-модели, которые обходят Google и занимают в 32 раза меньше памяти
-
Google Conductor AI: новый инструмент для контроля над кодом, написанным ИИ