OpenAI выпустила три голосовые модели для разработчиков
OpenAI представила GPT-Realtime-2, GPT-Realtime-Translate и GPT-Realtime-Whisper — модели для рассуждений, перевода и транскрипции речи в реальном времени.
Если вы думали, что OpenAI уже исчерпала варианты применения голосовых технологий - ну, вы ошибались. Компания выкатила сразу три новые модели, заточенные под работу с голосом в реальном времени. И на этот раз целевая аудитория - не обычные пользователи ChatGPT, а разработчики, которые хотят встроить голосовой ИИ в свои приложения.
Что за модели
Итого имеем тройку:

-
GPT-Realtime-2 - голосовая модель с рассуждениями уровня GPT-5. Умеет вести сложные диалоги, адаптировать тон под собеседника, проверять несколько источников одновременно и разбираться в специализированной терминологии (медицина, производство). По сути - голосовой ассистент, который реально думает, а не просто выдаёт заготовленные фразы.
-
GPT-Realtime-Translate - живой переводчик. Принимает речь на 70+ языках и переводит в 13 выходных языков, причём успевает за темпом говорящего. Звучит как мечта для любого международного созвона.
-
GPT-Realtime-Whisper - потоковая транскрипция. Превращает речь в текст прямо на лету - для субтитров, заметок со встреч, саммари. Всё то, что раньше делалось постфактум, теперь работает в моменте.
Цены и доступ
OpenAI не стесняется в ценообразовании: GPT-Realtime-2 обойдётся в $32 за миллион входных токенов и $64 за миллион выходных. Translate стоит $0.034 в минуту, Whisper - $0.017 в минуту. Все три модели доступны через Realtime API, а потестировать их можно в OpenAI Playground.
Интересно, что OpenAI выделяет три основных сценария, ради которых разработчики вообще используют голосовые модели: выполнение задач по голосовой команде, объяснение ситуации пользователю (например, задержка рейса) и общение на родном языке пользователя. Собственно, каждая из трёх новых моделей закрывает один из этих сценариев.

Для тех, кто уже работает с Codex, OpenAI подготовила промпт, который добавляет GPT-Realtime-2 прямо в агентную платформу для кодинга. Удобно, хотя от количества новых моделей и API уже начинает рябить в глазах.
Смотрите также
-
Ассистенты·Claude Opus 4.8: честнее, быстрее, дешевле
-
Opensource·Kimi K2.6 - открытая модель с роем агентов
-
Инструменты разработчика·Anthropic готовит Mythos 1 для Claude Code и Security
-
Автоматизация·Новые инструменты безопасности для Claude Managed Agents
-
Инструменты разработчика·Cursor выпустил Composer 2.5 - в 10 раз дешевле конкурентов
-
Исследования·arXiv грозит баном за непроверенный текст от ИИ
-
Новости·Роботы Figure AI 8 часов сортировали посылки в прямом эфире
-
Opensource·OpenSquilla - агентный рантайм, который экономит токены
-
3D·Как подключить Blender к Claude через MCP-коннектор