OpenAI выпустила три голосовые модели для разработчиков

OpenAI представила GPT-Realtime-2, GPT-Realtime-Translate и GPT-Realtime-Whisper — модели для рассуждений, перевода и транскрипции речи в реальном времени.

OpenAI выпустила три голосовые модели для разработчиков

Если вы думали, что OpenAI уже исчерпала варианты применения голосовых технологий - ну, вы ошибались. Компания выкатила сразу три новые модели, заточенные под работу с голосом в реальном времени. И на этот раз целевая аудитория - не обычные пользователи ChatGPT, а разработчики, которые хотят встроить голосовой ИИ в свои приложения.

Что за модели

Итого имеем тройку:

  • GPT-Realtime-2 - голосовая модель с рассуждениями уровня GPT-5. Умеет вести сложные диалоги, адаптировать тон под собеседника, проверять несколько источников одновременно и разбираться в специализированной терминологии (медицина, производство). По сути - голосовой ассистент, который реально думает, а не просто выдаёт заготовленные фразы.

  • GPT-Realtime-Translate - живой переводчик. Принимает речь на 70+ языках и переводит в 13 выходных языков, причём успевает за темпом говорящего. Звучит как мечта для любого международного созвона.

  • GPT-Realtime-Whisper - потоковая транскрипция. Превращает речь в текст прямо на лету - для субтитров, заметок со встреч, саммари. Всё то, что раньше делалось постфактум, теперь работает в моменте.

Цены и доступ

OpenAI не стесняется в ценообразовании: GPT-Realtime-2 обойдётся в $32 за миллион входных токенов и $64 за миллион выходных. Translate стоит $0.034 в минуту, Whisper - $0.017 в минуту. Все три модели доступны через Realtime API, а потестировать их можно в OpenAI Playground.

Интересно, что OpenAI выделяет три основных сценария, ради которых разработчики вообще используют голосовые модели: выполнение задач по голосовой команде, объяснение ситуации пользователю (например, задержка рейса) и общение на родном языке пользователя. Собственно, каждая из трёх новых моделей закрывает один из этих сценариев.

Для тех, кто уже работает с Codex, OpenAI подготовила промпт, который добавляет GPT-Realtime-2 прямо в агентную платформу для кодинга. Удобно, хотя от количества новых моделей и API уже начинает рябить в глазах.

Смотрите также

Каталог приложений Telegram Mini Apps

340+ проверенных мини-приложений: нейросети, утилиты, игры. Открываются прямо в мессенджере — без установки.

Открыть →

Поддержите Ailibri

Если наш каталог оказался полезным, вы можете оставить небольшой донат. Это поможет нам развивать проект.

♥ Поддержать

Будьте в курсе новых нейросетей — подпишитесь на наш Telegram-канал

Ежедневные обзоры свежих AI-инструментов, лайфхаки и инструкции прямо в вашем мессенджере.

Подписаться
Бесплатно · Нейросеть

Генерация изображений прямо в Telegram

3 бесплатные генерации в день через нейросеть nano banana — просто подпишись на канал @n_seti

Быстро Точно Качественно
Попробовать @gen_neurosila_bot

Нейросети и ИИ-инструменты

Все теги →
github212 text-to-text136 text-to-image111 каталог29 image-to-image23 инструмент20 курсы19 создание чат-ботов15 браузер15 удалить фон14 text-to-sound12 text-to-video11 замена лица11 gpt-49 desktop-приложение9 ии-музыка9 аниме9 удалить объект с фото8 google8 создание сайтов7
AILibri – главная страница
Ctrl / ⌘+K