Dia 2

Нейросеть Dia 2

Если вам нужен голосовой движок для чат-бота или голосового ассистента, который не будет заставлять пользователя ждать по полминуты ответа, Dia 2 решает именно эту задачу. Вторая версия TTS-движка от Nari-labs умеет генерировать речь потоково — то есть начинает озвучивать текст ещё до того, как полностью его обработает.

Когда каждая секунда на счёту

Главная фишка — стриминг в реальном времени. Обычные синтезаторы речи сначала пережёвывают весь текст, потом выдают готовый файл. Dia 2 работает иначе: генерирует аудио кусками, по мере поступления данных. Для диалоговых систем это критично — никто не хочет слушать неловкую паузу, пока бот «думает». Здесь пауза почти незаметна.

Модель выдаёт до двух минут английской речи за раз. Для большинства реплик в чате или голосовом помощнике этого более чем достаточно — редко когда виртуальный собеседник вываливает на вас трёхминутные монологи.

Лёгкий вес, быстрая работа

Dia 2 весит всего 1-2 миллиарда параметров. Для сравнения: многие современные языковые модели тянут на десятки миллиардов. Компактность означает, что движок можно запустить даже на не самом топовом железе, и он не съест все ресурсы сервера. При этом качество речи остаётся вполне приличным для задач автоматизации.

Английский пока один

С языками ситуация пока неясная — разработчики упоминают только английский. Если вам нужен русский, испанский или китайский, придётся либо ждать обновлений, либо смотреть в сторону других решений. Проект вдохновлён KyutaiTTS и Sesame, но пока находится в активной разработке.

Для кого это подходит

Dia 2 заточен под разработчиков голосовых интерфейсов: чат-боты в службах поддержки, виртуальные ассистенты, интерактивные IVR-системы. Если вы делаете приложение, где важна скорость отклика, а не киношное качество дикторской озвучки, этот движок может закрыть вашу задачу без лишних затрат на инфраструктуру.

    Dia 2: галерея

  • Dia 2

Нейросеть Dia 2 была впервые опубликована 03-12-2025 15:09:05 и вручную отредактирована 03-12-2025 15:09:42.

Логотип Telegram

Будьте в курсе новых нейросетей — подпишитесь на наш Telegram-канал!

Ежедневные обзоры свежих AI-инструментов, лайфхаки и инструкции прямо в вашем мессенджере.

AILibri – главная страница
Ctrl / ⌘+K