X-Voice
в каталоге с 2026Голос без границ: один человек говорит на 30 языках мира

X-Voice

Оцените первым

Представьте: вы записываете короткий аудиофрагмент на родном языке, а на выходе получаете голос, который говорит на 30 языках — и звучит как вы. Именно это делает X-Voice.

Это open-source система синтеза речи на основе flow matching, заточенная под кросс-языковое клонирование голоса без предварительного обучения на целевом языке — так называемый zero-shot подход. Один голос, тридцать языков. Без дополнительной разметки, без часов записей.

Под капотом — двухэтапный пайплайн инференса, предиктор темпа речи для каждого языка отдельно и собственный датасет XVoice Dataset. Всё это вышло в апреле 2026 года вместе с моделью, демо, Hugging Face Space и бенчмарком, а в мае появился препринт на arXiv.

Запустить можно двумя способами: через Gradio-интерфейс прямо в браузере или через CLI с конфигами в формате TOML. Поддерживаются NVIDIA, AMD, Intel GPU и Apple Silicon — то есть развернуть получится практически на любом железе. Код открыт под MIT License, модели — под CC-BY-NC из-за условий обучающих данных.

Если нужно не просто запустить, а обучить свою версию или воспроизвести бенчмарк — в репозитории есть отдельные гайды по обучению TTS-модели, тренировке предиктора темпа и оценке качества. Всё задокументировано, структура проекта прозрачная.

144 звезды на GitHub за месяц после релиза — это не случайность. X-Voice закрывает реальную задачу, которую раньше решали либо дорогими коммерческими сервисами, либо вообще никак.

Похожие нейросети

Все нейросети →
Бесплатно

SparkVSR

Размытое видео превращается в четкое одним кликом по ключевому кадру

Обн. 04.05.2026
Freemium

Hemingway Editor Plus

Редактор текста, который упрощает сложные предложения и улучшает читаемость письма. Помогает писать проще и понятнее.

Обн. 31.05.2026
Freemium

Ferret

AI-сервис для проверки репутации и безопасности людей из вашего окружения с доступом к закрытым базам данных и мониторингом рисков.

Обн. 17.05.2026
Freemium

Type Studio

Type Studio - это онлайн-инструмент для конвертации и редактирования видео с текстом, который может автоматически транскрибировать видео, поддерживать несколько языков и экспортировать в различных форматах.

Обн. 29.05.2026

Нейросеть X-Voice была впервые опубликована 29-05-2026 17:56:04 и вручную отредактирована 29-05-2026 17:57:10.

Каталог приложений Telegram Mini Apps

340+ проверенных мини-приложений: нейросети, утилиты, игры. Открываются прямо в мессенджере — без установки.

Открыть →

Поддержите Ailibri

Если наш каталог оказался полезным, вы можете оставить небольшой донат. Это поможет нам развивать проект.

♥ Поддержать

Будьте в курсе новых нейросетей — подпишитесь на наш Telegram-канал

Ежедневные обзоры свежих AI-инструментов, лайфхаки и инструкции прямо в вашем мессенджере.

Подписаться
Бесплатно · Нейросеть

Генерация изображений прямо в Telegram

3 бесплатные генерации в день через нейросеть nano banana — просто подпишись на канал @n_seti

Быстро Точно Качественно
Попробовать @gen_neurosila_bot

Нейросети и ИИ-инструменты

Все теги →
github212 text-to-text136 text-to-image111 каталог29 image-to-image23 инструмент20 курсы19 создание чат-ботов15 браузер15 удалить фон14 text-to-sound12 text-to-video11 замена лица11 gpt-49 desktop-приложение9 ии-музыка9 аниме9 удалить объект с фото8 google8 создание сайтов7
AILibri – главная страница
Ctrl / ⌘+K