SparkVSR
Размытое видео превращается в четкое одним кликом по ключевому кадру
Представьте: вы записываете короткий аудиофрагмент на родном языке, а на выходе получаете голос, который говорит на 30 языках — и звучит как вы. Именно это делает X-Voice.
Это open-source система синтеза речи на основе flow matching, заточенная под кросс-языковое клонирование голоса без предварительного обучения на целевом языке — так называемый zero-shot подход. Один голос, тридцать языков. Без дополнительной разметки, без часов записей.
Под капотом — двухэтапный пайплайн инференса, предиктор темпа речи для каждого языка отдельно и собственный датасет XVoice Dataset. Всё это вышло в апреле 2026 года вместе с моделью, демо, Hugging Face Space и бенчмарком, а в мае появился препринт на arXiv.
Запустить можно двумя способами: через Gradio-интерфейс прямо в браузере или через CLI с конфигами в формате TOML. Поддерживаются NVIDIA, AMD, Intel GPU и Apple Silicon — то есть развернуть получится практически на любом железе. Код открыт под MIT License, модели — под CC-BY-NC из-за условий обучающих данных.
Если нужно не просто запустить, а обучить свою версию или воспроизвести бенчмарк — в репозитории есть отдельные гайды по обучению TTS-модели, тренировке предиктора темпа и оценке качества. Всё задокументировано, структура проекта прозрачная.
144 звезды на GitHub за месяц после релиза — это не случайность. X-Voice закрывает реальную задачу, которую раньше решали либо дорогими коммерческими сервисами, либо вообще никак.
Размытое видео превращается в четкое одним кликом по ключевому кадру
Редактор текста, который упрощает сложные предложения и улучшает читаемость письма. Помогает писать проще и понятнее.
AI-сервис для проверки репутации и безопасности людей из вашего окружения с доступом к закрытым базам данных и мониторингом рисков.
Type Studio - это онлайн-инструмент для конвертации и редактирования видео с текстом, который может автоматически транскрибировать видео, поддерживать несколько языков и экспортировать в различных форматах.