Lalein
Сервис превращает PDF, текст и видео в подкасты с возможностью выбора голосов, количества спикеров и длительности. Доступен на iOS без VPN, поддерживает русский язык.
MOSS-TTS-Nano - это открытая мультиязычная модель для генерации речи, которая умещается всего в 0,1 миллиарда параметров. Создана командами MOSI.AI и OpenMOSS специально для того, чтобы работать в реальном времени прямо на процессоре, без видеокарты. Никаких сложных зависимостей, никаких тяжелых конфигураций - запустил и пользуешься.
Модель построена на связке Audio Tokenizer + LLM и работает по чисто авторегрессивному принципу. Выдаёт звук в формате 48 кГц, стерео, поддерживает 20 языков - от китайского и английского до арабского, турецкого и шведского. Умеет клонировать голос по короткому образцу, справляется с длинными текстами через автоматическое разбиение на куски и генерирует речь потоково, с минимальной задержкой до первого звука.
Разработчики сделали упор на простоту развёртывания. Можешь запустить инференс одной командой через python infer.py, поднять локальное веб-демо через app.py или использовать упакованный CLI. Есть версия на ONNX Runtime, которая вообще не требует PyTorch при инференсе и работает примерно в два раза быстрее исходной. На MacBook Air M4 с одним ядром процессора она крутится без проблем.
В репозитории лежит всё необходимое: код для файнтюнинга, скрипты для инференса, веб-интерфейс на FastAPI и даже браузерное расширение MOSS-TTS-Nano-Reader, которое запускает модель прямо в браузере без отдельного сервера. Модель и токенизатор доступны на Hugging Face, онлайн-демо можно потрогать на GitHub Pages.
Сервис превращает PDF, текст и видео в подкасты с возможностью выбора голосов, количества спикеров и длительности. Доступен на iOS без VPN, поддерживает русский язык.
Плагин для Photoshop с четырьмя AI-коннекторами: интеграция Stable Diffusion, DALL-E 2 и других нейросетей прямо в интерфейс редактора для генерации и обработки изображений.
Сервис автоматически создает формулы для Excel и Google Sheets за секунды. Превращает описание задачи в готовую формулу.