acestep.cpp

Нейросеть acestep.cpp

Превратите текст в музыку прямо на своём компьютере без подключения к интернету

acestep.cpp - это локальный сервер для генерации музыки с веб-интерфейсом, который работает на твоем железе без облака. Написан на C++17, использует библиотеку GGML и запускается на процессоре, видеокартах NVIDIA (CUDA), AMD/Intel (Vulkan) и Apple Silicon (Metal). Ты описываешь трек текстом, добавляешь слова песни - на выходе получаешь стерео 48 кГц в формате MP3 или WAV.

Инструмент построен на базе моделей ACE-Step 1.5, но это не просто обертка - полноценная реализация с нуля. Модели нужно скачать отдельно с Hugging Face в формате GGUF: языковую модель (0.6B, 1.7B или 4B параметров), текстовый энкодер, DiT-модель (есть турбо-версия на 8 шагов и SFT на 50 для более высокого качества) и VAE. Все файлы кладешь в папку models, и сервер сам подгружает их при первом запросе - на старте GPU не занят вообще.

Сборка стандартная: клонируешь репозиторий с подмодулями, запускаешь скрипт под свою платформу (buildcuda.sh, buildvulkan.cmd, buildcpu.sh или buildall для всех бэкендов сразу). Для Windows есть готовые бинарники, если не хочешь возиться с компиляцией. После запуска сервера открываешь браузер на localhost:8085 - интерфейс позволяет вводить описание, текст песни, метаданные, генерировать, слушать и скачивать треки прямо на странице.

Поддерживает адаптеры LoRA: кидаешь их в папку adapters, перезапускаешь сервер и выбираешь нужный в интерфейсе. Работает с PEFT-директориями и одиночными файлами .safetensors из ComfyUI. Есть API с тремя POST-эндпоинтами: /lm для генерации текста и аудиокодов, /synth для рендера звука, /understand для обратного процесса (аудио в метаданные и коды). Плюс два GET: /health для проверки статуса и /props для списка доступных моделей и настроек.

Если нужен скриптовый режим без сервера, есть CLI-утилиты ace-lm и ace-synth - работают как конвейер через JSON-файлы. Первая генерирует слова и коды, вторая превращает их в звук. Вся техническая документация, включая форматы запросов, типы задач (text2music, cover, repaint, lego, extract, complete), квантизацию и внутреннюю архитектуру, лежит в docs/ARCHITECTURE.md.

    acestep.cpp: галерея

Нейросеть acestep.cpp была впервые опубликована 17-04-2026 18:03:03 и вручную отредактирована 04-05-2026 17:22:08.

Логотип Telegram

Будьте в курсе новых нейросетей — подпишитесь на наш Telegram-канал!

Ежедневные обзоры свежих AI-инструментов, лайфхаки и инструкции прямо в вашем мессенджере.

AILibri – главная страница
Ctrl / ⌘+K