Stability AI выпустила модель для генерации 6-минутных треков
Stability Audio 3.0 генерирует музыку длиной более 6 минут. Три из четырёх моделей доступны с открытыми весами, большая - только через API.
Stability AI, которую все знают по Stable Diffusion, выкатила новое семейство аудиомоделей - Stability Audio 3.0. Главная фишка: старшая модель умеет генерировать музыку профессионального уровня длительностью больше шести минут. Для контекста - предыдущая версия 2024 года выдавала максимум три минуты, а открытая Stable Audio Open и вовсе ограничивалась 47 секундами.
Четыре модели на разные задачи
Линейка выглядит так:
- Small SFX (459M параметров) - для звуковых эффектов
- Small (459M параметров) - музыка до двух минут, подходит для работы на устройстве
- Medium (1.4B параметров) - полные композиции до 6 минут 20 секунд
- Large (2.7B параметров) - то же самое, но качественнее
Средняя и большая модели, по заявлению компании, способны удерживать музыкальную структуру и мелодическую линию на протяжении всего трека. Это уже не просто «сгенерировать 30 секунд лупа», а попытка создать полноценную композицию.
Три модели из четырёх (small SFX, small и medium) выложены с открытыми весами - бери и пользуйся. Большая доступна только через API и платный self-hosting. Плюс компаниям с выручкой больше миллиона долларов придётся покупать корпоративную лицензию.

Лицензионная чистота как конкурентное преимущество
Тут интересный момент. Suno и Udio сейчас судятся с правообладателями, и вопрос лицензирования данных для обучения становится критически важным для выживания подобных сервисов. Stability AI подстраховалась заранее - в прошлом году компания заключила сделки с Warner Music Group и Universal Music Group. Все новые модели, по их словам, обучены исключительно на лицензированных данных.
Компания также разрабатывает продукты для профессиональных музыкантов, хотя деталей пока не раскрывает. Зато нанимает людей из индустрии - к ним присоединился Итан Каплан, бывший директор по цифровым технологиям в Universal Audio и Fender. Впрочем, переманивание музыкальных топ-менеджеров - это сейчас общий тренд: Suno забрала себе экс-CEO Merlin, ElevenLabs - стратега из Kobalt.
Генерация музыки нейросетями постепенно переходит из категории «забавная игрушка» в нечто более серьёзное. Шесть минут связного трека - это уже заявка на инструмент, а не демку.
Смотрите также
-
Ассистенты·WWDC26: новый Siri, родительский контроль и быстрее на 80%
-
Ассистенты·Hinge защищает ИИ-подсказки для робких зумеров
-
Opensource·Mellum2 от JetBrains: быстрая модель для ИИ-систем
-
Ассистенты·Claude Opus 4.8: честнее, быстрее, дешевле
-
Opensource·Kimi K2.6 - открытая модель с роем агентов
-
Ассистенты·Claude получит файловую память вместо заметок
-
Инструменты разработчика·Anthropic готовит Mythos 1 для Claude Code и Security
-
ИИ-агент·Gemini 3.5: новый уровень интеллекта и скорости
-
Инструменты разработчика·Cursor выпустил Composer 2.5 - в 10 раз дешевле конкурентов