OpensourceМузыкаНовости чтения

Stability AI выпустила модель для генерации 6-минутных треков

Stability Audio 3.0 генерирует музыку длиной более 6 минут. Три из четырёх моделей доступны с открытыми весами, большая - только через API.

Stability AI выпустила модель для генерации 6-минутных треков

Stability AI, которую все знают по Stable Diffusion, выкатила новое семейство аудиомоделей - Stability Audio 3.0. Главная фишка: старшая модель умеет генерировать музыку профессионального уровня длительностью больше шести минут. Для контекста - предыдущая версия 2024 года выдавала максимум три минуты, а открытая Stable Audio Open и вовсе ограничивалась 47 секундами.

Четыре модели на разные задачи

Линейка выглядит так:

  • Small SFX (459M параметров) - для звуковых эффектов
  • Small (459M параметров) - музыка до двух минут, подходит для работы на устройстве
  • Medium (1.4B параметров) - полные композиции до 6 минут 20 секунд
  • Large (2.7B параметров) - то же самое, но качественнее

Средняя и большая модели, по заявлению компании, способны удерживать музыкальную структуру и мелодическую линию на протяжении всего трека. Это уже не просто «сгенерировать 30 секунд лупа», а попытка создать полноценную композицию.

Три модели из четырёх (small SFX, small и medium) выложены с открытыми весами - бери и пользуйся. Большая доступна только через API и платный self-hosting. Плюс компаниям с выручкой больше миллиона долларов придётся покупать корпоративную лицензию.

Лицензионная чистота как конкурентное преимущество

Тут интересный момент. Suno и Udio сейчас судятся с правообладателями, и вопрос лицензирования данных для обучения становится критически важным для выживания подобных сервисов. Stability AI подстраховалась заранее - в прошлом году компания заключила сделки с Warner Music Group и Universal Music Group. Все новые модели, по их словам, обучены исключительно на лицензированных данных.

Компания также разрабатывает продукты для профессиональных музыкантов, хотя деталей пока не раскрывает. Зато нанимает людей из индустрии - к ним присоединился Итан Каплан, бывший директор по цифровым технологиям в Universal Audio и Fender. Впрочем, переманивание музыкальных топ-менеджеров - это сейчас общий тренд: Suno забрала себе экс-CEO Merlin, ElevenLabs - стратега из Kobalt.

Генерация музыки нейросетями постепенно переходит из категории «забавная игрушка» в нечто более серьёзное. Шесть минут связного трека - это уже заявка на инструмент, а не демку.

Смотрите также

Каталог приложений Telegram Mini Apps

340+ проверенных мини-приложений: нейросети, утилиты, игры. Открываются прямо в мессенджере — без установки.

Открыть →

Поддержите Ailibri

Если наш каталог оказался полезным, вы можете оставить небольшой донат. Это поможет нам развивать проект.

♥ Поддержать

Будьте в курсе новых нейросетей — подпишитесь на наш Telegram-канал

Ежедневные обзоры свежих AI-инструментов, лайфхаки и инструкции прямо в вашем мессенджере.

Подписаться
Бесплатно · Нейросеть

Генерация изображений прямо в Telegram

3 бесплатные генерации в день через нейросеть nano banana — просто подпишись на канал @n_seti

Быстро Точно Качественно
Попробовать @gen_neurosila_bot

Нейросети и ИИ-инструменты

Все теги →
github212 text-to-text136 text-to-image111 каталог29 image-to-image23 инструмент20 курсы19 создание чат-ботов15 браузер15 удалить фон14 text-to-sound12 text-to-video11 замена лица11 gpt-49 desktop-приложение9 ии-музыка9 аниме9 удалить объект с фото8 google8 создание сайтов7
AILibri – главная страница
Ctrl / ⌘+K