Stability AI запустила модель Stable Audio для генерации музыки по текстовому описанию — SAMESOUND

По словам разработчиков, диффузионная модель Stable Audio обучалась на наборе из текстовых метаданных и коллекции из 800 000 аудиофайлов. Среди данных присутствовали как коммерческие записи и звуковые эффекты, так и отдельные партии инструментов. Отмечается, что общее количество аудиоматериалов превышает 19,5 тысяч часов. Stability AI  заявляют , что Stable Audio отличается полной юридической прозрачностью. Так, например, данные для обучения были предоставлены компанией AudioSparx, владеющей внушительным каталогом музыки для коммерческого использования. Таким образом разработчики получили официальное право на использование защищённого копирайтом контента. Использование нейросети доступно как в платном, Подробнее