Suno AI

Компания, специализирующаяся на генеративных технологиях для звука, которая прославилась двумя направлениями: синтез речи и синтез музыки. Их флагманская разработка – модель Bark – произвела фурор как первая открытая модель, генерирующая не только речь, но и разнообразные аудиосигналы (музыку, шумы) по входному тексту.
Suno Bark – трансформерная text-to-audio модель, способная на лету озвучивать заданный текст на десятках языков, с разными голосами и эмоциями. Особенность Bark – мультижанровость: помимо речи, она может генерировать пение, имитацию звуков (лай собаки, аплодисменты и т.д.), музыку или мелодичные фразы, если указать это в подсказке. Например, модель понимает маркеры [🎵] или специальный синтаксис для смены языка и стиля речи, что делает её крайне гибкой. Bark бесплатно доступна разработчикам (опубликована на GitHub и HuggingFace) и вызвала огромный интерес как открытая альтернатива коммерческим TTS-сервисам. Она демонстрирует очень высокий уровень реалистичности и разнообразия голосов, хотя и уступает по чёткости некоторым узкоспециализированным продуктам. Тем не менее, с помощью Bark энтузиасты уже собирают голосовые приложения, озвучивают персонажей в играх и создают забавные аудио-мемы.

Другим направлением стало генеративное музыкальное ИИ. На платформе Suno запущен сервис AI Songs – пользователь может описать словами настроение, жанр, тему песни (даже приложить картинку или видео для вдохновения), и ИИ сгенерирует полноценный музыкальный трек с мелодией, инструменталом и даже вокалом. Например, запрос: “энергичный поп-трек о летнем отдыхе, женский вокал, куплет и припев” – через пару минут Suno выдаст готовую песню соответствующего звучания. Качество треков впечатляет: отмечают, что это профессионально звучащие композиции с хорошим миксом и продакшеном. Suno поддерживает множество жанров – от классики до метала, от электроники до джаза. При генерации можно выбирать стилистические параметры, длительность (есть пресеты до 4 минут), наличие вокала или чисто инструментал, простоту или насыщенность аранжировки. Все сгенерированные треки получаются уникальными и свободными от авторских прав – Suno прямо заявляет, что созданная ИИ музыка 100% copyright-free и может сразу использоваться в коммерческих целях. Это крайне привлекательно для видеоблогеров, подкастеров, рекламных агентств – можно легально получить оригинальный саундтрек буквально за секунды, не опасаясь блокировок. Сервис очень прост в использовании: текстовый интерфейс “text-to-music” доступен каждому, музыкального образования не требуется. Набросали идею – через минуту получаете MP3, который можно сразу скачать. Благодаря мощной оптимизации генерация происходит молниеносно: по заявлениям Suno, трек длительностью 3 минуты может быть создан за 1–2 минуты, а не за часы студийной работы. При этом качество не страдает – аудио 44.1 kHz, стерео, с чистым звуком студийного уровня.

Suno предлагает 4 бесплатных кредита на старт, чтобы опробовать генерацию музыки. Далее доступна подписка или покупка дополнительных кредитов (монетизация нужна из-за вычислительных затрат). Также, судя по сторонним ресурсам, появились клоны и альтернативные сайты, использующие движок Suno AI для музыки, но официальный портал – suno.com. Примечательно, что Suno AI активно исследует многомодальные сценарии: генерация песен по видео (саундтрек, отражающий динамику видео) или по текстовому сценарию. Это превращает его в универсальный инструмент для креативщиков: задай тему – и получи комплект аудио для своего проекта.

Таким образом, Suno сегодня закрывает две смежные ниши: синтез речи (Bark) – для озвучки и голоса, и синтез музыки (AI Songs) – для создания мелодий и песен. Оба направления свободно доступны и демонстрируют стремительное развитие, делая создание аудиоконтента проще и демократичнее.