Музыкальный ИИ @gensound Channel on Telegram

Музыкальный ИИ

@gensound


Новости об ИИ технологиях в музыкальной индустрии
Другие каналы:
- о муз менеджменте @mishastips
- о муз дистрибуции @mudinews
Автор: @mazunov
Музыкальное агентство: https://mishas.tips/agency

Музыкальный ИИ (Russian)

Канал "Музыкальный ИИ" (@gensound) - это место, где вы сможете узнать о последних технологиях искусственного интеллекта в музыкальной индустрии. Здесь вы найдете эксклюзивный контент от boosty.to/mishastips, а также информацию о музыкальном менеджменте в канале @mishastips и музыкальной дистрибуции в канале @mudinews. Автором содержимого канала является @mazunov. Более того, вы сможете узнать о музыкальном агентстве, представленном на https://mishas.tips/agency. Присоединяйтесь к нам, чтобы быть в курсе всех новостей и инноваций в мире музыки и технологий!

Музыкальный ИИ

19 Feb, 10:48


Выход из алгоритмической ловушки

Если рекомендации ИИ загнали меня в музыкальную рутину — что делать? Решение простое, даже банальное, но мне нужно было напомнить себе о нём.

Я начала искать новую музыку: слушаю музыкальные подкасты, радио, спрашиваю совета у друзей. Само осознание проблемы — уже шаг вперёд.

Я стала использовать Spotify осознаннее: перемешиваю свою библиотеку, ищу исполнителей сама, а не кликаю на градиент Daylist. Сегодня утром вместо Daylist я включила плейлист с новой музыкой. Небольшой, но шаг.

Музыка — это не просто удобство

Мне нравится удобство алгоритма, подсказывающего, что слушать. Но мне не нравится, как он превращает музыку в товар.

Эти платформы не помогают открывать новые таланты или поддерживать начинающих артистов — они продвигают тренды. Их цель — удержать нас и заработать.

А ведь в случайных открытиях, человеческой курации и неожиданных находках есть магия. Это требует усилий, терпения и готовности к ошибкам. Можно ли это закодировать? Слишком сложно, слишком по-человечески. Но, возможно, когда-нибудь.

А может, я не права. Может, рекомендательные системы понимают что-то глубоко человеческое — просто не то, в чём мы признаёмся.

Мы говорим, что любим новое. Но в развлечениях — фильмах, сериалах, музыке — мы не так уж авантюрны. Может, нам просто нравится знакомое.

Может, не Spotify делает меня скучной. Может, я просто скучная.

Музыкальный ИИ

19 Feb, 10:48


«Помогите, кажется, Spotify делает меня скучной! И во всём виноват ИИ»

Перевод статьи Бекки Кэдди, автора TechRadar.

Я слушаю музыку функционально: плейлисты для зала, фон для работы, энергичные треки от послеобеденного спада. Мой выбор привязан к делам и времени суток, поэтому, когда Spotify запустил Daylist в сентябре 2023-го, я подсела.

Daylist — динамический персонализированный плейлист, обновляющийся в течение дня на основе ваших привычек. Он подбирает треки, соответствующие прошлым выборам, подстраиваясь под время и, теоретически, настроение. Идеально: открыл, посмеялся над названиями от ИИ, включил случайное воспроизведение — и вперёд, думать не надо.

Но хорошо ли это? Поначалу — да. Но со временем я стала слишком полагаться на Daylist. Теперь замечаю закономерность: одни и те же темы, одни и те же треки.

И вот вопрос: не застряла ли я в цикле, созданном ИИ? Не кормлю ли я систему одними и теми же предпочтениями, пока мой вкус не превратится в замкнутый круг? Не делает ли меня алгоритм Spotify предсказуемой и… скучной?

Как работают рекомендации?

Персонализированный контент — основа успеха Spotify. Daylist — лишь одна из функций, построенных на рекомендациях. Есть Discover Weekly, Release Radar, Daily Mix, On Repeat, Repeat Rewind, Your Daily Podcasts и другие.

Сезонные плейлисты, например, Spotify Wrapped, тоже освежают контент. Подход Spotify настолько успешен, что другие стриминговые сервисы копируют его, улучшая свои алгоритмы.

Некоторые плейлисты Spotify составляют люди, но большинство — дело рук алгоритмов. Система анализирует: что вы слушаете, что пропускаете, что сохраняете, ваше местоположение, возраст, поведение других слушателей и общие тренды. Ключевой метод — коллаборативная фильтрация: анализ пользователей со схожими привычками для рекомендаций.

Есть ещё контентная фильтрация — анализ характеристик песен (темп, жанр, инструменты) для поиска похожих треков. И контекстная фильтрация — учёт времени суток, местоположения и истории прослушивания. На ней основан Daylist.

Эти методы работают вместе, поддерживая свежесть и персонализацию рекомендаций. Даже когда кажется, что алгоритм просто пережёвывает старые любимые песни, он предлагает новые, соответствующие моим вкусам — с лёгким разнообразием.

Фильтрационный пузырь

У персонализации есть обратная сторона. Чем больше я слушаю рекомендации алгоритма, тем сильнее закрепляются мои предпочтения, создавая «эхо-камеру» или «фильтрационный пузырь».

И это не только Spotify. Netflix, YouTube, новостные приложения — все действуют так же, предлагая больше того, что нам нравится, в ущерб новым открытиям.

Это не ново. Наш цифровой опыт (и даже вкусы) годами формируется рекомендациями, а не любопытством. Удобство встроено в систему, вырваться сложно. Будем честны: эти платформы созданы, чтобы мы листали, смотрели и слушали, а не искали новое.

Музыкальный ИИ

16 Feb, 10:42


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 10 по 16 февраля. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 Болливудские музыкальные лейблы (T-Series, Saregama, Sony) хотят судиться с OpenAI в Индии из-за нарушения авторских прав. Они считают, что OpenAI незаконно использует их музыку для обучения ИИ, в частности, ChatGPT, и присоединяются к иску индийского агентства ANI.

📰 Компания Sampleson выпустила rePEDAL — бесплатный плагин, генерирующий эффекты овердрайва с помощью ИИ. Нажатием кнопки создаётся уникальная виртуальная педаль с рандомизированными настройками, названием и цветом, что открывает новые возможности для саунд-дизайна. Сейчас плагин в бета-версии, и Sampleson собирает отзывы.

📰 Виртуальная K-pop группа PLAVE добилась успеха благодаря человеческому подходу к творчеству. За аватарами Йеджуна, Ноя, Бэмби, Ынхо и Хамина стоят реальные артисты, которые сами пишут музыку, ставят хореографию и общаются с фанатами, преодолевая виртуальную стену. Генеральный директор лейбла VLAST, Ли Сонгу, рассказал NME, что ставка на живых исполнителей — ключ к популярности PLAVE.

📰 Qsic, австралийский разработчик ИИ-платформы для аудиорекламы, привлёк $25 млн. Инвестиции позволят компании расширить присутствие на рынке, усовершенствовать технологии, включая ИИ-модель Lucy для создания персонализированной рекламы, и масштабировать продажи. Среди клиентов Qsic — 7-Eleven, Coles Express и McDonald's. Генеральный директор Мэтт Элсли заявил о росте продаж до 14% у ретейлеров, использующих решения Qsic. Партнёрство с 7-Eleven приведёт к запуску Gulp Radio в 12 000 магазинов США к концу 2025 года.

📰 SourceAudio запустила набор инструментов SongLab для создания музыки с помощью ИИ, основанный на лицензированной базе данных из более чем 30 млн песен. Сервис позволяет создавать новые треки с выплатой роялти оригинальным артистам, а также предлагает инструменты для перевода текстов, адаптации музыки и защиты от несанкционированного обучения ИИ (AudioGuard).

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

15 Feb, 13:43


ИИ и робототехника: революция в музыке и развлечениях

Исследователи из ведущих университетов мира (Кембриджский университет, Швейцарский федеральный технологический институт Лозанны, Университет Кобе, Университет королевы Марии в Лондоне) опубликовали исследование, посвящённое последним достижениям в области музыкальных и развлекательных роботов на базе ИИ.

Работа опубликована в журнале Frontiers in Robotics and AI. Публикуем саммари статьи.

Роботы больше не просто выполняют простые задачи. Благодаря ИИ они способны к продвинутому взаимодействию с человеком, включая эмоциональное. Это открывает новые горизонты для создания выразительных роботов в сфере музыки и развлечений.

Шесть статей, объединённых темой «Музыкальные и развлекательные роботы на базе ИИ», исследуют различные аспекты этой области, включая пение, танцы и игру на музыкальных инструментах (фортепиано, скрипка, гитара, барабаны, маримба).

Ловкая манипуляция и сенсомоторная координация

Универсальная роботизированная рука. Разработана система с 3D-печатной рукой, способной играть на фортепиано и гитаре. Модуляция механических свойств и режимов управления обеспечивает выразительность исполнения.

Танцевальное исполнение с носимыми датчиками. Исследовано влияние носимых датчиков на художественную выразительность танца. Разработан алгоритм для определения импровизационных движений и управления носимыми устройствами.

Обучение и управление роботами

Робот-скрипач. Создан контроллер на основе обучения с подкреплением для робота-скрипача. Робот имитирует движения человека, играя по нотам и интерпретируя сложные задачи.

Робот-барабанщик. Исследована игра на барабанах с помощью робота ZRob. Алгоритм обучения с подкреплением (DDPG) позволил роботу создавать новые ритмы.

Взаимодействие роботов с людьми

Робот-маримбист. Исследовано влияние социальных жестов робота на синхронизацию музыкантов. Движения головы робота улучшают синхронность, демонстрируя роль невербалики в продвинутом взаимодействии с человеком.

Пение с Vocaloid. Сравнена синхронизация голоса при пении с человеком и с Vocaloid. Исследование подчёркивает важность физического воплощения для естественного взаимодействия.

Выводы и перспективы

Обучение с подкреплением — перспективный метод для развития навыков музыкальных роботов. Системы на базе ИИ уже демонстрируют выразительную игру на инструментах. Взаимодействие «человек–робот» требует междисциплинарного подхода.

Музыкальный ИИ

14 Feb, 13:04


«Как Spotify, YouTube, SoundCloud и другие готовятся к музыкальному ИИ?»

Саммари статьи Кристин Робинсон из новостной рассылки Billboard о музыкальных технологиях Machine Learnings.

Музыкальный ИИ стремительно развивается, вызывая вопросы о будущем музыкальной индустрии. Сервисы, такие как Spotify, YouTube и SoundCloud, сталкиваются с новыми вызовами, связанными с дипфейками, мошенничеством и необходимостью защитить права артистов.

«Теория мёртвого интернета» в музыке

Аналогично тому, как изображения, созданные ИИ, заполняют социальные сети, сгенерированные ИИ песни заполоняют стриминговые платформы. По прогнозам CISAC и PMP, это может привести к потере 24% доходов музыкальных создателей к 2028 году. Поэтому стриминговые сервисы активно разрабатывают политику в отношении ИИ-контента.

Deezer и проблема определения ИИ

Deezer запустил инструмент, который помечает и удаляет из рекомендаций треки, полностью сгенерированные ИИ. Компания утверждает, что около 10% загружаемого контента — это ИИ-музыка. Однако, по мнению экспертов, точность существующих детекторов ИИ оставляет желать лучшего. Поэтому другие платформы не спешат внедрять подобные инструменты, опасаясь ложных срабатываний и проблем с модерацией.

Борьба с дипфейками и мошенничеством

Защита от дипфейков, мошенничества со стримингом и спама — приоритет для стриминговых платформ. Хотя специфических политик для ИИ пока нет, сервисы предлагают пользователям сообщать о подделках. YouTube Music разрабатывает новую технологию распознавания синтетического пения в рамках Content ID, чтобы защитить артистов.

Мошенничество с ИИ-музыкой

Случай с музыкантом из Северной Каролины, который использовал ИИ для создания сотен тысяч песен и заработал на этом более 10 миллионов долларов мошенническим путём, показал уязвимость стриминговых сервисов. Spotify внедрили ограничения на количество загрузок, чтобы бороться со спамом. SoundCloud считает, что их система роялти, основанная на фанатах, помогает решить эту проблему.

Авторское право и общественное достояние

Офис авторских прав США постановил, что полностью сгенерированные ИИ произведения не защищены авторским правом. SoundCloud запрещает монетизацию такого контента, другие платформы пока выплачивают роялти на все загруженные треки.

Что дальше?

Стриминговым сервисам предстоит продолжать совершенствовать инструменты для определения ИИ и атрибуции, бороться с мошенничеством, защищать права на публичность и решать сложные вопросы авторского права в контексте ИИ.

Будущее музыки, созданной ИИ, пока неясно. Возможно, различие между ИИ-музыкой и музыкой, созданной человеком, со временем исчезнет. Но пока индустрия продолжит адаптироваться к этой быстро развивающейся технологии.

Музыкальный ИИ

13 Feb, 08:37


«Приведёт ли генеративный ИИ к новой эре креативности брендов?»

Саммари статьи в Форбс Энтони Демехина, соучредителя и гендиректора Tuney, платформы ИИ-музыки для создателей контента и бренд-команд.

Генеративный ИИ (Gen AI) стремительно меняет маркетинг. Теперь бренды используют ИИ не только для рекламы и таргетинга, но и для создания контента: видео, изображений, музыки. Это открывает новые возможности, но также ставит бренды перед выбором: использовать мощь ИИ этично или рисковать, создавая бездушный контент.

Человек vs. ИИ: борьба за доверие

Сегодня потребители, особенно молодые, ценят аутентичность и доверяют людям больше, чем брендам. Gen AI может создавать впечатляющий контент, но без человеческого участия он теряет эмоциональную связь с аудиторией.

Уроки 2024: баланс между инновациями и этикой

Примеры Bacardi и Pedigree показывают, как Gen AI может создавать вирусные кампании. Однако чрезмерное использование ИИ может оттолкнуть аудиторию. Потребители опасаются, что ИИ заменит творческих профессионалов, и брендам важно показывать, как технологии усиливают, а не вытесняют человеческое творчество.

Пример Sprite и SoundLabs: сила гибридного подхода

Платформа Sprite Limelight с интеграцией SoundLabs — пример успешного сочетания ИИ и творчества. Фанаты смогли создавать ремиксы с помощью ИИ, основанные на музыке, созданной людьми. Этот подход позволяет брендам внедрять инновации, делая акцент на человеческом участии.

Этические вызовы и прозрачность

Потребители и регулирующие органы требуют от брендов этичного использования ИИ. Прозрачность и открытость в работе с ИИ, включая лицензирование контента для обучения моделей, — ключ к построению доверия.

2025: год ответственного ИИ-маркетинга

Gen AI — это инструмент для масштабирования человеческой креативности, а не её замены. Бренды, которые используют ИИ этично и прозрачно, создавая контент с человеческим участием, будут лидерами в 2025 году. Баланс между технологиями и человеческим творчеством — основа успеха в эпоху ИИ.

Музыкальный ИИ

12 Feb, 10:19


DeepSeek, ИИ и музыка: повторит ли он судьбу TikTok

Перевод статьи Forbes.

27 января 2025 года китайская компания DeepSeek, разработчик технологий искусственного интеллекта, возглавила рейтинг бесплатных приложений в Apple App Store. Это произошло спустя всего несколько дней после выпуска её флагманской модели R1.

Модели DeepSeek превзошли аналоги от OpenAI и Anthropic в независимых тестах, работая при этом экономичнее за счёт меньшего количества мощных чипов.

После успеха DeepSeek акции гигантов ИИ — Nvidia, Oracle и Microsoft — упали на 16, 10 и 4% соответственно.

Реакция Meta*: «дешёвая и грязная» модель или реальная угроза?

Бизнес-аналитик и соведущий подкаста Pivot Скотт Гэллоуэй ожидал падения акций Meta. Однако их цена осталась стабильной — компания создала аналитические группы для изучения DeepSeek. Ведущий специалист Meta по ИИ Янн Лекун назвал подход DeepSeek «дешёвым и грязным», отметив, что американские компании разрабатывают более продвинутые решения. Вопрос в том, насколько это различие повлияет на потребителей.

Стратегия в стиле Temu: влияние на ИИ и рынок

DeepSeek использует стратегию, схожую с китайским гигантом электронной коммерции Temu, предлагающим «быструю моду» — товары сомнительного качества по низким ценам. В 2024 году Temu захватила 17% американского рынка e-commerce в сегменте дискаунтеров и стала самым загружаемым приложением в App Store.

На что стоит обратить внимание участникам музыкальной индустрии, учитывая растущую популярность DeepSeek?

Дешёвые решения на основе ИИ могут сделать DeepSeek привлекательным для стартапов, разрабатывающих инструменты для оптимизации рабочих процессов в музыкальном бизнесе. Поскольку отрасль всё больше полагается на новые технологии, достижения DeepSeek способны изменить её работу.

От TikTok к DeepSeek: что на кону для музыки и ИИ?


За последний год музыкальная индустрия столкнулась с серьёзными потрясениями — например, угрозой запрета TikTok. Эта соцсеть стала неотъемлемой частью музыкального бизнеса, помогая открывать новых артистов, расширяя возможности лицензирования и увеличивая доходы музыкантов.

Компании всё больше зависят от инфраструктуры ИИ, и риск ужесточения регулирования создаёт проблемы не только для музыкальной индустрии, но и для экономики в целом. Платформы, от которых зависит бизнес, могут быть ограничены или удалены.

* — Meta признана в РФ экстремистской организацией, её деятельность запрещена в РФ.

Музыкальный ИИ

11 Feb, 11:48


Исследование: «Готовы ли слушатели к ИИ?»

NuVoodoo, американская исследовательская компания, специализирующаяся на музыкальной индустрии, опубликовала результаты своего национального опроса, в котором приняли участие почти 3000 респондентов от 14 лет и старше.

Исследование охватывает разные поколения: бэби-бумеры (59–77 лет), поколение X (43–58 лет), миллениалы (27–42 года) и поколение Z (14–26 лет), уделяя особое внимание миллениалам и поколению Z, которые составляют три четверти выборки. Поколение Альфа (0–13 лет) начнёт появляться в выборках через пару лет.

Знакомство с ИИ

Несмотря на широкое обсуждение ИИ, большинство респондентов ещё не взаимодействовали с этой технологией. Бэби-бумеры реже всего используют ИИ, а значительная часть поколения X также избегает его. Даже среди миллениалов и поколения Z есть группы, которые пока не пользовались ИИ. Только четверть респондентов регулярно используют цифровых голосовых помощников, таких как Siri и Alexa.

Предпочтения слушателей

В опросе респондентам предложили выбрать между двумя подкастами или радиошоу: с ведущими, чьи голоса сгенерированы ИИ, но звучат естественно, и с ведущими-людьми, чьи голоса менее отточены. Во всех демографических группах предпочтение отдали людям. Однако треть миллениалов и четверть поколения Z выбрали ИИ-голоса. Значительное число респондентов ответили «Не уверен», что указывает на сложность восприятия абстрактного шоу с ИИ.

ИИ и радио

Среди слушателей подкастов интерес к шоу, сгенерированным ИИ, выше (37%), чем среди слушателей музыкальных радиостанций (27%). Это говорит о том, что контент важнее подачи, будь то голос человека или ИИ.

NuVoodoo считает, что живые радиоведущие по-прежнему незаменимы для взаимодействия с аудиторией, участия в мероприятиях и установления личных связей. ИИ может стать полезным инструментом для радиостанций, но не сможет полностью заменить человека. Будущее радио, вероятно, будет сочетать в себе преимущества как человеческого, так и искусственного интеллекта.

Музыкальный ИИ

09 Feb, 14:23


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 3 по 9 февраля. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 Sónar 2025 представил программу фестиваля в Барселоне, где ключевой темой Sónar+D станет использование ИИ в музыке. Организаторы, включая designboom и Университет Памплоны, обещают 117 выступлений, коллаборации и исследования в рамках проекта TIMES и программы AI & Music (S+T+ARTS).

📰 Рианна возмущена использованием ИИ для имитации её голоса в Instagram*. Пользователь создал ролик, где голос, сгенерированный ИИ, приписывал певице хвастовство дорогими покупками. Rihanna не первая звезда, столкнувшаяся с подобным.

📰 Musical AI привлекла $2,1 млн инвестиций на развитие платформы управления правами для контента, созданного генеративным ИИ. Модель атрибуции, разработанная компанией, позволяет правообладателям монетизировать вклад в ИИ и обеспечивает прозрачность лицензирования для ИИ-компаний. Инвестором выступила Build Ventures.

📰 Компания Dreamster создала децентрализованную соцсеть, где музыканты превращают свои произведения и контент в цифровые активы (NFT) для монетизации и взаимодействия с фанатами, предлагая доходность выше, чем Spotify и Apple. Платформа позволяет размещать NFT напрямую из ленты, а функция Backstage — проводить виртуальные встречи с фанатами и делиться эксклюзивным контентом.

📰 Spotify демонстрирует впечатляющий финансовый рост, благодаря фокусу на прибыльность и ИИ. Компания, во главе с Даниелем Эком, планирует ускорить развитие продуктов, а Густав Сёдерстрём выделяет ИИ как ключ к эффективности и персонализации, что позволит Spotify задавать тон в эпоху "Streaming 2.0" даже вопреки Universal Music Group.

💬 Какую из новостей считаете главной на этой неделе?

* — Meta признана в РФ экстремистской организацией, её деятельность запрещена в РФ.

Музыкальный ИИ

08 Feb, 08:54


DeepSeek: тревожный звонок для музыкальной индустрии? Эксперт предупреждает о рисках неконтролируемого ИИ и «технофеодализме»

Виржини Берже, директор по развитию бизнеса и прав в MatchTune, в своей новой колонке для Music Ally анализирует DeepSeek — новую LLM-модель с открытым исходным кодом, и её потенциальное влияние на музыкальную индустрию.

В этом посте саммари гостевой колонки. Полный текст на сайте
Music Ally.

Берже, которая уже высказывала опасения по поводу ИИ в своих предыдущих работах, называет DeepSeek «экзистенциальной угрозой», которая может привести к «технофеодализму», где крупные технологические компании контролируют инновации.

DeepSeek: дешёвый, мощный и опасный?

DeepSeek R1 — это доступная и мощная модель, которая может работать локально, без необходимости подключения к интернету. Это, по словам Берже, делает её доступной для всех, от исследователей до стартапов, что может привести к взрывному росту числа инструментов ИИ, использующих неэтично полученные данные.

Она утверждает, что DeepSeek обучен с нарушением авторских прав, ссылаясь на использование пиратских материалов в обучающем наборе данных. Она предупреждает, что DeepSeek может усилить конкуренцию для артистов, способствовать манипуляциям с алгоритмами стриминговых сервисов и сократить роялти.

Открытый код и ответственность

Берже критикует идею о том, что открытый код автоматически означает этичность, подчёркивая, что это не снимает ответственности с разработчиков за использование нелицензированного контента. Она также выражает опасения по поводу того, что открытый код позволяет легко модифицировать модели, обходя защиту авторских прав.

Квантовые вычисления и ИИ-агенты: новая эра плагиата?

Виржини предупреждает, что квантовые вычисления и ИИ-агенты могут усугубить проблему. Квантовые вычисления позволят создавать копии с пугающей точностью, а ИИ-агенты будут генерировать музыку в таких объёмах, что защита авторских прав потеряет смысл.

Технофеодализм: кто владеет ИИ?

Берже критикует OpenAI за то, что компания, которая сама использовала данные из интернета для обучения своих моделей, теперь обвиняет DeepSeek в «дистилляции» и претендует на владение ИИ-контентом. Она выражает опасения, что законопроект США, запрещающий импорт AI-технологий из Китая, может привести к «технофеодализму», где крупные компании ИИ контролируют инновации.

Что делать музыкальной индустрии?

Виржини Берже призывает музыкальную индустрию перейти от переговоров к сопротивлению, инвестировать в защитные технологии и оказывать давление на законодателей для регулирования ИИ. Она считает, что индустрия должна объединиться и защищать свои интересы, иначе рискует потерять контроль над своим будущим.

Музыкальный ИИ

06 Feb, 11:13


Российский GenAI: карта рынка и его перспективы

Компания «Технократия» представила карту рынка генеративного ИИ в России и сопутствующих продуктов. Исследование выявило ключевых игроков и перспективные направления развития. Пресс-релиз доступен по ссылке.

Ключевые сегменты рынка

▫️ Разработка больших языковых моделей (LLM). Яндекс (YandexGPT), Сбер (GigaChat), а также open-source решения Saiga LLM и Вихрь LLM, основанные на иностранных моделях, адаптированных для русского языка.
▫️ ИИ-агенты. JustAI, Битрикс CoPilot, Sistemma и другие предлагают white-label решения. R77AI, Napoleon IT, Naumen разрабатывают кастомные ИИ-агенты.
▫️ Генераторы контента. Яндекс и Сбер — основные игроки в области генерации кода, изображений и видео. MTC AI (Kodify) также выделяется в генерации кода.
▫️ Облачная инфраструктура. Selectel и Рег.ру предоставляют вычислительные мощности с GPU, включая Nvidia A100.
▫️ Автоматизация поддержки. ЦРТ, JustAI и Наносемантика лидируют в разработке голосовых и текстовых ассистентов.
▫️ Бенчмарки. Рынок представлен как универсальными бенчмарками для LLM, так и специализированными для отдельных задач, включая генерацию кода и решения для здравоохранения.
▫️ Кибербезопасность. Kaspersky и Positive Technologies исследуют атаки с применением ИИ и разрабатывают этичные решения.
▫️ Консалтинг и системная интеграция. «Технологии доверия» (экс-PWC) и RedMadRobot предоставляют услуги консалтинга и интеграции LLM.

Основные выводы

▫️ Автоматизация технической поддержки — наиболее активное направление внедрения ИИ.
▫️ Сбер и Яндекс лидируют в разработке российского ИИ, также активно развиваются MTS AI и Т-Банк (Gen-T).
▫️ Доступность передовых GPU-решений, таких как Nvidia H100, ограничена.
▫️ Разработчики цифровых продуктов расширяют свои услуги, предлагая разработку ИИ-агентов и интеграцию LLM.
▫️ Ожидается рост внедрения ИИ-агентов в бизнес-процессы.

Экономический контекст

Российский рынок ИИ оценивается в 900 млрд рублей (2023). В России около 540 организаций, занимающихся ИИ, 68% из которых находятся в Москве. Обработка естественного языка (NLP) занимает 61,3% рынка, анализ данных — 33,6%. Рынок LLM составляет 35 млрд рублей и, по прогнозам, будет расти на 25% ежегодно до 2028 года. Однако есть сложности с закупками оборудования и данными для обучения.

Перспективы

Несмотря на вызовы, российский рынок GenAI активно развивается. Ожидается дальнейший рост в области автоматизации, разработки ИИ-агентов и внедрения LLM в различные сферы бизнеса. Ключевыми факторами успеха станут доступность передовых технологий и качественных данных для обучения моделей.

Музыкальный ИИ

05 Feb, 07:12


В связи с ростом числа подделок, созданных ИИ, необходимо чётко отличать музыку, созданную людьми, от контента, сгенерированного ИИ.

Перевод статьи MusicTech.

Задумывались ли вы когда-нибудь о составе вашей утренней каши? Всё просто: переверните упаковку, и вы увидите полный список ингредиентов. Однако, включив утренний плейлист, вы не сможете сразу определить, слушаете ли вы настоящую песню или её ИИ-версию.

Потоковые платформы заполняются контентом, созданным ИИ. Некоторые треки имитируют голоса живых исполнителей, другие — умерших, а третьи создаются автоматически и публикуются под вымышленными именами. Это приводит к уменьшению доходов реальных музыкантов.

Согласно исследованию MusicMagpie, на YouTube уже более полутора миллионов кавер-версий, созданных ИИ. Анализ 1500 самых популярных таких треков показал, что чаще всего копируют Blackpink, Джастина Бибера и Канье Уэста — их песни набрали более 33 миллионов просмотров.

По оценкам, музыкальная индустрия потеряла более 10 миллионов фунтов стерлингов из-за контента, созданного ИИ. Но это, вероятно, лишь малая часть проблемы. Представьте: музыкант из Северной Каролины, обладая скромными ресурсами, создал сотни тысяч фальшивых треков, набрав миллиарды прослушиваний и получив миллионы долларов с платформ. Настоящий масштаб потерь, скорее всего, гораздо больше.

Естественно, артисты и лейблы недовольны. Многие поддерживают Закон о борьбе с мошенничеством ИИ в США, тысячи подписали открытое письмо с протестом против сомнительных практик, которые это позволяют. Музыкальные фанаты тоже обеспокоены ситуацией.

Опрос AuthorityHacker показал, что 93% опрошенных (1200 человек) ценят музыку, созданную людьми, гораздо выше, чем музыку, созданную ИИ. Более 60% готовы слушать музыку, созданную ИИ, но 56% не станут платить за неё. Самое важное: 89% респондентов хотят чёткой маркировки музыки, созданной ИИ.

Удивительны ли эти результаты? Нет. Сравните шампанское и игристое вино: большинство людей не смогут отличить дорогое от дешёвого на вкус. Но им важно знать происхождение вина, и они готовы платить больше за настоящее. Государство защищает виноделов от подделок. А где защита для музыкантов?

Скоро ИИ сможет создавать музыку, не уступающую человеческому творчеству по мелодичности, сложности и качеству звука. До этого момента правительства и отрасль должны разработать чёткие правила маркировки, чтобы покупатели могли делать осознанный выбор.

Обязательная маркировка вокальных дипфейков и сгенерированного контента — это первый шаг. Но, возможно, нужно пойти дальше. Лейблы и исполнители могут сопротивляться раскрытию информации об использовании ИИ в микшировании и мастеринге, но все профессионалы заслуживают защиты от подделок.

Музыка — не роскошь, это неотъемлемая часть общества. В Великобритании, например, музыкальная сцена всегда была очень влиятельной и коммерчески успешной, британские артисты постоянно входят в число самых продаваемых в мире. Позволить этому наследию исчезнуть под натиском ИИ — это преступление.

Идея «экологически чистой» музыки может показаться странной. Но рынок винила показывает: люди готовы платить больше за то, что считают ценным. При выборе между музыкой, созданной человеком и машиной, слушатели, скорее всего, выберут человеческое творчество.

Музыкальный ИИ

04 Feb, 11:39


YuE: новый музыкальный ИИ с открытым кодом, генерирующий песни офлайн

Вслед за DeepSeek R1, Alibaba Qwen 2.5 Max и DeepSeek Janus Pro, мир китайского ИИ пополнился новым музыкальным генератором YuE (乐), разработанным Multimodal Art Projection (M-A-P) совместно с Гонконгским университетом науки и технологий (HKUST).

YuE, что на китайском означает «музыка» и «счастье», способен генерировать полноценные песни по тексту, включая вокал и аккомпанемент, в различных жанрах, языках и вокальных стилях. Примеры демонстрируют впечатляющую целостность композиций, хотя пока только в моно, в отличие от стереозвука Udio и Suno.

Главное отличие YuE — возможность офлайн-работы на локальном оборудовании. Однако для этого требуется мощная система: генерация 30-секундного аудио на Nvidia H800 занимает ~150 секунд, а на GeForce RTX 4090 — ~360 секунд. Разработчики рекомендуют минимум 80 ГБ видеопамяти для генерации полных песен, что пока доступно только на топовых видеокартах, таких как Hopper H800, A100 или нескольких RTX 4090. Для коротких фрагментов достаточно 24 ГБ.

Инструкции по установке и настройке YuE доступны на YouTube.

YuE, основанный на архитектуре LLama от Meta*, обучен в три этапа для обеспечения масштабируемости, музыкальности и текстового управления. M-A-P выпустила модели с 1 и 7 миллиардами параметров для английского, китайского (мандаринский и кантонский), японского и корейского языков, а также модель повышения разрешения до CD-качества (44,1 кГц).

YuE доступен на GitHub под лицензией Apache 2.0, позволяя использовать его в коммерческих проектах с указанием авторства M-A-P. Разработчики поощряют музыкантов к повторному использованию и монетизации сгенерированных произведений.

Недавно добавлена функция «обучения в контексте», позволяющая YuE имитировать стиль референсного трека.

В планах — управление темпом (BPM), улучшенный интерфейс и снижение требований к памяти через переход на GGML. Команда ищет партнёров для развития YuE, включая создание и курирование обучающих данных. Научная статья о проекте ожидается в ближайшее время. Пока доступны аннотация, графика и аудиопримеры на странице проекта.

* — Meta признана в РФ экстремистской организацией, её деятельность запрещена в РФ.

Музыкальный ИИ

03 Feb, 13:42


Рынок живой музыки и ИИ: рост и новые возможности

Глобальный рынок живой музыки готовится к значительному росту. Согласно новому отчёту Technavio, рынок вырастет на 17,99 млрд долларов к 2029 году.

Ожидаемый среднегодовой темп роста (CAGR) составит 11,2%, что открывает новые перспективы для артистов, организаторов мероприятий и технологических компаний, работающих в сфере музыкального ИИ.

Ключевые факторы роста

▫️ Высокий спрос на живые концерты. Несмотря на развитие цифровых платформ, живые выступления остаются ключевым источником дохода для музыкантов и предоставляют фанатам уникальный эмоциональный опыт.
▫️ Развитие виртуальных и гибридных форматов. Технологии, такие как VR/AR и голограммы, расширяют возможности живой музыки, привлекая новую аудиторию и создавая новые форматы взаимодействия с артистами.
▫️ Внедрение ИИ. Искусственный интеллект всё чаще используется для оптимизации процессов: от продажи билетов и анализа данных до персонализации контента и создания новых впечатлений для зрителей.

Основные вызовы

▫️ Безопасность онлайн-платформ. Защита данных пользователей и предотвращение мошенничества при продаже билетов — важные задачи для развития рынка.
▫️ Конкуренция. Рынок живой музыки остаётся фрагментированным, с множеством игроков, что создаёт конкуренцию.

Влияние ИИ на рынок

▫️ Поиск талантов.
Помощь в поиске перспективных артистов, анализе данные стриминговых сервисов и социальных сетей.
▫️ Продвижение концертов. Оптимизация рекламных кампаний, таргетинг на нужную аудиторию.
▫️ Создание новых впечатлений. Использование для создания интерактивных шоу с использованием VR/AR и голограмм.
▫️ Анализ данных. Помощь организаторам мероприятий в анализе данных о продажах билетов и предпочтениях зрителей.

Ключевые игроки

Среди компаний, которые, вероятно, будут играть важную роль в развитии рынка, — Live Nation Entertainment Inc., Vivendi SE, Ticketmaster и другие. Также ожидается появление новых игроков, специализирующихся на ИИ-технологиях для живой музыки.

Перспективы

Technavio прогнозирует, что рынок живой музыки продолжит расти в ближайшие годы, чему будет способствовать высокий спрос на живые выступления, развитие технологий и внедрение ИИ. Однако для устойчивого роста необходимо решить проблемы безопасности и конфиденциальности данных.

Полный отчёт доступен на сайте Technavio.

Музыкальный ИИ

02 Feb, 15:31


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 27 января по 2 февраля. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 Испанский стартап Breakevent, использующий ИИ для анализа данных о концертах, привлёк 908 тыс. долларов инвестиций. Сервис, основанный Лусией Мартинес Прадо, анализирует данные о 15 тыс. мероприятий и 1,5 тыс. площадок в Испании, предоставляя рекомендации по ценам на билеты, выбору артистов и прогнозируя успех концертов. Archipélago Next возглавил раунд, в котором также участвовали Startup Wise Guys, WA4STEAM и Мигель Эченике.

📰 Tuned Global и AudioShake объединились, чтобы внедрить функции ИИ в потоковую передачу музыки. Интеграция позволит клиентам Tuned Global, таким как Warner Music, Universal Music и Sony Music, разделять треки на стемы и генерировать тексты песен, открывая возможности для караоке, ремиксов и улучшенного поиска музыки. Кон Расо (Tuned Global) и Джессика Пауэлл (AudioShake) считают, что это важный шаг для инноваций в музыкальной индустрии.

📰 Компания AIBotics, занимающаяся робототехникой для здоровья, покупает музыкальный стартап DigiTrax за $40 млн. DigiTrax, основанный в 2017, работает в разных музыкальных направлениях, включая ИИ-музыку, где владеет семью патентами, что, вероятно, и заинтересовало AIBotics, известную массажным роботом Phill и умным холодильником Milkyway. Сделка должна закрыться к концу февраля.

📰 ElevenLabs привлекла $180 млн в раунде серии C, достигнув оценки в $3,3 млрд. Стартап, основанный Мати Станишевски и Пётром Дабковским, разрабатывает ИИ-модели для работы со звуком и получил инвестиции от a16z, ICONIQ Growth и других. Компания планирует улучшить свои аудиоинструменты, разговорный ИИ и «омни-модели», объединяющие текст и аудио.

📰 Oracle, Microsoft и Perplexity AI претендуют на покупку TikTok в США. ByteDance должна продать американский сегмент TikTok из-за требований регуляторов, и президент Трамп заявил, что решение будет принято в течение 30 дней. Oracle готова инвестировать десятки миллиардов долларов и, возможно, будет контролировать алгоритмы, сбор данных и обновления, если ByteDance сохранит миноритарный пакет. Perplexity AI предложила создать совместную компанию с последующим IPO и долей правительства США до 50%. Среди других заинтересованных лиц — Илон Маск, Фрэнк МакКорт и Кевин О’Лири.

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

01 Feb, 11:34


Бюро по авторским правам США: произведения, созданные ИИ, не защищаются авторским правом

Хотите разбогатеть, поручив ИИ написать хит? Плохие новости. Бюро по авторским правам США (USCO) постановило, что работы, созданные ИИ, не подлежат защите авторским правом. Вы не заработаете на этом ни копейки.

Вопрос о принадлежности произведений, созданных ИИ, и распределении доходов обсуждается с момента появления технологии. Многие думали: «Я запустил программу, ввёл запрос — значит, результат мой». USCO разъяснило: нет, владеть результатом работы ИИ нельзя, даже если вы управляли процессом.

Что это означает для музыкальной индустрии?

Удар по платформам генеративной музыки. Это плохая новость для сервисов, таких как Suno, нацеленных на вытеснение музыкантов с помощью ИИ. Создавать песни с помощью ИИ можно, но они останутся безымянными копиями без возможности монетизации.

Хорошие новости для разработчиков инструментов на базе ИИ. Разрешено использовать ИИ для улучшения и синтеза звука, восстановления записей и других вспомогательных функций. Произведения, созданные с их помощью, могут принадлежать автору. Инновации в музыкальной индустрии, где всегда ценились новые инструменты (электрогитара, синтезаторы, семплеры, DAW и т. д.) по-прежнему важны.

Победа для музыкантов и художников. Оригинальные произведения остаются под защитой. Опасения, что ИИ наводнит рынок и обесценит человеческий труд, не оправдались. Роль автора по-прежнему важна.

Где грань между инструментом и «подделкой»?

USCO подчёркивает: закон об авторском праве адаптируется к новым технологиям. В каждом случае будет оцениваться человеческий вклад. Работы, созданные с помощью ИИ, могут быть защищены авторским правом (полностью или частично), если ИИ использовался как инструмент, а человек определял выразительные элементы. Одних запросов недостаточно.

Это постановление — важная веха в развитии музыкального ИИ. Но как скоро кто-то попытается обойти правила? Бюро обещает следить за ситуацией и при необходимости пересматривать свой подход.

Музыкальный ИИ

31 Jan, 13:49


По поводу использования сервиса Riffusion в коммерческих целях. Нашел вот в условиях сервиса.

Сервис пока предназначен для личного и некоммерческого использования.

С другой стороны сервис пишет, что они не будут клеймить права на ваш контент и получающиеся генерации.

Музыкальный ИИ

26 Jan, 15:20


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 20 по 26 января. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 Крупные технологические компании (OpenAI, Google, Microsoft, Amazon, Apple, Spotify) эксплуатируют творцов, используя генеративный ИИ для получения прибыли без компенсации за использование материалов, защищённых авторским правом. Это происходит под предлогом инноваций и конкуренции с Китаем, при этом игнорируются права авторов, а DeepSeek показала неэффективность американских инвестиций в ИИ. Виржини Бергер в статье для Forbes призывает к противодействию этой практике и защите творческой индустрии.

📰 Глава Universal Music Group (UMG) Франк Бригманн призвал к усилению защиты авторских прав в связи с развитием ИИ, выступив на Всемирном экономическом форуме в Давосе. Он подчеркнул необходимость сильного законодательства, защищающего права авторов от неправомерного использования их работ ИИ-системами, отстаивая позицию UMG, активно сотрудничающей с компаниями, такими как Roland, KLAY Vision Inc., SoundLabs и ProRata.ai, в разработке этичных моделей генерации контента.

📰 ByteDance, материнская компания TikTok, планирует инвестировать $12 млрд в чипы для ИИ в 2025 году, расширяя свои возможности в этой сфере на фоне неопределённости с TikTok в США и геополитической напряжённости. Инвестиции включают $5,5 млрд на закупки в Китае (удваивая прошлогодние расходы) и $6,8 млрд на международную экспансию, преимущественно закупая чипы у Nvidia. Конкуренция с Baidu, Alibaba и Tencent, а также торговые войны между США и Китаем, влияют на стратегию ByteDance.

📰 YuJa, Inc. выпустила AI-Generated Enhanced Audio Descriptions — функцию, автоматически создающую подробные аудиоописания видео, повышая их доступность для людей с нарушениями зрения и помогая организациям соответствовать требованиям ADA. Разработанная Нэйтаном Аророй и командой YuJa, функция интегрирована в пакет Gen AI Video PowerPack и предлагает автоматическое создание описаний и интерактивное редактирование.

📰 На конференции Music Ally Connect обсуждались ключевые проблемы лицензирования музыки в эпоху ИИ. Гади Орон (CISAC) и участники панельной дискуссии (Крис Хортон — UMG, Мэтт Аделл — Musical AI, Жульен Дюмон — Sacem, Виржини Берже — MatchTune) обсудили сложности лицензирования данных для обучения ИИ-моделей и монетизации генерируемого ИИ контента, признав иллюзорность «права на отказ» из-за невозможности полного удаления копий.

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

24 Jan, 18:02


Roli делает ставку на музыкальное образование с новой клавиатурой и ИИ-помощником

Компания Roli, известная своими инновационными MIDI-клавиатурами, представила на выставке NAAM новый продукт — Roli Piano. Эта 49-клавишная клавиатура, основанная на моделях Airwave и Piano M, нацелена на обучение игре на фортепиано с помощью генеративного ИИ.

Roli Piano сохраняет ключевые особенности предыдущих моделей, такие как подсвечиваемые клавиши, синхронизирующиеся с обучающим приложением. Как и Airwave, новинка поддерживает отслеживание движений рук.

Главное новшество — интеграция Piano AI Assistant. Этот ИИ-помощник призван сделать обучение более интуитивным и увлекательным, дополняя практику элементами музыкальной теории.

Roli Piano стоит 599 долларов, что значительно дороже Piano M (249 долларов). Однако по акции раннего бронирования, клавиатуру можно приобрести за 399 долларов.

Релиз Roli Piano и Piano AI Assistant — логичный шаг для компании, которая пережила банкротство в 2021 году. Roli переориентируется на рынок музыкального образования, оставляя позади нишевые продукты, такие как Seaboard и Blocks.

Музыкальный ИИ

19 Jan, 17:29


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 13 по 19 января. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 Специалисты Google придумали новый способ создавать объёмный звук из монозаписи. Они назвали его ZeroBAS. Для этого нужно знать, где находится источник звука. ZeroBAS как бы «раздвигает» звук на два канала, имитируя то, как наши уши слышат звуки с разных сторон. Получается реалистично, почти как настоящая бинауральная запись, но без сложного и дорогого обучения нейросетей. Это открывает новые возможности для игр, виртуальной реальности и других технологий, где важно, чтобы звук был объёмным.

📰 Соглашение Anthropic с музыкальными издателями даёт временную передышку, предотвращая судебный запрет на использование ИИ Claude. Anthropic внедрила «защитные механизмы», которые, как утверждается, предотвращают выдачу текстов песен ИИ, удовлетворяя таким образом одно из требований издателей. Однако соглашение не решает основной вопрос об использовании защищённой авторским правом музыки для обучения ИИ. Этот вопрос остаётся предметом судебного разбирательства и будущих переговоров. Кроме того, природа «защитных механизмов» не разглашается, что препятствует публичному обсуждению и оценке этих мер.

📰 RoEx, платформа ИИ-микширования и мастеринга, теперь интегрирована с Ableton Live. Пользователи могут загружать стемы, получать рекомендации от ИИ по миксу и скачивать проект Ableton с уже настроенными параметрами (эквалайзер, компрессия и т. д.) через стандартные плагины. Генеральный директор RoEx Дэвид Ронан назвал это важным шагом к демократизации профессионального продакшена. Подписка стоит £14.99 в месяц, есть бесплатный пробный период.

📰 Suno запустила функцию «Рабочие пространства» для организации музыкальных каталогов. Новая функция платформы для создания музыки на основе ИИ позволяет создавать, курировать и упорядочивать песни и ремиксы, переименовывать каталоги для быстрого доступа, а также автоматически сохранять оригинальные треки и ремиксы вместе.

📰 AeroBand и Rokid представили на CES 2025 революционное сочетание музыки и дополненной реальности. Интерактивная гитара и барабаны PocketDrum от AeroBand совместно с AR-очками Rokid AR Spatial создают иммерсивный опыт обучения и исполнения музыки, проецируя аккорды, ритмы и визуальные эффекты в реальном времени. Это позволит музыкантам любого уровня быстрее учиться, эффективнее практиковаться и выступать с захватывающими AR-эффектами.

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

13 Jan, 19:26


Теперь при отгрузке музыки на Symphonic необходимо будет указывать использовались ли инструменты ИИ при создании музыки и обложки.

Нововведение будет с 10 Февраля. Как говорят это нужно для прозрачности.

Первые ласточки полетели.

Уже отгружаете ИИ треки?

Музыкальный ИИ

12 Jan, 12:48


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 6 по 12 января. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 Соучредитель Canva, Кэмерон Адамс, прогнозирует значительное влияние ИИ в 2025 году, включая победу музыканта с ИИ на Грэмми. По его мнению, ИИ будет способствовать появлению новых профессий, трансформации образования и лидерства, а также станет ключевым фактором в устойчивом развитии. В статье также упоминается Supernatural AI как агентство, использующее ИИ, и опрос PwC, подтверждающий пользу ИИ в принятии решений.

📰 Google тестирует Daily Listen — функцию, создающую персонализированные подкасты на основе ленты Discover. Компания, по словам Айши Малик из TechCrunch, использует ИИ для подбора новостей по интересам пользователя, предоставляя краткий аудиообзор с текстовой расшифровкой и ссылками на связанные статьи.

📰 Реюэл Уильямс из Cai Creative, Inc. видит будущее музыки в интеграции ИИ, раскрывая новые творческие горизонты. Его компания разрабатывает инструменты, трансформирующие музыкальную теорию, позволяя музыкантам использовать ИИ для создания уникальных композиций и расширения традиционных границ.

📰 Платформа Tunetu, основанная Алланом Нильсеном, позволяет инфлюенсерам и брендам создавать уникальную музыку с помощью ИИ, получая роялти. Tunetu сочетает ИИ с работой профессиональных продюсеров, делая музыку доступной, и помогает независимым артистам контролировать свои доходы, предлагая премиум-планы с полным сохранением роялти.

📰 Платформа Splice запускает ИИ-инструмент Create для создания кантри-музыки. Новый инструмент Splice Country позволит продюсерам, сонграйтерам и инструменталистам использовать аутентичные кантри-звуки в своих работах. В записи семплов участвовали Девин Мэлоун, Тревор Нилон и Кейт Л. Мэлоун.

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

05 Jan, 10:03


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 30 декабря по 5 января. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 В подкасте GeekWire Тодд Бишоп продемонстрировал возможности ИИ, используя винтажный синтезатор Boss DR-110 (Dr. Rhythm) для создания музыки. Бишоп объединил свою игру на гитаре с ИИ-сервисом Udio и ритмами Dr. Rhythm, показав, как ИИ может участвовать в творческом процессе, а не только генерировать готовый продукт.

📰 Гендиректор YouTube Нил Мохан объявил о масштабном внедрении ИИ на платформе, стремясь к дальнейшему росту и превращению пользователей в создателей контента. YouTube, приносящая Alphabet $50 млрд ежегодно, использует разработки Google DeepMind (Dream Screen, Dream Track, автоматический дубляж), инвестируя миллиарды в инфраструктуру ИИ.

📰 В 2024 году искусственный интеллект превзошёл человеческое творчество в музыкальной индустрии, выпустив больше треков, чем все музыканты вместе взятые. Компания Mubert, например, выпустила свыше 100 миллионов треков за полгода, демонстрируя взрывной рост рынка ИИ-музыки, оцениваемого в $2,9 млрд в январе 2024 года. Это вызвало опасения по поводу рабочих мест и авторских прав, так как слушатели, по большей части, не замечают разницы между человеческим и машинным творчеством.

📰 Исследователи из SUTD и NVIDIA представили TANGOFLUX, высокоэффективную модель преобразования текста в речь, превосходящую существующие решения по качеству и скорости генерации. TANGOFLUX использует инновационный подход Flow Matching и оптимизацию предпочтений (CRPO), обеспечивая точное соответствие генерируемого аудио текстовым запросам и демонстрируя высокую производительность даже на сложных сценариях.

📰 Компания Unsound выпускает сборник эссе «13 способов взглянуть на ИИ, искусство и музыку», куратором которого выступила композитор Дженнифер Уолш. В книгу вошли работы, исследующие влияние искусственного интеллекта на творчество, сборник будет представлен 16 января в лондонском ICA, а Дженнифер Уолш выступит с докладом, за которым последует обсуждение с Михалом Гуликом. В дополнение, Unsound предлагает эссе Machine Listening, рассматривающее 2024 год как переломный момент в автоматическом создании музыки.

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

04 Jan, 13:30


Компания Anthropic урегулировала спор с музыкальными издателями о нарушении авторских прав на тексты песен

Anthropic заключила соглашение, частично урегулировавшее иск о нарушении авторских прав. Иск был подан против создателей модели искусственного интеллекта Claude за распространение защищённых текстов песен.

Окружной судья США Эуми Ли утвердила соглашение в четверг. Anthropic обязалась применять существующие меры безопасности при обучении будущих моделей ИИ и разработать процедуру вмешательства издателей при подозрении на нарушение авторских прав.

В октябре 2023 года несколько крупных музыкальных издательств, включая Universal Music Group, ABKCO, Concord Music Group и Greg Nelson Music, подали иск против Anthropic. Они обвинили компанию в использовании текстов минимум 500 защищённых песен для обучения своей ИИ-системы. Согласно иску, при запросе текстов песен, таких как Halo Бейонсе, Uptown Funk Марка Ронсона и Moves like Jagger Maroon 5, чат-бот Claude выдавал ответы, содержащие значительную или полную часть текстов.

Хотя издатели признали, что платформы, подобные Genius, распространяют тексты онлайн, они подчеркнули, что эти платформы платят лицензионные сборы. В иске утверждалось, что Anthropic умышленно удаляла или изменяла информацию об авторских правах при использовании данных с этих сайтов для обучения ИИ.

Согласно соглашению, Anthropic сохранит уже внедрённые меры предосторожности, предотвращающие нарушение авторских прав. Эти меры будут применяться ко всем будущим ИИ-системам. Издатели и Anthropic будут добросовестно сотрудничать в решении случаев, когда эти меры окажутся неэффективными. Суд готов разрешить любые возникшие споры.

В заявлении для The Hollywood Reporter Anthropic отметила, что Claude не предназначен для нарушения авторских прав, и компания применяет многочисленные меры для предотвращения таких нарушений. Заключение соглашения соответствует этим приоритетам. Anthropic намерена доказать, что использование потенциально защищённого материала для обучения генеративных моделей ИИ соответствует принципам добросовестного использования в рамках действующего законодательства об авторском праве.

Издатели, подавшие первоначальный иск, запросили предварительный судебный запрет, чтобы запретить Anthropic использовать их защищённые тексты для обучения будущих моделей. Решение суда ожидается в ближайшие месяцы.

Музыкальный ИИ

29 Dec, 14:51


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 23 по 29 декабря. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 ИИ трансформирует индустрию медиа и развлечений, влияя на создание, доставку и потребление контента. Кэтлин Уолч из Forbes объяснила, как инструменты ИИ помогают создавать сценарии, редактировать видео, персонализировать рекомендации (Netflix, Spotify) и даже прогнозировать успех проектов. Это позволяет компаниям создавать более востребованный контент, эффективнее модерировать платформы и оптимизировать рекламные кампании.

📰 YouTube запустил функцию Dream Track для создания саундтреков с помощью ИИ в Shorts. Она позволяет некоторым пользователям в США генерировать музыку на основе запросов, выбирать стиль любимых исполнителей и создавать ремиксы для своих коротких видео. Акаш Пандей из NewsBytes описал, как пользоваться инструментом и отметил, что готовые треки нельзя скачать отдельно, а весь контент модерируется согласно правилам YouTube.

📰 Adobe и Северо-Западный университет представили Sketch2Sound — ИИ-инструмент, позволяющий создавать аудио, напевая и описывая звуки текстом. Анализируя громкость, тембр и высоту голоса, а также текстовые подсказки, Sketch2Sound генерирует звуковые эффекты и фоновую музыку, понимая контекст запроса (например, «атмосфера леса» + короткие звуки = пение птиц). Инструмент особенно полезен для фоли-артистов, которым больше не придётся использовать физические объекты для создания звуков.

📰 Анджела Скотт-Бриггс из TechBullion выделила ключевые тренды AV‑технологий на 2025 год. Расширенная реальность (XR), искусственный интеллект (ИИ), видео 8K, экологичность, гибридные мероприятия и иммерсивный звук — вот основные направления развития отрасли. Они обеспечат более захватывающий и персонализированный опыт, повысят эффективность и откроют новые возможности для бизнеса, как отмечает Megahertz Productions.

📰 Китен Друри из The Motley Fool сравнила акции Palantir и SoundHound AI, двух быстрорастущих компаний в сфере ИИ. Несмотря на впечатляющий рост в 2024 году (400% у Palantir и 900% у SoundHound AI), высокая оценка акций вызывает вопросы о целесообразности инвестиций. Хотя Palantir сейчас более прибыльна, SoundHound AI демонстрирует более высокие темпы роста выручки и потенциал для снижения мультипликаторов оценки в будущем.

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

26 Dec, 08:17


Как превратить песни в вирусные видео с помощью Muze Art

Музыкальные клипы и яркие визуальные эффекты — отличный способ продвижения песен. Однако их создание обычно занимает много времени и сил. Muze Art меняет эту ситуацию. Этот инструмент на базе ИИ призван упростить музыкальный маркетинг и творческое самовыражение артистов, брендов и других пользователей.

Вот как превратить песни в видео с помощью Muze Art:

Muze Art распознаёт песни разных жанров, разделяет музыку и текст, а затем создаёт вирусные видео, которые можно опубликовать в TikTok, YouTube и других соцсетях. Технология работы Muze Art довольно сложна, но сам процесс создания видео прост.

Шаг 1. Откройте сайт Muze Art и войдите. Новые пользователи могут нажать Start Trial или Try Free для бесплатного тестирования. Также можно оформить подписку на один из премиум-планов (от $49 в месяц).

Шаг 2. На панели инструментов выберите Create a Music Video.

Шаг 3. Загрузите нужный трек. Нажмите кнопку загрузки в центре экрана и выберите трек на своём устройстве.

Шаг 4. После загрузки можно обрезать трек с помощью специального инструмента, чтобы создать видео для короткого фрагмента. Если нужно видео для всей песни — оставьте трек как есть. Нажмите Upload Audio.

Шаг 5. Настройте видео. Задайте имя, выберите режим анимации (2D или 3D) и соотношение сторон. Ползунок Audio Reactivity регулирует движение камеры в такт музыке — чем выше значение, тем больше движения. Нажмите Next Step.

Шаг 6. Выберите художественный стиль. Можно использовать готовые стили (например, «Фотореализм», «Стимпанк», «Манга», «Яркий») или создать свой. Нажмите Next Step.

Шаг 7. Добавьте подсказки для ИИ, описав, что вы хотите видеть в видео. Введите текст в поле и настройте угол камеры в выпадающем меню слева. Чтобы добавить ещё сцены, нажмите Add more scene. Время каждой сцены можно установить автоматически (Automatic) или вручную (Manual). Нажмите Generate Video.

Примечание: На этом этапе можно добавить аватар. Нажмите Add an avatar и создайте свой аватар с помощью функции Create an avatar, загрузив свои фото. Чтобы использовать аватар в подсказках, введите {avatar} (например, «крупный план лица {avatar}»). Это необязательно — можно создавать видео и без аватара.

Шаг 8. Вы будете перенаправлены в папку Your projects в разделе Library. Дождитесь создания видео — это может занять некоторое время. Пока видео генерируется, можно использовать другие функции Muze Art, например, создавать аватары или изображения с помощью ИИ.

Музыкальный ИИ

22 Dec, 09:52


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 16 по 22 декабря. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 К. Брэндон Огбуну и Лупе Фиаско (Wired) считают, что музыка не только выживет, но и расцветёт в эпоху ИИ. Авторы рассматривают три сценария взаимодействия музыки и ИИ в 2025 году: полную капитуляцию, где ИИ создаёт музыку, а люди её курируют (как диджеи); гибридный подход, где артисты, подобно 50 Cent, используют ИИ для ремиксов и новых поджанров, таких как «робо-франкен-хип-хоп»; и, наконец, рост ценности оригинальной «аналоговой» музыки на фоне засилья контента, созданного ИИ.

📰 Судья Юми Ли частично отклонила иск музыкальных издательств (Concord, UMG) к Anthropic (разработчик чат-бота Claude) о нарушении авторских прав. Издательства утверждают, что Claude незаконно обучался на их текстах (включая пример мэшапа Элтона Джона и Sir Mix-a-Lot) и используется для получения прибыли, что нарушает их права. Судья разрешила издателям доработать иск, признав обоснованность обвинений в финансовой выгоде Anthropic. Генеральный директор Anthropic Дарио Амодеи настаивает на «добросовестном использовании» технологий ИИ.

📰 MEET48 запускает Mars Protocol — платформу для AI-идолов в экосистеме BNB Chain. Платформа, сочетающая технологии ИИ-агентов и мем-коины, позволит создавать виртуальных идолов, выпускать токены и генерировать разнообразный контент. Инструмент AIShowBox расширит творческие возможности пользователей, а участие в программе акселератора MVB от BNB Chain, Binance Labs и CMC Labs поможет проекту развиваться.

📰 Реформа авторского права в Великобритании, лоббируемая ИИ-компаниями, вызвала резкую критику со стороны творческой индустрии. Предлагаемая система opt-out позволит ИИ использовать любые произведения без лицензии, если автор явно не запретил это, что, по мнению критиков (Пол Маккартни, Эд Ньютон-Рекс, баронесса Кидрон, глава Getty Images Крейг Питерс, Disney, Fox, Universal Music), угрожает правам авторов и будущему креативных индустрий. Они предлагают вместо этого обязательное лицензирование, гарантирующее справедливую оплату труда.

📰 ИИ, возможно, исчерпал доступные онлайн музыкальные данные для обучения. По словам Ильи Суцкевера (экс-OpenAI), «пик данных» достигнут, и обучение ИИ, основанное на сборе информации из интернета (включая пиратский контент), скоро прекратится. Вместо LLM, воспроизводящих данные, будущее — за «агентным» ИИ, способным самостоятельно рассуждать и действовать, как отметил Суцкевер. Фэй-Фэй Ли (Стэнфорд) поддержала эту идею, подчеркнув важность «пространственного интеллекта» для развития ИИ. Споры о правомерности использования защищённой музыки для обучения, как в случае с Anthropic, продолжаются.

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

22 Dec, 06:18


Spotify и плейлисты, созданные ИИ: как музыканты оказались на обочине гонки за прибылью

Всё больше плейлистов на Spotify — это заказные «наполнители», на которые у музыкантов нет авторских прав. Некоторые из этих треков написаны искусственным интеллектом.

Влияние Spotify на музыкальный рынок часто критикуют. Сервис обвиняют в работе против интересов артистов. Низкие ставки за прослушивание — не единственная проблема. Программы вроде Production for Curated Playlists (PFC) манипулируют процессом создания, потребления и оплаты музыки.

Вредит ли Spotify артистам?

В статье для Harper's Лиз Пелли описала, как работает программа PFC. По её словам, музыкантов эксплуатируют, заставляя «штамповать фоновую музыку» для алгоритмических плейлистов. Джазовые и электронные музыканты, участвующие в PFC, создают треки по шаблонам, соответствующим популярным плейлистам. Пелли утверждает, что артисты получают единовременный гонорар, отказываясь от авторских прав. Всю прибыль с прослушиваний забирают Spotify и её партнёры.

Пелли описывает стратегию Spotify как максимизацию вовлечённости слушателей через алгоритмы и данные. Это создаёт дисбаланс: артисты — всего лишь винтики в машине по генерации прослушиваний и данных. Участники PFC часто пишут музыку в отрыве от своего видения, следуя трендам алгоритмов Spotify. Музыка становится товаром для алгоритмических плейлистов. Пелли назвала подход Spotify «заговором против музыкантов».

Заменят ли алгоритмы музыкантов?

По словам журналистки, следующий шаг — активное использование Spotify музыки, созданной ИИ. С помощью инструментов ИИ, способных писать музыку, похожую на человеческую, Spotify может полностью заменить артистов машинным контентом. Важно помнить: ИИ «учится» на работах реальных музыкантов.

Пелли считает, что бизнес-модель Spotify обесценивает музыку и угрожает музыкантам, концентрируя власть в руках корпораций. Пространство для художественной свободы и справедливой оплаты сужается. Контент, созданный ИИ, и программы вроде PFC или платного Discovery Mode предвещают антиутопическое будущее — будущее, где вклад реальных артистов минимален.

Музыкальный ИИ

19 Dec, 07:35


Пресс-релиз: «Mureka представляет новые функции для создания музыки с помощью технологий ИИ»

Mureka — платформа для создания музыки с помощью искусственного интеллекта — обновила свои функции. Теперь она предлагает комплексное решение с уникальным опытом для музыкантов.

Технологии искусственного интеллекта меняют всё — от создания мелодий до сведения. ИИ-платформы стали секретным оружием для создания фоновой музыки к коротким видео и поиска вдохновения.

Mureka решает именно эту задачу. Название Mureka — сочетание слов Music и Eureka. Оно символизирует способность уловить вдохновение и превратить его в качественную музыку с помощью ИИ.

Mureka использует собственную модель ИИ для быстрого создания оригинальной музыки. Вы можете настроить стиль, тональность и ритм. Сервис поможет создать песню для короткого видео, праздничный трек или даже дисс на друга. Платформа предлагает новые возможности для экспериментов со звуком: от выбора голоса до использования референсных аудио. Mureka подходит и для создания коммерческих треков.

Платформа удовлетворит потребности как меломанов, так и профессиональных продюсеров. По словам создателей, постоянно оптимизируемые модели ИИ позволяют Mureka оставаться на переднем крае технологий. Отличное сведение, запоминающиеся мелодии и продуманная структура песен делают Mureka незаменимым инструментом для создания музыки.

Ключевые особенности и улучшения сервиса

▫️ Качество вокала. Новая модель значительно улучшает чёткость вокала, устраняя искажения и приглушённость.
▫️ Качество сведения. Сведение стало более профессиональным, с улучшенной пространственной чёткостью и балансом громкости.
▫️ Мелодичность. Мелодии стали более захватывающими, цельными и гармоничными. Исправлены проблемы с разрозненностью мотивов и отсутствием тематической фокусировки.
▫️ Структура песни. Улучшена динамика и структура песен.

Mureka предлагает бесплатную пробную версию. Просто зарегистрируйтесь и начните создавать музыку. Если бесплатной версии недостаточно, подпишитесь на план Basic или Pro — менее 2 центов (2 рубля) за песню.

Музыкальный ИИ

16 Dec, 08:09


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях со 8 по 16 декабря. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.


📰 ИИ GigaChat от Сбера теперь генерирует музыку по текстовым запросам. Это позволяет создавать уникальный саундтрек для презентаций и соцсетей, открывая творческие возможности для всех, даже не профессионалов. GigaChat, представленный Сбером на AI Journey, предлагает широкий выбор жанров, стилей, вокалов и инструментов. Функция доступна во «ВКонтакте», скоро появится в «Телеграм», «Одноклассниках» и веб-версии.

📰 Компания Digikore Studios Limited запустила iMadeASong.com — первую в Индии платформу для создания персонализированной музыки с помощью ИИ. Платформа позволяет генерировать уникальные песни для различных событий, а управляющий директор Абхишек Мор видит в этом возможность расширения бизнеса и удовлетворения растущего спроса на индивидуальные подарки.

📰 В 2024 году YouTube внедрил 9 новых функций на базе ИИ, чтобы улучшить опыт пользователей и авторов. Эти функции, включая разговорный ИИ, краткие описания видео и чатов, генерацию музыки и фонов, а также инструменты для авторов, призваны сделать платформу более полезной, доступной и вдохновляющей.

📰 В статье от Musicradar Стюарт Адамс сравнил сведение треков с помощью ИИ (iZotope Neutron 5) и опытного звукорежиссёра. Тест показал, что пока человеческий подход к сведению остаётся более качественным и эмоциональным, хотя ИИ-инструменты, такие как Neutron 5, могут быть полезны для экономии времени и упрощения процесса. Музыкальные дорожки были предоставлены Telefunken Elektroakustik и Cambridge Music Technology.

📰 Издатели могут перевернуть рынок лицензирования музыки с ИИ на $42 млрд, получив большую долю доходов благодаря технологиям атрибуции. Бенджи Роджерс (Lark42) и Алана Бонилла (Hypebot) отмечают, что ИИ-платформы используют композиции, принадлежащие авторам и издателям, и те, в свою очередь, должны внедрять атрибуцию для контроля и монетизации своих прав, изменяя текущее распределение доходов с лейблами.

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

11 Dec, 13:36


Компания TikTok стремится к лидерству в сфере ИИ

ByteDance, материнская компания TikTok, нацелена стать лидером в области искусственного интеллекта. Несмотря на жёсткие санкции США против Китая, компания активно закупает процессоры Nvidia.

Расследование Financial Times показало, что ByteDance — крупнейший клиент Nvidia в Китае.

По данным издания, ни одна другая азиатская компания не приобретает столько чипов у американского производителя. Однако ограничения Белого дома запрещают Nvidia продавать свои передовые продукты в Китай. Поэтому ByteDance использует H20s — процессоры для ИИ, специально ограниченные для китайского рынка.

Компания ищет пути обхода санкций, чтобы получить доступ к мощным чипам Nvidia H100 и Blackwell, открывающим передовые возможности ИИ.

ByteDance планирует расширять свои ИТ-мощности за пределами Китая, в частности, создавать дата-центры в Малайзии. Под руководством соучредителя Чжана Имина компания инвестирует миллиарды долларов в инфраструктуру ИИ.

Поворот к ИИ неслучаен. ByteDance столкнулась с замедлением роста TikTok и его китайского аналога Douyin после нескольких лет бурного развития. Кроме того, неопределённость вызывает возможный запрет TikTok в США. Новый закон требует продажи соцсети американской компании или её полного запрета.

ByteDance активно привлекает специалистов, переманивая лучших инженеров и исследователей ИИ из Alibaba и стартапов, таких как 01.ai и Zhipu.

ByteDance уже создала самое популярное приложение ИИ в Китае — чат-бот Doubao с 60 миллионами активных пользователей в месяц. Для сравнения: у Wenxiaoyan (разработка Baidu) — около 13 миллионов.

Но это только начало. Для разработки более сложных моделей ByteDance создаёт собственные ускорители ИИ, вдохновляясь Tensor Processing Unit от Google. Это позволит компании избавиться от зависимости от Nvidia как в обучении, так и в работе своих ИИ-систем.

Музыкальный ИИ

09 Dec, 14:13


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях со 2 по 8 декабря. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 Глава Google Сундар Пичаи прогнозирует, что создатели контента скоро будут получать деньги за вклад в развитие ИИ. Выступая на саммите DealBook, Пичаи заявил о появлении рынка, где создатели будут работать на ИИ-модели, такие как Gemini от Google, получая компенсацию за использование своего контента, который уже лицензируется Google у Reddit, Associated Press и The New York Times. Он также отметил важность баланса между добросовестным использованием и защитой интеллектуальной собственности, предвидя вмешательство Конгресса и Верховного суда. В отличие от оптимистичного прогноза Сэма Альтмана (OpenAI) о бурном росте ИИ, Пичаи ожидает замедления прогресса и необходимости более глубоких прорывов в будущем.

📰 Audiio представляет Hans AI — инструмент поиска музыки на основе ИИ. Просто опишите нужную сцену, и Hans AI подберёт подходящие бесплатные треки из обширной библиотеки Audiio. Сервис предлагает разные варианты лицензирования, включая Creator и Pro, и доступен в более чем 180 странах.

📰 UMG активно работает с ИИ, заключая лицензионные соглашения, участвуя в судебных разбирательствах и лоббируя свои интересы. Крис Хортон, старший вице-президент UMG, рассказал Music Ally о важности этичного обучения ИИ на лицензированном контенте и о том, как компания работает с артистами, чтобы внедрить ИИ с пользой для всех. Он уверен, что сотрудничество с музыкальной индустрией — ключ к успеху ИИ-компаний.

📰 Исследователи Sony представили SoniDo — новую фундаментальную модель для обработки музыки. Эта модель улучшает результаты в задачах тегирования, транскрипции, разделения источников и микширования. SoniDo, вдохновлённая Jukebox, использует HQ-VAE для управления детализацией и демонстрирует потенциал для создания более эффективных инструментов музыкального производства.

📰 ElevenLabs, стартап по клонированию голосов с помощью ИИ, заключил сделку с Bertelsmann (материнской компанией BMG) о создании музыки с помощью искусственного интеллекта. Компания, известная работой с голосом Джерри Гарсиа, расширяет применение своих технологий за пределы клонирования голосов и планирует разработать инструменты для генерации музыки, которые будут использоваться подразделениями Bertelsmann, включая, возможно, RTL Technology (дублировавшей шоу «Мифы и монстры» с помощью ИИ-голосов) и саму BMG.

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

29 Nov, 10:57


Ищу себе в команду Marketing Lead специалиста для продвижения артистов и рекорд лейбла на международном рынке. Буду признателен за репост 😊

https://hh.ru/vacancy/112154558?hhtmFrom=vacancy_edit

Музыкальный ИИ

24 Nov, 05:01


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 18 по 24 ноября. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 Комиссия Саудовской Аравии по музыке запустила MusicAI — глобальную онлайн-платформу для обучения музыке. MusicAI предлагает интерактивные программы обучения игре на различных инструментах, курсы музыкального продюсирования и доступ к экспертам, способствуя развитию музыкальной культуры и талантов в рамках Vision 2030.

📰 Студенты МФТИ создали сервис Audio2MIDI, преобразующий аудио в ноты с помощью ИИ. Дмитрий Протасов, автор проекта и победитель конкурса фонда «Содействие инновациям», разработал телеграм-бота, генерирующего нотные партитуры, упрощая создание аранжировок и обучение музыкальных ИИ-моделей. Сервис бесплатен и перспективен для музыкальных платформ, магазинов и юриспруденции в вопросах авторского права.

📰 Google заморозила проект Orca — ИИ для создания музыки, способный имитировать известных исполнителей. Проект DeepMind и YouTube был свёрнут из-за потенциальных проблем с авторским правом, после того как музыкальные лейблы отказались от предложенной Google схемы распределения доходов. Хотя Orca позволяла генерировать музыку, задавая лишь исполнителя, жанр и текст, юридические риски оказались слишком высоки.

📰 Spotify разрешит размещение музыки, созданной ИИ, но сама создавать её не будет. В подкасте Big Technology Густав Сёдерстрём, сопрезидент и директор по продуктам и технологиям Spotify, заявил, что ИИ — это инструмент для творчества, и платформа поддержит музыкантов, использующих его легально. Однако Spotify не планирует генерировать музыку самостоятельно, предпочитая оставаться платформой для творцов, а не источником дешёвого контента. Также стало известно, что гендиректор Даниэль Эк и сооснователь Мартин Лорентзон продали акции компании на миллионы долларов.

📰 UMG, Roland, SoundCloud, NAMM и другие поддержали принципы этичного создания музыки с помощью ИИ. Эти принципы подчёркивают важность человеческого творчества, защиты авторских прав и прозрачности при использовании ИИ в музыке, но не предлагают конкретных механизмов контроля. Брюс Хоутон, редактор Hypebot, освещает эту инициативу.

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

23 Nov, 08:53


В стриминге Звук теперь можно генерировать персонализированные плейлисты. Называется фича ГигаМикс.

В целом с запросом «спокойная электронная музыка для работы» справился нормально.

В плейлист добавляет 20 треков (хотелось бы побольше). Добавить треки можно вручную или по рекомендациям, но они пока еще далеки от идеала.

По мне генеративные плейлисты это еще один шаг к уменьшению влияния музыкальной редакции (ну видимо и лейблов и других посредников). Но роль питчинга еще больше возрастает, так как мы даем больше информации о нашем треке стримингу. Хорошо, что питчинг можно делать напрямую без посредников. У Звука это делается через приложение Звук СТУДИО.

Музыкальный ИИ

20 Nov, 15:44


ИИ в A&R: как искусственный интеллект меняет поиск и развитие артистов

Саммари статьи Анны Хадсон, студентки Berklee College of Music.

Искусственный интеллект продолжает менять музыкальную индустрию. В этой статье Анна рассмотрела, как ИИ трансформирует поиск и развитие артистов (A&R), делая процесс более эффективным. Разберём три компании, которые используют ИИ в A&R.

Instrumental: поиск талантов с помощью анализа данных

Instrumental, основанная в 2014 году, использует ИИ для анализа данных из стриминговых сервисов и социальных сетей. Алгоритм Instrumental способен находить перспективных артистов на ранних этапах, предсказывая их успех. Среди артистов, которых Instrumental отметила задолго до их популярности, — Lil Nas X, Tones and I и Arizona Zervas.

Instrumental предлагает лейблам и A&R-менеджерам ряд инструментов: сопоставление артистов с микрожанрами, управление списками наблюдения за перспективными музыкантами, а также автоматические оповещения о росте популярности артистов в интернете.

В 2020 году, после инвестиций Tencent, Instrumental запустила собственную платформу FRTYFYVE для развития артистов. FRTYFYVE использует ИИ для поиска талантов и построения их карьеры, фокусируясь на анализе данных и взаимодействии с фанатами.

Musiio by SoundCloud: анализ аудио для предсказания хитов

Musiio, основанная в 2018 году, использует ИИ для анализа аудиофайлов и предсказания успеха песен. Технология Musiio «прослушивает» треки, определяя их потенциал. Это позволяет находить хиты даже среди малоизвестных исполнителей.

Musiio by SoundCloud предлагает сервисы тегирования и поиска музыки на основе аудио. Эти технологии автоматизируют работу с музыкальными библиотеками, что особенно полезно для стриминговых сервисов и компаний, занимающихся синхронизацией музыки. В 2022 году Musiio была приобретена SoundCloud для анализа и управления их огромным музыкальным каталогом.

Sodatone (WMG): ИИ для A&R-менеджеров

Sodatone, принадлежащая Warner Music Group, использует ИИ для поиска, оценки и развития артистов. Платформа анализирует данные из разных источников и предоставляет A&R-менеджерам информацию о потенциале музыкантов.

Sodatone помогает оптимизировать рабочий процесс A&R, перенося фокус с поиска на развитие артистов. Приложение доступно только для лейблов и партнёров WMG. Среди артистов, открытых с помощью Sodatone, — PinkPantheress.

Выводы:

ИИ трансформирует индустрию A&R, предоставляя новые инструменты для поиска, оценки и развития артистов. Технологии ИИ автоматизируют рутинные задачи, позволяя A&R-менеджерам сосредоточиться на творчестве и стратегии. Примеры Instrumental, Musiio и Sodatone демонстрируют потенциал ИИ в A&R. Искусственный интеллект становится неотъемлемой частью музыкального бизнеса.

Музыкальный ИИ

15 Nov, 05:00


Spotify делает ставку на ИИ и инновации, а не на «супер-премиум»

Spotify, похоже, ставит под сомнение ажиотаж вокруг «супер-премиум»* предложений, делая ставку на искусственный интеллект и инновации как на движущую силу будущего своего бизнеса.

Несмотря на исторический максимум цены акций и стабильный рост, генеральный директор Spotify Даниэл Эк в разговоре с аналитиками продемонстрировал не слишком большой энтузиазм в отношении «супер-премиум» предложения. Он подчеркнул, что компания будет фокусироваться на том, что «нравится потребителям» и «приносит ценность создателям контента».

Ключевые приоритеты Spotify:

▫️ ИИ-DJ и музыкальные видео. Эк отметил, что эти технологии показывают «потрясающие результаты», особенно в плане вовлечённости и удержания пользователей.
▫️ Новое поколение технологий. Spotify стремится к «трансформационным сдвигам» в открытии музыки и «инновационным способам» связать артистов с поклонниками.
▫️ Инвестиции в новые направления. Компания расширяет свой бизнес, улучшая платформу и предлагая новую ценность для пользователей, включая аудиокниги.

Эк также заявил, что Spotify лучше всего справляется с задачей, когда «предлагает своим клиентам отличные инновации».

Посыл ясен: Spotify больше не зависит от «супер-премиум» предложений, которые предлагали лейблы. Теперь Spotify фокусируется на том, что хотят клиенты и что делает их платформу успешной.

В чём смысл такой позиции Spotify?

Позиция Spotify — это чёткий сигнал музыкальной индустрии, особенно Universal Music, о том, что компания стала независимой. У Spotify есть свой путь, основанный на стремлении обеспечить лучший пользовательский опыт и найти новые точки роста с помощью ИИ и других инноваций.

ИИ-технологии — это, возможно, новые правила игры для Spotify. Компания активно вкладывает в них и считает их ключом к будущему музыкального стриминга.

Важно отметить, что музыкальная индустрия всё ещё находится в процессе определения своего места в мире ИИ. И как именно это новое поколение технологий повлияет на права артистов и их заработок, пока непонятно. Но одно уже ясно: Spotify не боится идти своим путём, и именно это может стать залогом её успеха в будущем.

* «Супер-премиум» — это предлагаемый лейблами новый уровень музыкального стриминга, который будет включать в себя эксклюзивный контент, уникальные функции, и, вероятно, более высокую цену.

Музыкальный ИИ

14 Nov, 17:45


Ребят, накидайте в комментарии каналы по ИИ тематике, которые вы читаете 📦

Музыкальный ИИ

14 Nov, 09:49


Как политика Дональда Трампа в отношении ИИ может перестроить музыкальную индустрию

Саммари статьи Виржинии Берже в Forbes. Эксперт освещает вопросы музыкальных инноваций, искусственного интеллекта и правовые аспекты.

Возвращение Дональда Трампа к власти и его курс на дерегулирование могут сильно изменить музыкальную индустрию, особенно в области искусственного интеллекта.

Трамп известен своей политикой, ориентированной на свободу бизнеса, и его позиция по отношению к ИИ может привести к ослаблению защиты авторских прав и лицензирования.

Риски для музыкальной индустрии

▫️ Неограниченное использование данных для обучения ИИ. Трамп обещал отменить «Билль о правах ИИ», который был принят при Байдене и устанавливает правила для использования контента для обучения моделей ИИ. Это означает, что компании, разрабатывающие ИИ, могут свободно использовать музыкальные данные без разрешения авторов и выплат роялти.
▫️ Угроза для традиционной модели доходов. Ослабление защиты авторских прав может подрывать систему лицензирования и роялти, на которой построена музыкальная индустрия.
▫️ Снижение ценности оригинальной музыки. Музыка, созданная с помощью ИИ, может стать доступной и дешёвой, что снизит спрос на традиционную музыку, созданную человеком.
▫️ Потеря контроля над творческими активами. Без сильной защиты авторских прав, артисты рискуют потерять контроль над своим творчеством, а их произведения могут быть использованы ИИ-моделями без их ведома или согласия.

Возможности для музыкальной индустрии

▫️ Ускорение инноваций в сфере ИИ. Дeрeгулирование может способствовать развитию ИИ-инструментов, которые сделают музыкальное творчество доступным для всех.
▫️ Новые бизнес-модели. Ослабление контроля может стимулировать создание новых моделей монетизации музыки, таких как NFT и подписки на платформы ИИ.

Сравнение политики Трампа с ЕС

В то время как Трамп может продвигать дерегулирование в США, Европейский Союз, наоборот, готовит комплексный Закон об ИИ. В ЕС компании, использующие ИИ, должны будут получать разрешение от правообладателей и выплачивать компенсацию за использование их работ.

Союз Трампа и технологических гигантов


Трамп известен своей близостью к крупным технологическим компаниям, которые видят в ИИ большой потенциал. Их объединяет желание ослабить контроль над ИИ, чтобы стимулировать технологический прогресс, не задумываясь о последствиях для авторских прав.

Что делать музыкальной индустрии?

Музыкальной индустрии необходимо адаптироваться к новым реалиям и найти способы защитить себя. Вот несколько вариантов:

▫️ Сотрудничество с технологическими компаниями. Музыкальная индустрия может создавать совместные проекты с разработчиками ИИ, чтобы контролировать процесс обучения и получать прибыль от использования своих работ.
▫️ Развитие новых моделей лицензирования. Необходимо разработать новые модели лицензирования для ИИ-музыки, которые будут справедливы как для авторов, так и для разработчиков.
▫️ Создание уникальных продуктов. Музыкальная индустрия может сосредоточиться на создании музыки, которая не может быть скопирована или воспроизведена ИИ, например, живые выступления и авторские композиции.

Музыкальный ИИ

10 Nov, 16:33


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 4 по 10 ноября. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 Компания Suno опубликовала первые аудиодемонстрации новой модели генерации музыки v4, c улучшенным звуком, разнообразием и стабильностью. Выпуск модели происходит на фоне правовых разбирательств, с которыми сталкиваются Suno и её конкурент Udio, обвиняемые в обучении моделей на защищенной авторским правом музыке без разрешения.

📰 Суд отклонил иск новостных изданий Raw Story и AlterNet против OpenAI, обвинявших компанию в обучении ChatGPT на их статьях без разрешения. Судья посчитал, что издания не смогли доказать достаточный ущерб, но допустил возможность подачи нового иска, если они смогут обосновать реальный вред, нанесенный им.

📰 Нэшвиллская компания Humanable борется с угрозой генеративного ИИ для музыкальной индустрии, предлагая сертификацию музыки, созданной человеком. Humanable уже проверила более 86 000 песен и планирует подтвердить 5 миллионов в течение 30 дней. Платформа, получившая патент на изобретение, предоставляет музыкантам возможность гарантировать под присягой, что их песни не содержат элементов, сгенерированных искусственным интеллектом.

📰 Ирландская организация по авторским правам на музыку (IMRO) опубликовала манифест на всеобщих выборах 2024 года, в котором призывает к регулированию искусственного интеллекта, расширению культурных пространств и введению постоянной программы базового дохода для искусства. IMRO требует ужесточения контроля над ИИ, чтобы защитить авторские права и права создателей, а также предлагает увеличить финансирование ирландской музыкальной индустрии и создать национальную музыкальную стратегию.

📰 Немецкое общество по сбору авторских отчислений GEMA выпустило «Хартию ИИ», призванную защитить права творцов в эпоху искусственного интеллекта. Документ, разработанный генеральным директором GEMA Тобиасом Хольцмюллером, подчеркивает необходимость прозрачности и справедливого вознаграждения за использование музыки в обучении ИИ, а также призывает к диалогу между правообладателями и разработчиками.

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

07 Nov, 16:32


Paradise Worldwide: мост между музыкальным ИИ и авторским правом

Рынок генеративной музыки на базе ИИ стремительно растёт. По прогнозам, к 2028 году он достигнет 3 миллиардов долларов. Крупные игроки, такие как Universal Music Group, уже осваивают «этичный» ИИ, сотрудничая со стартапами и платформами.

Однако многие ИИ-компании сталкиваются с юридическими проблемами из-за нелицензированного использования музыки для обучения своих моделей. Судебные иски против Suno и Udio — яркий пример.

Берлинская компания Paradise Worldwide предлагает решение. Она стремится упростить лицензирование обучающих данных для ИИ, чтобы платформы генеративной музыки соответствовали законам об авторском праве. Компания верит, что это новый источник дохода для независимых музыкантов.

Модель All Rights: ключ к прозрачности и монетизации

Paradise Worldwide разработала модель All Rights для управления правами на записи и публикацию, собирая расширенные метаданные. Это основа проекта AIxchange для лицензирования данных обучения ИИ.

AIxchange предлагает два продукта:

▫️ Большая музыкальная модель: обученная на лицензированных данных.
▫️ Лицензированный набор данных: для легального обучения моделей ИИ.

Взгляд Paradise Worldwide на будущее ИИ-музыки:

▫️ Сотрудничество с CMO (Collective Management Organisations). Paradise Worldwide работает с организациями по сбору платежей, чтобы улучшить мониторинг использования музыки и распределение роялти.
▫️ MRT-сервисы. Компания работает с технологиями распознавания музыки для идентификации контента, используемого в генеративной музыке.
▫️ Лицензирование данных для обучения. Paradise Worldwide считает, что компании, занимающиеся ИИ, должны лицензировать данные для обучения и вести подробные записи об использовании музыки.
▫️ Справедливая компенсация артистам. Компания выступает за 50/50 разделение доходов между правообладателями записей и издателями.
▫️ Прозрачность данных. Paradise Worldwide призывает к полному набору метаданных (IPI, ISWC, доли авторов), чтобы CMO могли правильно распределять доходы.
▫️ Будущее генеративного ИИ. Компания видит рост использования ИИ музыкантами для творчества и совместной работы. Также она надеется, что индустрия поддержит лицензирование ИИ на основе одобрения правообладателей.

Paradise Worldwide стремится к легальному и этичному использованию ИИ в музыке, создавая новые возможности для артистов и разработчиков. Интервью с основателем и генеральным директором Ральфом Богемом, доступно на сайте Music Business Worldwide.

Музыкальный ИИ

06 Nov, 16:13


Suno запустила Personas: создание ИИ-артиста

Платформа для создания музыки с помощью искусственного интеллекта Suno запустила функцию Personas. Она доступна только для пользователей с планами Pro и Premier. Personas позволяет сохранять «сущность» песни — стиль и вокал — и повторно использовать её в других музыкальных произведениях.

Это даёт создателям возможность создавать каталог треков, которые звучат так, как будто их исполняет одна и та же группа музыкантов, а не просто случайный алгоритм ИИ. Вы даже можете дать своей персоне Suno имя и изображение, которые будут отображаться рядом с треком, словно персона — это исполнитель.

Как работает Personas в Suno

Чтобы создать Persona, перейдите к ранее созданному треку, нажмите на опцию «Создать», а затем выберите «Создать Persona». На этом этапе вы можете дать ей имя, добавить миниатюру для удобной идентификации и написать описание.

Вы также можете сделать Persona приватной или публичной. После сохранения настройки становятся доступны для любого нового трека.

Найджел Пауэлл из TomsGuide потратил несколько часов на тестирование новой функции и нашёл как положительные, так и средние стороны процесса. Положительной стороной стало то, как легко было использовать новую функцию после её создания.

Меню Personas появляется в боковой панели, вместе с выпадающим списком, в котором можно выбрать одну из заранее сохранённых Personas при настройке нового трека. Просто добавьте или создайте текст песни, и всё готово.

Зачем нужны Personas

Добавление персонажей решает серьёзную проблему с такими ИИ-сервисами музыки, как Suno и Udio, — очень сложно сделать так, чтобы два трека звучали, как будто их создал один и тот же артист.

Существуют несколько сложных обходных решений, но в итоге это всё равно остаётся делом случая из-за случайного характера генерации музыки ИИ.

Возможность создать и сохранить Persona меняет ситуацию. Теперь вы можете просто прикрепить её к процессу создания трека, и платформа сделает всё остальное.

К сожалению, результаты оказались неоднозначными. Они были хорошими для чётко определённых жанров, например, таких как регги, но менее удачными для более общих стилей. Скорее всего, трудно сделать яркий акцент на каждой возможной вариации рока или поп-музыки, к примеру.

Последовательность вокала между треками тоже была немного разочаровывающей. Примерно похожая вокальная чёткость сохраняется, если не присматриваться слишком пристально. Но невозможно создать, скажем, своего персонажа в стиле Бруно Марса и уверенно выпустить серию хитовых треков в этом стиле.

Однако общая концепция отличная, и она значительно улучшит всю сцену создания музыки с помощью ИИ, как только технология созреет. Просто потребуется некоторое время, чтобы устранить все недостатки. К счастью, новая функция Personas явно отмечена как Beta, так что, вероятно, стоит дать разработчикам немного поблажек и похвалить их за стремление к совершенству.

Музыкальный ИИ

04 Nov, 11:10


Hertz-Dev — открытая аудиомодель для разговорного ИИ в реальном времени

Разговорный ИИ — краеугольный камень технологий, но быстрое и эффективное взаимодействие в реальном времени остаётся сложной задачей. Задержка (интервал между вводом и ответом) ограничивает приложения вроде чат-ботов и виртуальных помощников, делая общение медленным. Существующие модели требуют больших вычислительных мощностей, делая ИИ недоступным для небольших команд и независимых разработчиков.

Standard Intelligence Lab выпустила Hertz-Dev — открытую 8,5-миллиардную аудиомодель для разговорного ИИ. Hertz-Dev нацелена на революцию в приложениях реального времени, демонстрируя впечатляющую производительность: задержка 80 мс теоретически и 120 мс — в реальности, на одной NVIDIA RTX 4090. Hertz-Dev делает передовой ИИ доступнее, предоставляя высокопроизводительное аудиомоделирование разработчикам и исследователям без сложной инфраструктуры, демократизируя разговорный ИИ.

Hertz-Dev выделяется скоростью и отзывчивостью — её 8,5 млрд параметров оптимизированы для минимальной задержки. Задержка в 80 мс теоретически и 120 мс на практике обеспечивает плавное общение с мгновенными ответами. Работая на видеокарте RTX 4090, модель использует новейшие технологии GPU без многопроцессорных конфигураций. Это делает Hertz-Dev доступной для независимых разработчиков, стартапов и крупных компаний, желающих оптимизировать затраты, сохраняя высокую производительность. Архитектура включает новые методы оптимизации, снижающие нагрузку и сохраняющие качество.

Значимость Hertz-Dev — не только в технических возможностях, но и в потенциале для более широкого применения разговорного ИИ в реальном времени. Обработка аудио в реальном времени применима в разных областях: от автоматизации поддержки клиентов до интерактивных ИИ-компаньонов и инструментов для людей с ограниченными возможностями. Задержка в 120 мс практически незаметна для человека, поэтому Hertz-Dev создаёт естественное взаимодействие, делая ИИ органичной частью общения. Тесты показывают стабильную производительность и сокращение времени отклика до 40% по сравнению с предыдущими открытыми моделями. Универсальность Hertz-Dev делает её подходящей для разных задач, включая автоматизацию обслуживания клиентов и «умный дом».

Выпуск Hertz-Dev от Standard Intelligence Lab — переломный момент для разговорного ИИ в реальном времени. С ростом числа разработчиков и исследователей, использующих Hertz-Dev, ожидается волна новых, более отзывчивых и доступных приложений разговорного ИИ, которые естественно интегрируются в повседневную жизнь, расширяя границы взаимодействия человека и ИИ.

Подробности — на GitHub и сайте.

Музыкальный ИИ

03 Nov, 16:10


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 28 октября по 3 ноября. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 Музыкальный ИИ-стартап Hook заключил соглашение с лейблом Glassnote Records о добавлении треков в свою библиотеку. Платформа Hook, основанная Гауравом Шарма, позволяет создавать ремиксы и мэшапы, соблюдая авторские права, а сделка с Glassnote, возглавляемым Дэниелом Глассом, — это первый шаг к легальному использованию музыки в соцсетях.

📰 Aimi запускает веб-приложение Aimi Sync для упрощённого создания видео с использованием AI-музыки. Приложение позволяет редактировать музыку, озвучку, звуковые эффекты и видео, используя библиотеку бесплатной музыки Aimi, что, по словам генерального директора Эдварда Балассаняна, отвечает растущему спросу на быстрый и дешёвый видеоконтент.

📰 ASCAP и Sacem объявили о расширении стратегического партнёрства, включающего создание рабочей группы по ИИ. Организации коллективного управления авторскими правами будут совместно использовать технологии, расширять цифровое лицензирование в Азии, а также обучать участников работе с ИИ и отстаивать их интересы в этой сфере. Генеральные директора Элизабет Мэтьюз (ASCAP) и Сесиль Рап-Вебер (Sacem) подчеркнули важность инноваций и защиты авторских прав в условиях трансформации музыкальной индустрии.

📰 UNIFI Music, компания Ла'Шиона Робинсона, разрабатывает ИИ-платформу Sasha для управления музыкальной карьерой, чтобы помочь начинающим артистам преодолеть трудности с поиском менеджеров. Sasha, работающая по модели SaaS, интегрирована с платформой UNIFI — аналогом LinkedIn для музыкантов, — что позволяет налаживать связи с профессионалами индустрии. Sasha предлагает персонализированные рекомендации, автоматизацию рутинных задач и поддержку в стратегическом и тактическом планировании карьеры.

📰 Генеральный директор Dropbox Дрю Хьюстон считает, что успешными в эпоху искусственного интеллекта будут люди, обладающие экспертизой в сфере ИИ и глубокими знаниями в других областях, например, в музыке, здравоохранении или археологии. Dropbox запустил Dash for Business, инструмент на основе искусственного интеллекта, призванный повысить эффективность управления контентом, и, по мнению Хьюстона, именно сочетание ИИ со специализацией станет ключом к успеху в будущем.

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

27 Oct, 17:05


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 21 по 27 октября. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 Google DeepMind обновила свои инструменты для создания музыки на базе ИИ, включая MusicFX DJ, Music AI Sandbox и YouTube Dream Track. Обновления включают в себя новый дизайн, улучшенный функционал и передовые генеративные модели, позволяющие пользователям легко создавать музыку с помощью текстовых подсказок, импровизировать в режиме реального времени и получать «бесконечно удивительные результаты», как выразился многократный обладатель «Грэмми» Джейкоб Коллиер, участвовавший в разработке.

📰 Тысячи музыкантов, включая участников ABBA и Radiohead, а также крупные лейблы (Universal, Sony, Warner) выступили против использования их работ для обучения ИИ без лицензии. Инициатором кампании стал композитор Эд Ньютон-Рекс, обеспокоенный практикой компаний, подобных Stability AI, использовать чужое творчество без разрешения правообладателей.

📰 Рождественский хит Бренды Ли Rockin' Around the Christmas Tree получил новую жизнь благодаря искусственному интеллекту и зазвучал по-испански. Новая версия, Noche Buena Y Navidad, была создана путём перевода текста с помощью ИИ-технологии SoundLabs AI и наложения голоса Ли на исполнение чилийской певицы Лейлы Хойл. Проект реализован в рамках сотрудничества SoundLabs и Universal Music Group, продюсером выступил Ауэро Бакейро.

📰 Легендарный композитор Ханс Циммер, автор музыки к фильмам «Интерстеллар», «Дюна» и «Король Лев», не верит в способность искусственного интеллекта создавать музыку, наполненную настоящими эмоциями. Циммер считает, что ИИ пока лишь копирует звучание прошлого, и приводит в пример попытку режиссёра Гарета Эдвардса использовать для фильма «Создатель» саундтрек, сгенерированный в стиле самого Циммера. Несмотря на скептицизм, композитор видит в ИИ потенциал для развития музыкальных инноваций в будущем.

📰 Дэниел Абоуд, президент и главный юрисконсульт музыкального издательства Royalty Network, в интервью изданию TechBullion рассказал об успехе компании на рынке и своём видении будущего музыкальной индустрии в эпоху ИИ. По мнению Абоуда, искусственный интеллект открывает перед музыкантами новые возможности, но также несёт в себе риски, связанные, например, с нарушением авторских прав. Эксперт считает, что издательствам важно использовать технологии, но при этом сохранять клиентоориентированный подход и заботиться о своих авторах, обучая их и помогая им ориентироваться в сложностях музыкального бизнеса.

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

25 Oct, 09:25


HarmonyCloak незаметно добавляет «яд» в музыку, чтобы запутать ИИ

ИИ-системам, генерирующим контент, нужны огромные объёмы данных для обучения, и часто это материалы, защищённые авторским правом. Исследователи из Университета Теннесси в Ноксвилле и Университета Лихай разработали инструмент, который поможет музыкантам защитить свои работы. HarmonyCloak добавляет в музыку особый шум, неслышимый для человека, но мешающий ИИ её скопировать.

Этот шум динамически подстраивается под характеристики музыки, оставаясь незаметным для человеческого уха. Но ИИ не может понять, какие элементы нужно игнорировать, и его попытки скопировать музыку проваливаются.

Авторы смогут защищать свои треки перед публикацией на сайтах или в стриминговых сервисах, где их может найти ИИ. Аналогичные инструменты уже используются для изображений.

Пример в прикреплённом видео. Оба аудиофрагмента сгенерированы моделью MusicLM по запросу «создать инди-рок трек» и обучены на одинаковой музыке. Разница в том, что один источник — чистый, а второй обработан HarmonyCloak.

Обученный на чистой музыке ИИ создаёт неплохой, но бездушный трек, который подошёл бы для рекламы автострахования компании, экономящей на музыкантах.

Совсем иначе звучит трек, созданный ИИ, обученным на музыке, обработанной HarmonyCloak. Это какофония случайных звуков, которую неприятно слушать. Кажется, будто по клавишам прыгает трёхлапая кошка.

У HarmonyCloak два режима работы. Можно настроить шум под конкретную модель ИИ, чтобы получить лучший результат, сохраняющийся даже после обработки трека (например, сжатия в MP3). Или же можно создать шум, влияющий на множество моделей, чтобы защитить произведение от любого ИИ, даже ещё не созданного.

Обычно такие меры защиты вызывают гонку вооружений: ИИ адаптируется и обходит их. Но разработчики утверждают, что HarmonyCloak работает по-разному с каждой песней, поэтому ИИ нужно знать параметры, использованные для конкретного трека, чтобы его взломать. Это возможно, но сделать это массово будет трудно.

HarmonyCloak и подобные инструменты могут помочь артистам продержаться до тех пор, пока ИИ либо не уничтожит ценность человеческого творчества, либо не захлебнётся в собственных копиях — смотря что произойдёт раньше.

Исследователи представят свою работу на Симпозиуме IEEE по безопасности и конфиденциальности в мае 2025 года.

Музыкальный ИИ

24 Oct, 15:58


ElevenLabs представляет Voice Design: новую функцию ИИ, генерирующую уникальный голос из текстового описания

На рынке генераторов голоса с помощью ИИ множество инструментов предлагают практически идентичные функции. В этой области не было громких инноваций, пока ElevenLabs не представила Voice Design. С её помощью любой желающий может создать уникальный голос, опираясь на простое текстовое описание.

У ElevenLabs уже есть библиотека из более чем 3000 высококачественных голосов, но иногда сложно найти именно тот, что нужен. Теперь вы можете описать возраст, акцент, тон и даже характер, чтобы сгенерировать новый, максимально точный голос всего за несколько секунд. Новая функция очень проста в использовании, а API, по заявлению ElevenLabs, будет доступен уже через неделю.

Как пользоваться Voice Design от ElevenLabs:

Шаг 1: Начало работы

Чтобы начать работу с новой функцией, перейдите на сайт ElevenLabs по ссылке и нажмите Design Voice Free. Вы попадёте на страницу регистрации, где сможете войти с помощью учётной записи Gmail. ElevenLabs работает в России только с VPN.

Шаг 2: Знакомство с Voice Design

Функция Voice Design может быть не сразу заметна, поскольку она не отображается на боковой панели. Сначала перейдите в раздел Voices, а затем нажмите Add a new voice. Новая функция Voice Design будет расположена в самом верху.

Шаг 3: Создание собственного голоса с помощью ИИ

Нажав на Voice Design, вы сможете ввести текстовое описание желаемого голоса. Ниже введите текст, который должен произнести ваш персонаж. После добавления описания и текста нажмите кнопку Generate voice.

Шаг 4: Завершение

ElevenLabs сгенерирует голос и предложит на выбор три варианта. Выберите тот, что вам больше всего подходит. Присвойте ему имя, метку, значение и добавьте описание по своему усмотрению. Сохраните созданный голос. Он появится в вашем личном разделе Voices.

Музыкальный ИИ

20 Oct, 11:50


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 14 по 20 октября. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 Введение обязательной маркировки аудио, сгенерированного искусственным интеллектом — не панацея от мошенничества и дезинформации. Хотя аудиоводяные знаки могут помочь идентифицировать такой контент, злоумышленники способны их удалять, а пользователи не всегда могут проверить подлинность аудио, как в случае с голосовым фишингом от имени родственников или политическими робозвонками, подобными тем, что использовались от имени Джо Байдена. Автор Center for Data Innovation считает, что необходимы более комплексные меры, включающие в себя не только технические решения, но и повышение осведомлённости о рисках использования дипфейков.

📰 Крис Моррис из журнала Fast Company протестировал новое расширение для Chrome от компании Hiya, призванное выявлять дипфейки с искусственно сгенерированными голосами, и обнаружил, что его эффективность неоднозначна. Инструмент Hiya Deepfake Voice Detector использует ИИ для анализа аудио и утверждает, что может определять подделки с точностью 99%. Однако тесты показали, что его точность варьируется.

📰 Приложение Hook появилось в AppStore. Оно позволяет пользователям легально создавать ремиксы на популярные песни и делиться ими в социальных сетях, выплачивая компенсацию правообладателям. Приложение использует искусственный интеллект для создания мэшапов, применения звуковых эффектов и фильтров. Основатель и генеральный директор Гаурав Шарма подчёркивает, что Hook призван сотрудничать с артистами и лейблами, а не способствовать нарушению авторских прав.

📰 Amazon представил новые инструменты для создания рекламы на базе искусственного интеллекта, включая возможность генерации аудиорекламы. Как заявил вице-президент по креативным решениям Amazon Джей Ричман, нововведения помогут брендам создавать рекламные кампании, адаптированные под разные площадки, такие как Prime Video, Twitch и Amazon. В числе других обновлений — улучшенный контроль частоты показов рекламы, интеграция Amazon Marketing Cloud с Amazon Publisher Cloud и расширение возможностей инструмента Performance+, предназначенного для прогнозирования эффективности рекламы.

📰 Глава Recording Academy Харви Мейсон-младший в интервью Fast Company рассказал о влиянии искусственного интеллекта на музыкальную индустрию и о том, как премия «Грэмми» адаптируется к новым технологиям. Мейсон подчеркнул, что Академия не только меняет правила «Грэмми», разрешив использование ИИ в музыке при условии сохранения человеческого вклада, но и активно борется за принятие законов, защищающих права артистов на свои образы и голоса в эпоху дипфейков. Параллельно ведётся работа по повышению репрезентативности и расширению аудитории «Грэмми».

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

18 Oct, 15:58


LANDR Composer: ваш ИИ-помощник для создания музыки без знания музыкальной теории

Не знаете музыкальной теории? Не проблема! Плагин LANDR Composer, работающий на базе искусственного интеллекта, мгновенно сгенерирует для вас аккордовые прогрессии, басовые линии, мелодии и гармонии.

LANDR, после приобретения Orb Plugins выпустила улучшенную версию Orb Producer Pro.

Ранее LANDR объявила о приобретении Orb Plugins, подразделения Hexachords, которое специализируется на разработке инновационных инструментов для творчества, работающих на базе искусственного интеллекта, таких как Orb Producer Suite.

В рамках этой сделки LANDR представила улучшенную версию плагина Orb Producer Pro, который теперь переименован в LANDR Composer.

Этот плагин создан для того, чтобы помочь преодолеть творческий кризис и ускорить процесс создания музыки. С его помощью можно генерировать мелодии, гармонии, басовые линии и аккордовые прогрессии, не имея знаний музыкальной теории.

Основной интерфейс LANDR Composer позволяет создавать до четырёх аранжировок, или Сцен, каждая из которых состоит из четырёх модулей: аккорды, мелодия, арпеджио и бас. В модуле «Аккорды» можно выбрать тональность, гамму, размер и длительность аккордовой последовательности, а также выбирать из множества распространённых аккордовых прогрессий.

После генерации аккордовые прогрессии можно настроить или изменить с помощью панели прогрессий, расположенной в верхней части интерфейса. Нажав на любой аккорд, вы откроете панель, где сможете выбрать различные типы аккордов.

Когда будете довольны своей аккордовой прогрессией, вы сможете сгенерировать мелодии, арпеджио и басовые линии, гармонично сочетающиеся с вашими аккордами. Доступен выбор из множества предустановленных звуков, но если вам не нравятся звуки LANDR Composer, вы можете перетащить MIDI-данные из плагина в таймлайн вашей DAW.

Хотя LANDR Composer автоматически генерирует мелодический материал на основе заданной аккордовой прогрессии, он также позволяет настроить ритмы и формировать мелодии по вашему вкусу, используя элементы управления плотностью, сложностью и вариативностью. Помимо этого, аккордовые последовательности можно кастомизировать с помощью инструментов, добавляющих дополнительную полифонию и широту вашим прогрессиям.

LANDR Composer доступен сейчас в подписке LANDR Studio. Вы также можете приобрести плагин напрямую на сайте LANDR за $149.

Музыкальный ИИ

15 Oct, 16:26


Что касается генеративного ИИ, мы сейчас находимся в середине переходного этапа, когда многие компании строили свои модели, незаконно тренируя их на нелицензированной музыке и контенте. Некоторые ищут правовые решения, некоторые закрываются, некоторые всё ещё верят, что прощение возможно, а некоторые просто застопорились. Музыкальная индустрия не работает быстро, и её сложная система прав делает моделирование легального подхода очень трудным, но любому, кто не хочет иметь дело с интеллектуальной собственностью, лучше переключиться на другие виды контента, потому что обойти это невозможно. Все возможные трюки уже были опробованы.

Для генеративного ИИ может пройти некоторое время, прежде чем крупные правообладатели будут готовы позволить компаниям обучать и создавать новые песни на основе своих каталогов и новых хитов. Однако библиотеки музыки и небольшие каталоги уже открыты для этого. Возможно, вам не понадобится каждая песня, когда-либо созданная, но вам всё равно потребуется жизнеспособная технология для привлечения клиентов, понимание объёма необходимых прав, а также бизнес-модель и предложение, которое можно представить.

Новые решения в области генеративного ИИ, дающие правообладателям определённый контроль и видимость, уже появляются, такие как управление правами, обнаружение генеративного ИИ и атрибуция. Они станут частью правовой экосистемы вокруг генеративного ИИ. Мой совет компаниям, желающим заниматься инновациями в области генеративной музыки ИИ: сосредоточьтесь на своём кейсе использования, пользовательском опыте и вовлечении, а также создавайте отличные приложения для генеративной музыки ИИ.

Никто не просит больше музыки на DSP, поэтому попробуйте найти другие области применения. Будет ли убийственным приложением генеративного ИИ новая социальная платформа с забавными музыкальными мемами? Это может быть игровая платформа с соревнованиями и таблицами лидеров? Это сотрудничество артистов и фанатов? Это промышленное использование с новым видом фоновой музыки без прав? Это будут ИИ-артисты и их ИИ-музыка?

Хотя искусственный интеллект — это очень большая и обширная новая категория, для генеративной ИИ-музыки ваш путь будет включать лицензирование существующей музыки и взаимодействие с клиентами для её монетизации в качестве базовой линии. Компании, занимающиеся генеративным ИИ — это ваш момент, чтобы сделать шаг вперёд и помочь построить эту новую музыкальную экономику!

Музыкальный ИИ

15 Oct, 16:26


«Для музыки и ИИ все дороги ведут к лицензированию»: гостевая колонка в журнале Variety

Викки Науман — основатель и генеральный директор CrossBorderWorks, консалтинговой компании в сфере музыкальных технологий, которую она запустила в 2014 году. В её портфолио входят игровые компании, стриминговые платформы, приложения, оборудование, стартапы и отраслевые консорциумы. Ранее она занимала руководящие должности в 7Digital, Sonos, KEXP, RealNetworks и других компаниях.

Генеративный ИИ находится в процессе перехода от мятежной разрушительной технологии к устойчивой части цифровой музыкальной экономики. Неясно, насколько тернистым будет этот путь или насколько значительной станет эта новая сфера бизнеса, но ясно одно: как и в случае с предыдущими потрясениями в музыке, все дороги ведут к лицензированию.

Музыкальная индустрия строится на фундаменте интеллектуальной собственности, так же как и многие технологические и игровые компании. Однако главное отличие музыки от других индустрий заключается в том, что её легко интегрировать в сторонние сайты, приложения и другие платформы. А также в том, что музыка привлекает аудиторию и способствует распространению платформ. Как только это пересечение происходит, и кто-то начинает извлекать выгоду из музыки артиста, происходит обмен ценностями, что является жизненно важной основой заработка для артистов, лейблов и издателей.

Я знаю, я знаю: лицензирование музыки — это непросто. Это стало чем-то вроде грязного слова, несмотря на то, что такие люди, как я, занимаются этим ежедневно. Лицензирование музыки никогда не было лёгким делом. С первых дней музыкальных нарушений в 2000 году, когда началось незаконное распространение файлов, компании утверждали, что авторское право устарело, что невозможно разобраться во всех правах и законах, и что музыка должна свободно циркулировать в технологических каналах. Этот аргумент повторяется уже 24 года с каждой новой волной технологических предпринимателей, которые не понимали, во что ввязываются, загружая песни на серверы. Но мы разобрались с загрузками, стримингом в радиоформате, стримингом по запросу, прямыми эфирами, цифровым фитнесом, ТВ/фильмами, играми, и мы разберёмся с генеративным ИИ.

Когда компании оказываются на перепутье с музыкой, им часто приходится выбирать: просить разрешение или прощения.

Разрешение, то есть лицензирование, для многих — загадочный процесс. В общих чертах он всегда включает четыре элемента:

1) создание жизнеспособной технологии, которой будут пользоваться клиенты;
2) оценка, какие музыкальные права затрагиваются;
3) разработка бизнес-модели, которая включает оплату за использование музыки;
4) представление этого пакета правообладателям музыки.

Не буду лгать: этот процесс часто отсеивает множество компаний, но это единственный реальный путь вперёд. Может потребоваться некоторое время, чтобы наладить лицензирование, поэтому вам могут понадобиться как краткосрочные, так и долгосрочные цели, а также опытный специалист для помощи.

Прощение — это другой путь.

Если вы маленькая компания и не играете большой роли, вы можете часто оставаться незамеченными. Но как только вы создаёте что-то успешное, вы становитесь видимыми и уязвимыми, если у вас нет лицензий на музыку в вашем продукте. Если вы уже находитесь на виду и у вас нет лицензии на музыку, вас ждёт самое дорогое прощение, которое вы когда-либо просили. И для ясности: это не тот вид прощения, который вы просите, если забыли годовщину.

Этот путь тоже ведёт к лицензированию, но здесь вы платите за все прошлые и будущие использования по завышенной цене, и вы оказываетесь в ловушке без вариантов. Есть примеры компаний, которые прошли этот путь, например, Musical.ly, TikTok и YouTube. Однако есть и огромное кладбище компаний, которые быстро исчерпали свои ресурсы в судебных битвах, и чьи перспективы были утрачены.

Музыкальный ИИ

13 Oct, 14:27


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 7 по 6 октября. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 ИИ-помощник Google Gemini получит новые возможности управления Spotify и WhatsApp. Вскоре Gemini интегрируется с этими сервисами, позволяя воспроизводить музыку и отправлять сообщения.

📰 Приложение Suno для создания музыки с помощью искусственного интеллекта получило обновление. Теперь пользователи Pro и Premium могут редактировать созданные треки, меняя тексты и добавляя инструментальные партии так же легко, как в обычном текстовом редакторе.

📰 Wondercraft обновил свой ИИ-сервис для создания аудио, добавив режим Director Mode. Пользователи могут точно управлять голосами ИИ, задавая им различные акценты, эмоции и манеры речи через чат.

📰 LALAL.AI выпустила новый инструмент для разделения вокала. Инструмент позволяет отделять ведущий и бэк-вокал в песнях, предоставляя пользователям большую гибкость и контроль при работе с вокальными дорожками.

📰 Компания ROLI представила устройство Airwave, которое использует искусственный интеллект и управление жестами для создания музыки. Airwave — это «интеллектуальное пианино», которое помогает изучать музыкальные инструменты и создавать музыку с помощью движений рук и голосовых команд.

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

10 Oct, 16:00


YouTube и Spotify в борьбе с нарушениями авторских прав с помощью ИИ

Борьба YouTube с нарушениями авторских прав укрепилась с Content ID на базе ИИ. В 2021 году платформа обработала почти 1,5 миллиарда претензий. Но Content ID имеет ограничения: 0,5% претензий оспариваются, и 60% изменённых треков остаются нераспознанными.

Spotify активно борется с мошенничеством в потоковой музыке, особенно с музыкой, сгенерированной ИИ, удалив десятки тысяч треков в 2023 году. Это направлено на защиту легитимных платежей за роялти.

Сосуществование синтезированных и реальных голосов

Возможность создания почти идеальных копий голосов вызывает дебаты о подлинности. ИИ-голоса в 80% случаев неотличимы от реальных. Необходимы системы проверки, которые определяют, является ли исполнение человеческим или созданным ИИ в режиме реального времени. Разрабатываются алгоритмы ИИ и технологии водяных знаков для решения этой проблемы.

Распространение сгенерированных голосов требует пересмотра систем роялти. Артисты могут лицензировать свои голоса для использования в ИИ-контенте. Появляются новые модели компенсации — артисты получают роялти за использование голоса в сгенерированном ИИ контенте. Модели уже тестируется на платформах, таких как Voice-Swap. ИИ-голоса могут использоваться для улучшения живых выступлений или создания новых коллабораций.

Артисты, например, Grimes, уже интегрировали ИИ, позволяя поклонникам создавать музыку с использованием её ИИ-голоса, которая затем может быть выпущена официально. Однако это осложняет атрибуцию творческих достижений, когда участвуют как люди, так и машины.

Роль MatchTune в защите авторских прав и обнаружении клонирования голосов

MatchTune стремится решить недостатки традиционных методов обнаружения. CoverNet — собственная технология сканирования авторских прав — использует аудиодактилоскопию на базе ИИ для распознавания нарушений. Она обнаруживает сдвиг высоты звука, ускорение, каверы, ИИ-манипуляции, дипфейки и ремиксы на платформах вроде YouTube и TikTok. Показатели точности CoverNet при обнаружении аудиоманипуляций превышают 95%.

Будущие вызовы: вычислительная мощность и ложные срабатывания

▫️ Необходима большая вычислительная мощность для анализа огромных объёмов аудио. Nvidia и AMD разрабатывают чипы для обработки аудио, которые ускорят обнаружение нарушений.
▫️ Ложные срабатывания — проблема. Общая база данных «крайних случаев» поможет обучать более точные модели обнаружения, что уже снизило количество ложных срабатываний на 30%.

Правовая и этическая среда

Правовая среда для защиты авторских прав с помощью ИИ развивается, но отстаёт. Бюро по авторским правам США выпустило рекомендации, но окончательные нормативные акты находятся в разработке. Генеральный регламент по защите данных (GDPR) в ЕС стимулировал создание технологий «безопасного машинного обучения».

Роль ИИ в защите творчества

▫️ ИИ будет играть ключевую роль в защите авторских прав на аудио. Технологии вроде CoverNet помогают защитить оригинальные произведения от нарушений.
▫️ ИИ не только создаёт музыку, но и защищает авторские права, обнаруживая нарушения с той же эффективностью, что и создаёт контент.

Полная статья доступна по ссылке.

Музыкальный ИИ

10 Oct, 16:00


ИИ против пиратов: выявление сложных случаев нарушения авторских прав с помощью ИИ

Автор: Виржини Берже, директор по развитию бизнеса и правам, MatchTune.

Сегодня ИИ играет двойственную роль в быстроменяющейся музыкальной индустрии — разрушитель и защитник.

▫️ С одной стороны, он генерирует треки, поразительно точно копирующие реальных исполнителей, заполняя платформы изменённым контентом. Примеры — недавние судебные разбирательства между Suno и Udio и крупными звукозаписывающими лейблами.
▫️ С другой стороны, ИИ — мощный инструмент борьбы с этим: он помогает обнаруживать и пресекать несанкционированные изменения, обходя традиционные методы защиты авторских прав.

Индустрия балансирует между инновациями и защитой.

Арсенал современных пиратов аудио

Современные аудиопираты обладают широким и постоянно развивающимся арсеналом.

▫️ Тонкие изменения тональности (сдвиг высоты звука) обходят многие системы распознавания контента. Ускорение воспроизведения меняет темп, но сохраняет тональность, делая песни практически неотличимыми для слуха, но легко различимыми для алгоритмов.

▫️ Маскировка эквалайзером (EQ) может существенно изменить цифровой отпечаток трека. Усиление басов на 6 дБ или срез высоких частот выше 10 кГц часто достаточно, чтобы скрыть оригинальный аудиосигнал.

▫️ Более сложные методы, как спектральная модификация, позволяют изменять саму структуру звука. Программы вроде iZotope RX, изначально предназначенные для восстановления аудио, теперь используются для выборочной модификации или удаления звуковых элементов, кардинально изменяя аудио. Даже небольшие изменения, например, преобразование частоты дискретизации, могут сбить с толку традиционные алгоритмы обнаружения.

Исследование 2022 года показало, что многократное изменение частоты дискретизации может снизить точность обнаружения в некоторых системах до 15%.

▫️ Пираты идут дальше, добавляя низкочастотный фоновый шум или белый шум, как правило, на -20 дБ до -30 дБ ниже основного аудио, скрывая исходный материал, не сильно влияя на восприятие слушателя.

▫️ Другие используют ремиксы, создавая сложные мэшапы, размывающие грань между данью уважения и нарушением авторских прав.

Эти изощрённые методы превращают борьбу с авторскими правами в напряжённую игру в кошки-мышки.

Как ИИ противостоит этому

Современные системы защиты авторских прав основаны на моделях, обученных на обширных наборах данных оригинального и изменённого аудио. Эти нейронные сети анализируют аудио, часто превосходя человеческое слуховое восприятие.

▫️ Сверхточные нейронные сети (CNN), первоначально предназначенные для распознавания изображений, адаптированы для анализа спектрограмм, позволяя эффективно обнаруживать сдвиги тональности и изменения темпа.

▫️ Нейронные сети с долговременной краткосрочной памятью (LSTM) отлично анализируют последовательные данные, что идеально для обнаружения временных манипуляций в аудио.

▫️ Даже технологии, стоящие за продвинутым языковым ИИ, например, ChatGPT, используются для обработки аудио, они ищут сложные паттерны и связи.

Результаты говорят сами за себя. Исследования 2020 и 2023 годов с гибридными моделями CNN-LSTM показали значительное повышение точности в обнаружении подделок и изменённого аудио — от 90 до 95% в зависимости от набора данных. Это кардинально меняет ситуацию для правообладателей.

Реальные примеры успеха: ИИ в действии

В 2023 году, когда вирусной стала песня, имитирующая голос Дрейка, созданная с помощью ИИ, ИИ помог раскрыть синтетическую природу вокала, что привело к быстрому удалению трека с потоковых платформ. Это событие привело к масштабным обновлениям систем распознавания контента на основных платформах.

Ускоренные версии песен на TikTok — уникальная проблема. TikTok использует ИИ-системы для выявления изменённой или нелицензированной музыки. Около 31% выявленных на TikTok треков — изменённые версии оригиналов.

Музыкальный ИИ

06 Oct, 09:35


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 30 сентября по 6 октября. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 Microsoft разрабатывает новую версию своего инструмента искусственного интеллекта Copilot, который будет сочинять музыку, идеально подходящую к видео и презентациям. Модель будет анализировать визуальные и звуковые элементы видео, а также текст, чтобы создавать музыкальное сопровождение, соответствующее настроению и контексту.

📰 Billboard Arabia использовали искусственный интеллект, чтобы почтить память саудовской певицы Этаб, создав новую версию её песни Ya Saudi с помощью технологий ИИ. Компания стремится возродить наследие Этаб, которая была одной из первых женщин, проложивших путь для развития арабской музыки в Саудовской Аравии.

📰 Компания TDK совместно с французской исследовательской лабораторией CEA разработала аналоговый ИИ, способный разделять музыку, речь и шум в режиме реального времени. Система основана на мемристорах, интегрированных в специальную микросхему, которая позволяет обучаться в изменяющейся среде, потребляя в 100 раз меньше энергии, чем традиционные цифровые модели.

📰 Искусственный интеллект все активнее используется в музыке, но вызывает опасения у многих артистов. Компании, такие как Boomy, Musicfy и Uncharted Labs, утверждают, что ИИ демократизирует музыкальное творчество, предоставляя доступ к инструментам всем желающим. Однако артисты, включая Билли Айлиш и Стиви Уандера, опасаются, что ИИ может нарушить авторские права и уничтожить музыкальную экосистему. Об этом подробно в материале NBC.

📰 Композитор Эдуардо Реч Миранда создал альбом Qubism, где квантовые вычисления в сочетании с искусственным интеллектом используются для создания уникальной музыки, которая звучит по-новому каждый раз. Миранда, профессор компьютерной музыки Плимутского университета, сотрудничает с лондонским стартапом Moth Quantum, чтобы исследовать новые возможности квантовой обработки и искусственного интеллекта в творческих областях, таких как музыка, игры и искусство.

💬 Какую из новостей считаете главной на этой неделе?

Музыкальный ИИ

02 Oct, 14:21


Искусственный интеллект на пороге революции в аудиоиндустрии?

ИИ продолжает стремительно развиваться, и его потенциал для трансформации отраслей вызывает у одних восторг, а у других — страх перед непредсказуемыми последствиями.

Тем не менее многие продукты на основе ИИ полезны и экономят время и усилия. Дэйв Чарльз, генеральный директор Media RESULTS, Inc., обратился за советом к медиапрогнозисту Джону Парикхалу, чтобы лучше понять возможности искусственного интеллекта.

Джон работает над ускорением внедрения ИИ во всех формах аудио (включая радио) вместе с лучшими специалистами в этой области. Давайте узнаем о последних тенденциях в сфере аудио ИИ.

💬 ИИ — это искусственный интеллект. Но действительно ли мы хотим «искусственное» в нашей жизни, лишённое человеческих чувств, недостатков и эмоций?

Существуют разные виды ИИ. Большинство из них полезны и экономят время. Мы наблюдаем это уже много лет в таких вещах, как рекомендации Spotify или автокоррекция на вашем телефоне. Последние системы ИИ могут обучаться быстрее и всё чаще без участия человека, что и пугает людей: это великая неизвестность.

💬 ИИ уже повлиял на многие отрасли за последнее десятилетие, и теперь все формы аудиоконтента проходят через изменения под воздействием ИИ. Как ИИ внедряется во все популярные формы аудио, которые используются сегодня?

ИИ используется повсюду. Он используется для редактирования подкастов, как клон голоса в радиотрансляциях, как коммерческий голос в рекламе и даже для приёма заказов в McDonald’s. Он пишет субтитры для телешоу и фильмов. Он даже озвучивает аудиокниги. Новым является использование мультимодальных языковых моделей (LLM), таких как ChatGPT и Claude, которые могут создавать сценарии и превращать их в аудио с минимальным или отсутствием участия человека. Мы только начинаем путь с LLM.

💬 Какие компании являются лидерами в разработке новых инструментов ИИ для улучшения аудиовпечатлений? Какие инструменты ИИ, по вашему мнению, действительно принесут пользу пользователям прямо сейчас?

Одной из ведущих компаний в области аудио на основе ИИ является Futuri, проект Дэниела Анстандига, использующего ИИ для радио. Они уже расширяются в другие области. Существуют компании, которые используют ИИ для улучшения качества звука, такие как Adobe Audition и LALAL.AI. Есть LANDR, который занимается мастеринговой обработкой для продюсеров и музыкантов с помощью ИИ. Есть Descript, который очищает аудио в подкастах. Список длинный.

💬 Радио по-прежнему является «средством массовой информации». Почему радиовещателям стоит быть в восторге от перспектив ИИ?

ИИ может помочь радио с рутинными задачами, такими как журналы программирования, ротации и т. д. Futuri предлагает услугу, которая использует ИИ для создания рекламных роликов с нуля за примерно 3 минуты прямо перед потенциальным рекламодателем. ИИ помогает с подготовкой шоу. Он может даже предложить, какие промоакции могут понравиться вашим слушателям. И ещё один захватывающий аспект — создание контента с текстом, превращаемого в видео, с помощью таких систем, как Microsoft CoPilot и Midjourney. Это отлично подходит для сайтов радиостанций.

💬 Насколько интуитивен ИИ для создателей аудио? Например, возможность вести двусторонний разговор в формате ток-шоу.

Некоторые системы ИИ очень интуитивны. А если технология не интуитивна, кто-то где-то создаёт интуитивный интерфейс. Цены падают, за исключением «умного» ИИ, который решает математические задачи и выполняет серьёзные вычисления. Это больше не бесплатно. Если бы я только начинал знакомство с ИИ, я бы поиграл с ChatGPT, заменил бы Google на Perplexity, прошёл бы бесплатный курс IBM и даже попробовал бы генераторы изображений, такие как Midjourney или Loom. Играйте с ним, как ребёнок. Откройте для себя его возможности. Всегда начинайте с этого.

Музыкальный ИИ

29 Sep, 15:20


Дайджест: 5 событий недели в сфере музыкального ИИ

Рассказываем о ещё пяти новостях с 23 по 29 сентября. Самые яркие события осветили в предыдущих публикациях, а в дайджесте дополняем новостную повестку недели подборкой.

📰 Кей-поп-лейбл Enterarts выпустил песню с голосом певицы Соа, сгенерированным с помощью ИИ, без её разрешения. Это вызвало волну возмущения среди поклонников, которые опасаются, что лейблы могут начать использовать ИИ для создания музыки без согласия артистов.

📰 На конференции MWM в Сеуле эксперты индустрии обсуждали, как виртуальные артисты смогут выжить в условиях перепроизводства. По мнению Ли Гё-гу, гендиректора компании Supertone, успех виртуальных артистов зависит от качественной истории, которая сможет привлечь публику. В качестве примера успешной стратегии был назван коллектив Plave, который завоевал популярность благодаря человеческому подходу к аудитории, отмечает культурный критик Чон Док-хён, работавший ранее в Adamsoft, компании, представившей в 1998 году первого в стране виртуального певца.

📰 Немецкое общество по сбору авторских вознаграждений GEMA предложило новую модель лицензирования музыки, используемой для обучения искусственного интеллекта. По мнению GEMA, компании, занимающиеся ИИ, должны не только платить за использование музыки, но и привлекать авторов к созданию контента, основанного на их творчестве.

📰 Авторы, которые подали в суд на компанию OpenAI за использование их книг для обучения модели ChatGPT, скоро получат доступ к данным для обучения, чтобы доказать свои обвинения. Согласно соглашению, представители авторов смогут ознакомиться с данными в офисе OpenAI в Сан-Франциско, на защищённом компьютере без доступа к интернету.

📰 Генеративный ИИ активно внедряется в музыкальную индустрию, революционизируя создание музыки и повышая креативность артистов, продюсеров и создателей контента. По прогнозам Stats N Data, рынок генеративного ИИ в музыке будет стремительно расти, достигнув значительного объёма к 2031 году. В отчёте исследованы ведущие компании, такие как Meta*, Ecrett Music, Microsoft, OpenAI, Google LLC, Boomy Corporation, Aiva Technologies SARL, LANDR, IBM, Stability AI, и проанализированы ключевые тенденции рынка, включая демократизацию музыкального производства и рост алгоритмического составления плейлистов.

💬 Какую из новостей считаете главной на этой неделе?

* — Meta признана экстремистской организацией, её деятельность запрещена в РФ.