ЯПОНИЯ - самая прогрессиваня на сегодняшний день страна, там просто разрешено использовать защищённые авторским правом работы для тренировки ИИ-моделей.
КИТАЙ - самое интересное. Закон как у всех (кроме Японии) - нет конкретного запрета или разрешения, зато есть решение суда по делу Shanghai Character License Administrative Co., Ltd. (SCLA) против Tab. Таб выпустили модельку, генерящую картинки, и она по запросу рисовала Ультрамэна - супергероя, права на которого принадлежат истцам.
Они просили наказать Таб и за тренировку, и за выдачу. Китайский суд признал нарушение авторских прав - картинки содержали Ультрамэна, и присудил выплатить почти полторы тыщи долларов компенсации, а Ультрамана просто удалить из разрешённых запросов для генерации (вместе с Винни Пухом, наверное).
По поводу требования наказать за использование защищённых авторским правом работ суд сказал - знаете, ребята, на этом в принципе все нейросети построены, поэтому мы-то точно лезть в это не будем, ибо решение суда не должно перекособячить все мировые процессы. Потому как если мы решим запретить, это будет значить, что абсолютно все нейросети под запретом, ибо все они натренированы на огромных базах данных, содержащих копирайченные материалы.
ВЫВОД - на данный момент нет ни одного закона или судебного решения, запрещающего тренировку ИИ-моделей на защищённых авторскими правами произведениях. Зато есть джва судебных решения - немецкое прямо разрешает, а китайское отказывается запрещать.
P.S. Натренировать модель картинок или песен, не нарушая копирайт, могут гиганты типа Адобченки (с), Сони и прочих правоторговцев, обладающих невероятным количеством скупленных картинок, музыки и т.д. Но если это дело оставить на откуп только им, мы получим олигархические картельные монополии, а также убьём весь опенсорс.
А вот языковые модели натренировать без использования защищённых авторским правом материалов нельзя даже теоретически - заебёшься покупать данные, и любой датасет будет убогим и каличным без них. Невозможно.
P.P.S. А ведь люди точно так же тренируются на том, что смотрят в интернете, на картинках, в музеях и этих, как его, ну? Где тётеньки змеями шипели? Библиотеках, вотъ!
Такие дела.