Впервые в истории США спор об авторских правах и искусственном интеллекте завершился рекордным мировым соглашением. Компания Anthropic, разработчик чат-бота Claude, согласилась выплатить авторам не менее 1,5 миллиарда долларов за использование пиратских книг при обучении ИИ. Каждое произведение оценено примерно в 3 тысячи долларов, и итоговая сумма может вырасти после утверждения финального списка.
На данный момент речь идёт примерно о 500 тысячах произведений, но цифра может увеличиться. Истцы утверждали, что Anthropic получила доступ к миллионам текстов из так называемых «теневых библиотек», в том числе печально известной LibGen. Хотя компания утверждает, что её модели не обучались на этих файлах, факт их скачивания и хранения не оспаривается.
Решающим стало постановление судьи Уильяма Алсапа в июне: обучение ИИ может считаться «добросовестным использованием», но приобретение пиратских копий — отдельное нарушение. По словам судьи, Anthropic «скачала более семи миллионов книг, не заплатила ничего и продолжила их хранить».
Авторы, недовольные условиями, могут отказаться от участия в коллективном иске и подать собственные. Число потенциальных «отказников», при котором сделка будет сорвана, держится в секрете. Если соглашение будет утверждено, появится открытая база данных всех затронутых произведений.
Издательские организации уже называют исход «историческим». По их мнению, это сигнал: ИИ-компании больше не смогут закрывать глаза на авторское право при сборе данных. Тем временем на Anthropic давят и другие иски — крупнейшие звукозаписывающие компании, включая Universal Music Group, обвиняют её в использовании защищённых авторским правом текстов песен. В суде даже прозвучало, что компания загружала файлы через BitTorrent.
Эта сделка на $1,5 млрд может стать лишь началом новой эпохи — когда за каждый украденный абзац и строчку песни ИИ-компаниям придётся платить по полной.
Photo: gguy/Shutterstock