Поддержи наш проект

bitcoin support

Наше издание живет благодаря тебе, читатель. Поддержи выход новых статей рублем или криптовалютой.

Подпишись на рассылку

Раз в неделю мы делимся своими впечатлениями от событий и текстов

Новость

23 января 2026, 10:23

Писатели обвинили Nvidia в покупке 500 терабайт пиратских копий книг на Anna's Archive для обучения нейросети

NVIDIA могла обучать свою ИИ-модель на пиратских книгах Anna’s Archive. Об этом говорится в дополненной версии иска Nazemian v. NVIDIA Corporation (4:24-cv-01454), который рассматривается в Окружном суде США по Северному округу Калифорнии.

Речь идёт о деле авторов книг против NVIDIA, которое тянется уже несколько лет. Компания ранее уже признала, что использовала тексты из пиратских библиотек Books3 и The Pile. При этом решение по иску пока так и не было вынесено. 

Недавно группа истцов подала дополнение к своему иску. В нём утверждается, что фирма также намеренно воспользовалась текстами из Anna’s Archive — сайта, который появился после ареста российских админов z-lib и конфискации доменов силовиками ФБР. Новый сайт объединяет поисковик по архиву уничтоженных страниц и их зеркалам, а также LibGen и Sci-Hub. Ранее в Anna’s Archive признавали, что десятки компаний, разрабатывающих нейросети, запросили у владельцев новой мегабиблиотеки её тексты. В итоге около 30 разных разработчиков ИИ получили полный доступ ко всем книгам, статьям и прочим копиям.

Истцы со ссылкой на «внутренние документы» утверждают, что NVIDIA была одной из компаний, которые запросили себе доступ ко всей библиотеке Anna’s Archive. Причиной для такого рискованного шага, как говорится в новой версии иска, стали дедлайны по презентации новой модели NextLargeLLM. В 2023 году, как утверждается, разработчики попытались получить тексты легально, но процесс шёл слишком медленно. После этого представитель компании якобы согласился договориться с руководством Anna’s Archive о получении доступа. В ответе владельцев пиратской библиотеки прямо говорилось, что это может считаться незаконным и что в фирме должны подтвердить готовность пойти на риск для обучения своей модели. Одобрить обмен, как считают заявители, должны были непосредственно в руководстве бигтех-компании.

«Отчаянно нуждаясь в книгах, NVIDIA обратилась к Anna’s Archive — крупнейшей и самой наглой из оставшихся теневых библиотек — с предложением приобрести миллионы пиратских материалов и включить Anna’s Archive в данные для предварительного обучения наших программ. Поскольку Anna’s Archive взимал десятки тысяч долларов за “высокоскоростной доступ”, NVIDIA стремилась выяснить, как он будет выглядеть. В переписке с руководителями NVIDIA представитель Anna’s Archive заявил, что, поскольку его коллекции были приобретены и поддерживаются незаконно, руководителям NVIDIA необходимо «сообщить, когда вы внутренне решите, что можете этим заняться. Мы потратили слишком много времени на людей, которые не смогли заручиться внутренней поддержкой», — говорится в тексте.

По оценкам истцов, NVIDIA получила от пиратской библиотеки «миллионы книг, защищенных авторским правом». Всего Anna’s Archive якобы передала NVIDIA доступ к книгам общим объемом примерно 500 терабайт. Обмен данными начался примерно в конце 2023 года. В феврале 2024 года NVIDIA выпустила модель Nemotron-4 15B, которая, вероятно, обучалась на пиратских книгах.

Ранее аналогичный иск подали против Anthropic, разработчиков ИИ-бота Claude. В итоге компания согласилась заплатить авторам книг и их юристам 1,5 миллиарда долларов.

Наш отдел новостей каждый день отсматривает тонны пропаганды, чтобы найти среди неё крупицу правды и рассказать её вам. Помогите новостникам не сойти с ума.

ПОДДЕРЖАТЬ ПРОЕКТ
Карта любого банка или криптовалюта