New York Times съди OpenAI, Microsoft за „милиони статии“, използвани за обучение на ChatGPT

New York Times съди Microsoft и OpenAI, твърдейки, че дуото е нарушило авторските права на вестника, като е използвало неговите статии без разрешение за изграждане на ChatGPT и подобни модели. Това е първата голяма американска медийна компания, която завлече техническата двойка в съда заради използването на истории в данните за обучение.

Както при подобни искове – включително действия , предприети от различни артисти и създатели, като Сара Силвърман – жалбата на NYT [PDF] се съсредоточава около използването на защитен с авторски права материал – в този случай от The Times – в обучението на големи езикови модели (LLMs ) зад различни чатботове на Microsoft и OpenAI и генериращи AI услуги.

Жалбата призовава Microsoft не само за инвестицията, която е направила в OpenAI, но и за помощници като Microsoft 365 Copilot и Bing Chat, за които се твърди в жалбата: „Показване на съдържанието на Times в генериращ изход най-малко по два начина: (1) чрез показване на „запаметени“ копия или производни на произведения на Times, извлечени от самите модели, и (2) чрез показване на синтетични резултати от търсене, които са по същество подобни на произведенията на Times, генерирани от копия, съхранени в индекса за търсене на Bing.“

Вестникът е доста разстроен, че „милиони“ от неговите защитени с авторски права статии са били събрани, за да формират част от моделите на Microsoft и OpenAI без разрешение, и че тези невронни мрежи ще възпроизвеждат тази работа при поискване от потребителите, отново без разрешение.

В жалбата си NYT дава примери, за които твърди, че доказват, че ChatGPT е бил обучен за неговото съдържание. Освен това изглежда, че един прост въпрос към ChatGPT за избягване на платена стена води до отговори, съдържащи защитен с авторски права текст.

И това е избягването на платената стена на изчерпването на съдържанието на OpenAI, което привлече особено внимание. Според жалбата вестникът е започнал да крие работата си зад платена стена преди 12 години и към третото тримесечие на 2023 г. е предявил претенции към 10,1 милиона цифрови и печатни абонати. Целта е този брой да се увеличи до 15 милиона до края на 2027 г.

Случайните читатели също са обслужени, с безплатен достъп до ограничен брой статии, преди да бъде поискан абонамент. NYT смята, че привлича от 50 до 100 милиона потребители на седмица с такъв подход, като рекламата допълнително пълни хазната му.

Жалбата обяснява: „Таймс зависи от своите изключителни права за възпроизвеждане, адаптиране, публикуване, представяне и показване съгласно закона за авторското право, за да се противопостави на тези сили. Таймс регистрира авторските права в своето печатно издание всеки ден в продължение на повече от 100 години, поддържа paywall и е въвел условия за ползване, които определят ограничения върху копирането и използването на неговото съдържание. За да използвате съдържанието на Times за търговски цели, дадена страна трябва първо да се обърне към The Times за лицензионно споразумение.“

Въпреки това, за да привлече трафик към своя сайт, NYT също така позволява на търсачките да имат достъп и да индексират съдържанието му. „Присъща на този обмен на стойност е идеята, че търсачките ще насочват потребителите към собствените уебсайтове и мобилни приложения на The Times, вместо да експлоатират съдържанието на The Times, за да задържат потребителите в тяхната собствена екосистема за търсене.“

За да използва съдържанието на Times за търговски цели, една страна трябва първо да се обърне към The Times за лицензионно споразумение

Times добави, че никога не е позволявал на никого – включително Microsoft и OpenAI – да използва съдържанието му за генериращи AI цели. И в това се крие проблемът. Според вестника, той се е свързал с Microsoft и OpenAI през април 2023 г., за да се справи с проблема по приятелски начин. В него се заявява направо: „Тези усилия не доведоха до резолюция“.

И така се оказваме с оплакване, което твърди „бизнес модел, базиран на масово нарушаване на авторски права“ и описва подробно пътя на OpenAI от началото му като „компания за изследване на изкуствения интелект с нестопанска цел“ през 2015 г. до днешния гигант.

Според жалбата: „Въпреки ранните си обещания за алтруизъм, OpenAI бързо се превърна в многомилиарден бизнес с печалба, изграден до голяма степен върху нелицензираната експлоатация на защитени с авторски права произведения, принадлежащи на The Times и други.“

И така, какво да правя? Не е изненадващо, че NYT търси обезщетение. Той също така изисква съдебен процес и иска съдът да разпореди унищожаването на „всички GPT или други модели на LLM и комплекти за обучение, които включват произведения на Times“.

По-рано този месец Axel Springer и OpenAI обявиха план за предоставяне на резюмета на съдържанието на първия – включително платено съдържание – от продуктите на последния, включително ChatGPT. Планът е да се гарантира, че отговорите на потребителските запитвания включват приписване и връзки към пълните статии.

На каква стойност е сделката не е ясно. Според Financial Times става дума за осемцифрена сума. Както е отбелязано в жалбата си, NYT също е провел дискусии, но очевидно резултатът е бил незадоволителен. ®

New York Times съди OpenAI, Microsoft за „милиони статии“, използвани за обучение на ChatGPT

Стартира World Computer Hacker League – четиримесечно глобално състезание за създаване на приложения от ново поколение

Първата AI академия на Kaufland завърши със 100% успеваемост

Българската хостинг компания JetHost придобива американската WebHostFace

Wolt стартира в София

Стартира първият български език за програмиране – ЖАР

Не пропускайте

Стартира World Computer Hacker League – четиримесечно глобално състезание за създаване на приложения от ново поколение

Първата AI академия на Kaufland завърши със 100% успеваемост

Българската хостинг компания JetHost придобива американската WebHostFace

Wolt стартира в София

Стартира World Computer Hacker League – четиримесечно глобално състезание за създаване на приложения от ново поколение

Първата AI академия на Kaufland завърши със 100% успеваемост

Българската хостинг компания JetHost придобива американската WebHostFace