Krađa podataka

OpenAI i Microsoft tuženi za 3 milijarde dolara zbog ChatGPT-a

OpenAI i njihov većinski vlasnik Microsoft navodno su krali podatke sa interneta za svoj chatbot, ChatGPT

U tužbi se tvrdilo da je OpenAI tajno „iskoristio 300 milijardi riječi sa interneta“.

U srijedu su OpenAI i Microsoft tuženi u grupnoj tužbi tražeći odštetu od 3 milijarde dolara zbog navodne krađe „ogromne količine privatnih informacija“ od korisnika interneta bez pristanka kako bi obučili ChatGPT.

U ovoj tužbi, koja je podnijeta 28. juna federalnom sudu u San Francisku, Kalifornija, i uključuje šesnaest anonimnih tužilaca, tvrdi se da je OpenAI tajno „ostrugao 300 milijardi riječi sa interneta“ bez da je registrovan kao posrednik za protok podataka ili dobijanja saglasnosti. Microsoft je OpenAI-jev glavni kupac i korporativni partner, koji licencira AI tehnologiju od kompanije za šta plaća milijarde dolara.

Također se tvrdi da kompanije nastavljaju da „nezakonito prikupljaju i unose dodatne lične podatke od miliona nesvjesnih potrošača širom svijeta… kako bi nastavili da razvijaju i obučavaju svoje proizvode“ misleći na informacije koje se unose u AI modele.

"Ljudi nisu neogračeni izvor profita"

U tužbi se OpenAI poredi sa drugom firmom za vještačku inteligenciju koja je dospjela na naslovne strane zbog prikupljanja informacija ljudi sa interneta bez njihovog izričitog pristanka: Clearview AI, koja je prikupila fotografije sa društvenih medija kako bi napravila alat za prepoznavanje lica koji se široko koristi od strane policije. Clearview AI je tužilo više strana, uključujući ACLU. Firma je riješila tu tužbu prošle godine i prestala da nudi svoje usluge većini privatnih lica i preduzeća u SAD.

„Clearview više ne može tretirati jedinstvene biometrijske identifikatore ljudi kao neograničeni izvor profita“, rekao je tada Nathan Frid Wessler, zamjenik direktora ACLU-ovog projekta za slobodan govor, privatnost i tehnologiju.

U tužbi se navode popularni AI alati koje je razvio OpenAI i koje koristi Microsoft, uključujući jezičke modele GPT 3.5 i 4.0, model za slike Dall-E i model za pretvaranje teksta u govor Vall-E. Također se navode internet aktivnosti tužilaca tokom godina, gdje kaže da „nisu pristali na korištenje [njihovih] privatnih podataka od strane trećih strana [za obuku AI] na ovaj način“, i da su kompanije ukrale njihove „lične podatke sa širokog dijapazona onlajn aplikacija i platformi kako bi sproveli obuku sopstvenih proizvoda."

OpenAI je navodno krao imena, kontakte, mailove...

Podaci za koje se tužba navodi da ih je ukrao OpenAI uključuju imena, kontakt podatke, adrese e-pošte, informacije o plaćanju, informacije o društvenim medijima, podatke četlogova, podatke o korišt́enju, analitiku i kolačiće.

„Optuženi su se nepravedno obogaćati putem krađe ličnih informacija jer je njihov biznis sa vještačkom inteligencijom vrijedan milijardu dolara, uključujući ChatGPT i dalje, izgrađen na prikupljanju i monetizaciji ličnih podataka korisnika interneta“, navodi se u tužbi. „Dakle, prvooštećeni imaju pravo na restituciju štete koja predstavlja vrijednost ukradenih podataka i/ili na udio u dobiti koju su tuženi zaradili po tom osnovu.", piše VICE.

U tužbi se traži da se OpenAI-u i Microsoftu zabrani da krše privatnost ljudi i da preduzmu dodatne korake. Prvi korak je da se otkrije koji se podaci prikupljaju i kako se koriste. Drugi korak, napisali su tužioci, je da slijede kodeks etičkih principa i da isplate tužiocima nadokandu za ukradene podatke. Konačno, navodi se u tužbi, korisnici interneta treba da imaju pravo da sebe izuzmu od bilo kakvog prikupljanja podataka i da se zaustavi svako nezakonito uzimanje podataka.

Prethodno, u novembru, OpenAI i Microsoft su tuženi u još jednoj grupnoj tužbi koju su pokrenuli GitHub programeri koji su tvrdili da je GitHub Copilot, alatka za AI kodiranje u vlasništvu Microsofta, prekršila njihove licence otvorenog koda i koristila njihov kod za obuku bez njihove dozvole.