Nastavlja se postepeno narušavanje interneta umjetnom inteligencijom kojoj nije cilj poboljšavati već pogoršavati okruženje u kojem djeluje.
Nedavna studija koju su proveli istraživači u laboratoriju za umjetnu inteligenciju Amazonova Web Servicesa (AWS) otkrila je da se "šokantna količina weba" već sastoji od sadržaja generiranog i prevedenog umjetnom inteligencijom loše kvalitete.
Upravo se "šokantno" čini kao prava riječ. Prema studiji, više od polovice - tačnije 57,1 posto - svih rečenica na internetu prevedeno je na dva ili više drugih jezika. Loša kvaliteta i zapanjujući opseg tih prijevoda sugeriraju da su AI modeli koji se pokreću velikim jezičnim modelom (LLM) korišteni i za stvaranje i za prevođenje materijala. Fenomen je posebno izražen u "jezicima s manjim resursima" ili jezicima s manje dostupnim podacima s kojima se mogu učinkovitije obučavati AI modeli.
Drugim riječima, u onome za što istraživači vjeruju da je trik za prikupljanje prihoda od oglasa potaknut mamcima za klikove, umjetna inteligencija se koristi za prvo generiranje sadržaja na engleskom jeziku loše kvalitete u izuzetnoj mjeri, a zatim za mašinsko prevođenje (MT) pomoću umjetne inteligencije alati prepisuju navedeni sadržaj na nekoliko drugih jezika. Prevedeni materijal svaki put postaje sve gori i kao rezultat toga, cijele regije weba pune se do vrha ponižavajućim kopijama kopija koje je napravio AI.
Ovo ne bi bio prvi znak upozorenja o egzistencijalnoj prijetnji generativne umjetne inteligencije upotrebljivosti weba. Google je, primjerice, bio prisiljen boriti se s postojanošću materijala generiranog umjetnom inteligencijom u Search i Google News. Amazon je također prošao izrazito loše s AI sadržajem; osim ozbiljnog problema s popisima knjiga koje je generirala umjetna inteligencija, nedavno izvješće otkriva da je div e-trgovine preplavljen proizvodima s naslovima poput "Ne mogu ispuniti ovaj zahtjev, to je protivno politici korištenja OpenAI-ja."
Na drugim mjestima, izvan određenih platformi, brojni su izvještaji i studije jasno pokazale da sadržaj generiran umjetnom inteligencijom obiluje cijelim webom.
Što je još gore, rasprostranjenost problema koje stvara umjetna inteligencija mogla bi dugoročno učiniti gotovo nemogućim učinkovito obučavanje modela umjetne inteligencije na jezicima s manjim resursima. Za obuku naprednog LLM-a, AI naučnici trebaju velike količine visokokvalitetnih podataka, koje uglavnom dobivaju "struganjem" weba.
Ako je određeno područje interneta već preplavljeno besmislenim AI prijevodima, mogućnost treniranja naprednih modela na rjeđim jezicima mogla bi biti zaustavljena prije nego što uopće počne.