OpenAI je predstavio Soru, njihov najnoviji AI model za generiranje videa, dizajniran za oživljavanje tekstualnih uputa u fotorealističnim videozapisima dužine do jedne minute. Sora se ističe u izradi zamršenih scena s više likova, specifičnim pokretima i preciznim detaljima subjekata i pozadine, pokazujući razumijevanje objekata u fizičkom svijetu i sposobnost tumačenja rekvizita dok stvara izražajne likove.
Prema OpenAI, Sora može generirati videozapise na temelju fotografija, popuniti okvire koji nedostaju u postojećim videozapisima ili produžiti njihovo trajanje. Iako se model povremeno može boriti sa simulacijom fizike složenih scena, rezultati su nedvojbeno impresivni. Značajne demo snimke sadržavale su scene poput pogleda iz zraka na Kaliforniju tokom zlatne groznice i simulirane perspektive iz tokijskog voza, prikazujući time Sorine sposobnosti.
Za razliku od svojih prethodnika, kao što je Midjourney, koji se fokusirao na generiranje teksta u sliku, polje AI generiranih videa se brzo razvilo, s modelima generiranja videa kao što su Runway, Pika i Googleov Lumiere. Lumiere, konkurent Sori, također nudi mogućnosti pretvaranja teksta u video te omogućuje korisnicima i stvaranje videozapisa iz fotografija.
Trenutno dostupna "crvenim timovima" koji procjenjuju potencijalne rizike i štete, Sora je također dostupna vizualnim umjetnicima, dizajnerima i filmašima za povratne informacije. OpenAI prepoznaje potencijalne izazove, uključujući ograničenja modela u preciznoj simulaciji složenih scena i tumačenju određenih uzročno-posljedičnih instanci.
OpenAI je nedavno najavio i dodavanje vodenih žigova svom AI alatu za pretvaranje teksta u sliku, DALL-E 3, uz upozorenje da se ti vodeni žigovi mogu lako ukloniti. Kao i kod drugih proizvoda umjetne inteligencije, OpenAI je svjestan implikacija lažnih fotorealističnih videozapisa generiranih umjetnom inteligencijom koji se pogrešno smatraju pravim sadržajem, naglašavajući potrebu za odgovornom upotrebom i razmatranjem mogućih posljedica, piše The Verge