Igrali smo se sa Stable Video Diffusion i on signalizira zastrašujuću budućnost AI dubokih lažiranja

Stable Video Diffusion je ovdje, i iako je svakako cool, predviđa zabrinjavajuću budućnost kada su u pitanju dubinski krivotvorini.

Ključni zahvati

Generativna umjetna inteligencija, poput Stable Video Diffusion, ima potencijal za stvaranje vrlo realističnih i prilagodljivih slika i videozapisa na temelju ponuđenih upita.
Upotreba slika i videozapisa generiranih umjetnom inteligencijom za dezinformacije i kršenje privatnosti postaje sve češća, dovodeći u pitanje pouzdanost vizualnih dokaza na internetu.
Stabilna video difuzija samo je početak, a kako AI tehnologija nastavlja napredovati, budućnost internetskih medija ugrožena je potencijalnom zlouporabom i etičkim problemima.

AI revolucija jedan je od najvećih i najvažnijih napredaka 2023. Uz OpenAI koji osvaja svijet s ChatGPT-om i drugima poput Bing Chata i Google Barda koji slijede, generativni AI je prilično moćna tehnologija. Ono što postaje zabrinjavajuće je AI generiranje slike, alati koji mogu stvoriti prilagođene slike na temelju upita koji im se daju. Sada, uz Stable Video Diffusion, stvari će postati još gore.

Daleko sam od straha kada je u pitanju tehnologija i mislim da generativna umjetna inteligencija ima mnogo koristi u oba pristupačnost i zabavni konteksti, ali nema sumnje da se tehnologija može koristiti i za zlo. Dezinformacije su fenomen koji postaje sve češći, a već se pokazalo da generirane lažne slike prevare korisnike u mnogim različitim kontekstima. Sjećate li se one fotografije pape Franje koja je kružila uokolo na kojoj je nosio dugu bijelu pufer jaknu? Ta slika nije bila stvarna, ali mnogi su mislili da jest. Slike više nisu srebrni metak dokaza kakav su ljudi nekoć očekivali.

Izvor: Generative AI

S obzirom da je danas već nemoguće osloniti se na slike kao jedini dokaz nečega, na redu su videi na bloku, bit će teže nego ikad osloniti se na sve što vidite na internetu kao stvaran.

Stabilnost AI-jeva Stable Video Diffusion je zastrašujuće dobra

Ali sada je samo na testiranju

Stable Video Diffusion nadovezuje se na Stable Diffusion objavljen prošle godine, model "otvorenih težina" koji je vjerojatno pokrenuo val AI generatora slika, u najmanju ruku igrajući značajnu ulogu dio. Video oblik ovog određenog modela jednako je dostupan i može ga pokrenuti svatko tko ima jedan od najbolji Nvidia GPU.

Način na koji ovaj određeni model radi prilično je zanimljiv, a trenutačno je prilično ograničen u pogledu toga koliko doista može učiniti. Kao što Stability AI kaže: "Iako željno ažuriramo svoje modele najnovijim dostignućima i radimo na Uključite svoje povratne informacije, ovaj model nije namijenjen za stvarne ili komercijalne primjene pozornici. Vaši uvidi i povratne informacije o sigurnosti i kvaliteti važni su za usavršavanje ovog modela za njegovo konačno izdavanje."

Korisnicima su na raspolaganju dva trenutna modela; prvi je SVD, a drugi SVD-XT. Oni mogu generirati 14 odnosno 25 okvira pri brzini kadrova koja se može prilagoditi između 3 i 30 FPS. S ovom vrstom umjetne inteligencije koja je sposobna učiniti toliko toga, samo je pitanje vremena kada će ljudi moći napraviti vlastite duboke krivotvorine kod bilo koga doma.

Stabilnu video difuziju vjerojatno će biti lako postaviti

To nije nužno dobra stvar

Kada je Stable Diffusion prvi put krenuo, moj prijatelj je istrenirao model na licu svog prijatelja kako bi tog prijatelja dodao u Metal Gear Solid svemir u smiješno glupoj galeriji napravljenoj po narudžbi. Bio je to prilično cool dar i bilo je zabavno raditi i petljati se s njim (prijatelj je dao potpuni pristanak da se na njegovom licu uvježba model), ali razmišljam o tada, sada, potpuno užasnut.

Sa stotinama naših slika koje su vani, ljudima je već bilo moguće trenirati modele na lica ljudi koji ne daju svoj pristanak, gotovo bilo tko tko javno ima svoje fotografije vidljiv. Sada zamislite da možete generirati nečiju sliku i zatim moći animirati taj crtež pomoću Stable Video Diffusion?

Postoje mnoge implikacije ovoga, u rasponu od kršenja privatnosti do granice nezakonitosti. Već sam čuo od žena u prostoru za stvaranje sadržaja koje su mi rekle o obožavateljima AI koji stvaraju njihovu pornografiju i šaljući im ga natrag, gotovo kao da su ti "obožavatelji" ponosni na činjenicu da su povrijedili privatnost drugog ljudskog bića. To traje više od godinu dana i to je primjer koji mi je poznat. To nipošto nije jedina implikacija alata poput ovih na privatnost i zapravo će se vjerojatno samo pogoršati.

Primjeri stabilne video difuzije već su dostupni

Strašno, ali nevjerojatno

Gornji video, koji je objavio Stability AI, pokazuje snagu Stable Video Diffusion. Drugi su također pokazali snagu tehnologije, demonstrirajući kako ona može učiniti da se praktički sve pokrene i animira u malom prozoru od nekoliko sekundi. Potrebno je puno računalne snage, ali postoji mnogo usluga kao što su Hugging Face i Replicator za koje ljudi mogu iznajmiti vrijeme obrade. Pokrenuo sam ga lokalno, koristeći sliku ispod (distribuiranu sa softverom Stable Video DIffusion) da testiram koliko je dobar.

Gornja slika je slika za koju sumnjam da je generirana umjetnom inteligencijom jer ne mogu pronaći točna podudaranja s njom na internetu. Ipak, savršen je kandidat za testiranje. Lokalno sam pokrenuo model Stable Video Diffusion s ovom slikom i za manje od sat vremena dobio sam sljedeći isječak od četiri sekunde.

Ovo je šokantno dobro. Iako sada ima nisku brzinu kadrova, kao što je već spomenuto, ovo je model u razvoju koji još nije namijenjen za opću upotrebu. Pokušao sam sa svojom fotografijom, fotografijom vlaka koji stiže u magli.

Nažalost, rezultat nije bio tako dobar, iako je AI bila zahtjevnija za rad s fotografijom zahvaljujući magli.

Impresivno, činilo se da još uvijek razumije da je vlak, pa, vlak. Završilo je prelaskom na drugu željezničku prugu. Ipak, ovo je beta softver, a rezultati su usprkos tome impresivni.

Stabilna video difuzija samo je početak

Bez obzira na to što mislite o tome koliko je ova tehnologija impresivna, to je samo početak. Ovo je prvi model otvorenog koda koji će ljudi nedvojbeno rastaviti, poboljšati i možda koristiti bez brige za etiku. Budućnost internetskih medija je u opasnosti, uglavnom zahvaljujući AI videu i slikama, a kako postaju sve bolji i bolje, postoje dalekosežne implikacije koje će otvoriti više verzija Pandorine kutije tijekom sljedećih mjeseci i godine.

Kao računalni znanstvenik, tehnologija je tako nevjerojatno impresivna da zapanjuje um, a brzi rast generativnog AI krajolika je tako, tako impresivan. Međutim, kao a osoba, ova me tehnologija užasava.