Igrali smo se s Stable Video Diffusion in nakazuje strašljivo prihodnost globokih ponaredkov AI

Stable Video Diffusion je tukaj in čeprav je vsekakor kul, napoveduje zaskrbljujočo prihodnost, ko gre za globoke ponaredke.

Ključni zaključki

Generativni AI, kot je Stable Video Diffusion, ima potencial za ustvarjanje zelo realističnih in prilagodljivih slik in videoposnetkov na podlagi posredovanih pozivov.
Uporaba slik in videoposnetkov, ustvarjenih z umetno inteligenco, za dezinformacije in kršitve zasebnosti postaja vse pogostejša, kar postavlja pod vprašaj zanesljivost vizualnih dokazov na internetu.
Stabilna video difuzija je šele začetek in ker tehnologija umetne inteligence še naprej napreduje, prihodnost spletnih medijev ogrožajo morebitna zloraba in etični pomisleki.

Revolucija umetne inteligence je bila eden največjih in najpomembnejših dosežkov leta 2023. S podobnimi OpenAI, ki osvajajo svet s ChatGPT in drugimi, kot sta Bing Chat in Google Bard, ki mu sledijo, je generativni AI precej močna tehnologija. Kjer postane zaskrbljujoče, je Generiranje slik AI, orodja, ki lahko ustvarijo slike po meri na podlagi posredovanih pozivov. Zdaj, s Stable Video Diffusion, bodo stvari še slabše.

Še zdaleč me ni strah, ko gre za tehnologijo, in mislim, da ima generativna umetna inteligenca veliko uporab v obeh dostopnost in zabavni konteksti, vendar ni dvoma, da se lahko tehnologija uporablja tudi za zlo. Dezinformacije so pojav, ki postaja vse pogostejši, dokazano pa je, da ustvarjene lažne slike pretentajo uporabnike v številnih različnih kontekstih. Se spomnite tiste fotografije papeža Frančiška, ki je hodila naokoli, kjer je nosil dolgo belo puhovko? Ta slika ni bila resnična, vendar so mnogi mislili, da je. Slike niso več pravi dokaz, kot so ljudje nekoč pričakovali, da bodo.

Vir: Generative AI

Glede na to, da se je danes že nemogoče zanašati na slike kot edini dokaz nečesa, so na vrsti videi na kocki se bo težje kot kdaj koli prej zanesti na karkoli, kar vidite na internetu, resnično.

Stabilnost Stabilna video difuzija AI je strašljivo dobra

Vendar je zdaj šele v fazi testiranja

Stable Video Diffusion je nadaljevanje Stable Diffusion, izdanega lani, modela "odprtih uteži". ki je nedvomno sprožil val AI generatorjev slik, ki je imel vsaj pomembno vlogo del. Video oblika tega posebnega modela je prav tako dostopna in jo lahko uporablja vsak, ki ima enega od najboljši grafični procesorji Nvidia.

Kako ta poseben model deluje, je zelo zanimivo in trenutno je precej omejeno glede tega, koliko resnično lahko naredi. Kot pravi Stability AI, "medtem ko vneto posodabljamo naše modele z najnovejšimi napredki in si prizadevamo vključite vaše povratne informacije, ta model sploh ni namenjen uporabi v resničnem svetu ali komercialni uporabi stopnja. Vaši vpogledi in povratne informacije o varnosti in kakovosti so pomembni za izboljšanje tega modela za njegovo morebitno izdajo."

Uporabnikom sta na voljo dva trenutna modela; prvi je SVD, drugi pa SVD-XT. Ti lahko ustvarijo 14 oziroma 25 sličic s hitrostjo sličic, ki jo je mogoče prilagoditi med 3 in 30 FPS. S to vrsto umetne inteligence, ki je sposobna narediti toliko, je samo vprašanje časa, kdaj bodo ljudje lahko sami kuhali lastne globoke ponaredke doma pri komur koli.

Stabilno video difuzijo bo verjetno enostavno nastaviti

To ni nujno dobro

Ko je Stable Diffusion prvič zaživel, je moj prijatelj uril model na prijateljevem obrazu, da bi omenjenega prijatelja dodal v Metal Gear Solid vesolje v smešno neumni galeriji po meri. Bilo je zelo kul darilo in zelo zabavno delati in se z njim zapletati (prijatelj je dal popolno soglasje, da se na njegovem obrazu usposobi model), vendar razmišljam o tistem času, zdaj pa sem popolnoma zgrožen.

S stotinami naših slik, ki so tam zunaj, je ljudem že omogočeno urjenje modelov na obrazi ljudi, ki ne dajo svojega soglasja, skoraj vsakogar, ki ima svoje fotografije v javnosti vidno. Zdaj pa si predstavljajte, da lahko ustvarite sliko nekoga in nato to risbo lahko animirate s Stable Video Diffusion?

Posledic tega je veliko, od kršitev zasebnosti do mejne nezakonitosti. Slišal sem že od žensk v prostoru ustvarjalcev vsebine, ki so mi povedale o oboževalcih, ki AI ustvarjajo njihovo pornografijo in pošiljanje nazaj njim, skoraj kot da bi bili ti "oboževalci" ponosni na dejstvo, da so kršili zasebnost drugega človeka. To se dogaja že več kot eno leto in to je primer, ki ga poznam. Nikakor pa to ni edina posledica orodij, kot so ta, na zasebnost in dejansko bo verjetno samo še slabše.

Primeri stabilne video difuzije so že na voljo

Strašljivo, a neverjetno

Zgornji video, ki ga je izdal Stability AI, prikazuje moč stabilne video difuzije. Drugi so prav tako pokazali moč tehnologije in pokazali, kako lahko premakne in animira praktično vse v majhnem, nekajsekundnem oknu. Zahteva veliko računalniške moči, vendar obstaja veliko storitev, kot sta Hugging Face in Replicator, za katere lahko ljudje v bistvu najamejo čas obdelave. Zagnal sem ga lokalno s pomočjo spodnje slike (razdeljene s programsko opremo Stable Video DIffusion), da preizkusim, kako dober je.

Sumim, da je zgornja slika nastala z umetno inteligenco, saj na spletu ne najdem natančnih ujemanj. Kljub temu je popoln kandidat za testiranje. S to sliko sem lokalno zagnal model Stable Video Diffusion in v slabi eni uri dobil naslednji štirisekundni posnetek.

To je šokantno dobro. Čeprav ima zdaj nizko hitrost sličic, kot že omenjeno, je to model v razvoju, ki še ni namenjen splošni uporabi. Poskusil sem s svojo fotografijo, fotografijo vlaka, ki prihaja v meglo.

Na žalost rezultat ni bil tako dober, čeprav je bila fotografija zaradi megle zahtevnejša za delo z AI.

Presenetljivo je, da se je še vedno zdelo, da razume, da je vlak, no, vlak. Pravkar se je končalo s selitvijo na drugi tir. Kljub temu je to beta programska oprema in rezultati so kljub temu impresivni.

Stabilna video difuzija je šele začetek

Ne glede na to, kaj si mislite o tem, kako impresivna je ta tehnologija, je to šele začetek. To je prvi odprtokodni model, ki ga bodo ljudje nedvomno razstavili, izboljšali in morda uporabili brez skrbi za etiko. Prihodnost spletnih medijev je v nevarnosti, predvsem zaradi videa in slik z umetno inteligenco, in ko postajajo boljši in bolje, obstajajo daljnosežne posledice, ki bodo v naslednjih mesecih odprle več različic Pandorine skrinjice in leta.

Kot računalniški znanstvenik je tehnologija tako neverjetno impresivna, da osupne um, in hitra rast generativne pokrajine AI je tako, tako impresivna. Vendar kot a oseba, ta tehnologija me grozi.