Mängisime Stable Video Diffusioniga ja see annab märku AI sügavate võltsingute hirmutavast tulevikust

Stabiilne video hajutamine on siin ja kuigi see on kindlasti lahe, loob see sügavate võltsingute osas murettekitava tuleviku.

Võtmed kaasavõtmiseks

Generatiivne AI, nagu stabiilne video hajutamine, võib luua väga realistlikke ja kohandatavaid pilte ja videoid, mis põhinevad esitatud viipadel.
Tehisintellektiga loodud piltide ja videote kasutamine desinformatsiooni ja privaatsuse rikkumiste jaoks on muutumas üha tavalisemaks, mis seab kahtluse alla visuaalsete tõendite usaldusväärsuse Internetis.
Stabiilne video hajutamine on alles algus ja tehisintellekti tehnoloogia arenedes ohustavad võrgumeedia tulevikku võimalik väärkasutus ja eetilised probleemid.

Tehisintellekti revolutsioon on olnud 2023. aasta üks suurimaid ja olulisemaid edusamme. Kuna sellised inimesed nagu OpenAI vallutavad ChatGPT-ga ja teistega nagu Bing Chat ja Google Bard, on generatiivne AI üsna võimas tehnoloogia. Murettekitav on see AI kujutise genereerimine, tööriistad, mis saavad neile antud viipade alusel luua kohandatud pilte. Nüüd, stabiilse video hajutusega, lähevad asjad veelgi hullemaks.

Ma pole tehnoloogia osas hirmust kaugel ja arvan, et generatiivsel tehisintellektil on mõlemas valdkonnas palju kasutust. ligipääsetavus ja lõbusad kontekstid, kuid pole kahtlustki, et seda tehnoloogiat saab kasutada ka kurja jaoks. Desinformatsioon on üha sagedamaks muutuv nähtus ja on juba tõestatud, et loodud võltspildid pettavad kasutajaid paljudes erinevates kontekstides. Mäletate seda fotot paavst Franciscusest, mis liikus ringi ja kus ta kandis pikka valget jope? See pilt ei olnud tõeline, kuid paljud arvasid, et see oli. Pildid pole enam see hõbekuul, mida inimesed kunagi eeldasid.

Allikas: Generative AI

Arvestades, et tänapäeval on juba võimatu tugineda piltidele kui millegi ainsale tõendile, kusjuures järgmiseks on videod tükeldamisel on raskem kui kunagi varem toetuda kõigele, mida näete Internetis olevat päris.

Stabiilsus AI stabiilne video hajutamine on kohutavalt hea

Praegu on see siiski alles testimisel

Stable Video Diffusion järgneb eelmisel aastal välja antud "avatud kaalude" mudelile Stable Diffusion mis vaieldamatult käivitas pildigeneraatorite tehisintellekti laine, mängides vähemalt märkimisväärset rolli osa. Selle konkreetse mudeli videovorm on sama juurdepääsetav ja seda saavad kasutada kõik, kellel on mõni neist parimad Nvidia GPU-d.

See, kuidas see konkreetne mudel töötab, on päris huvitav ja praegu on üsna piiratud, kui palju see tegelikult suudab. Nagu Stability AI ütleb: "Kuigi me uuendame oma mudeleid innukalt uusimate edusammudega ja töötame selle nimel, et lisage oma tagasiside, see mudel ei ole mõeldud kasutamiseks reaalses maailmas ega kommertsrakendustes etapp. Teie arusaam ja tagasiside ohutuse ja kvaliteedi kohta on selle mudeli viimistlemisel selle lõplikuks väljalaskmiseks olulised.

Kasutajatele on saadaval kaks praegust mudelit; esimene on SVD ja teine on SVD-XT. Need võivad genereerida vastavalt 14 ja 25 kaadrit kaadrisagedusega, mida saab kohandada vahemikus 3 kuni 30 kaadrit sekundis. Seda tüüpi tehisintellektiga suudab nii palju ära teha, on vaid aja küsimus, millal inimesed saavad kellegi kodus oma sügavaid võltsinguid valmistada.

Stabiilset video hajutamist on tõenäoliselt lihtne seadistada

See ei pruugi olla hea

Kui Stable Diffusion esimest korda õhku tõusis, treenis üks mu sõber modelli oma sõbra näole, et lisada see sõber Metallist Gear Solid universum naeruväärselt tobedas eritellimusel valmistatud galeriis. See oli päris lahe kingitus ja väga lõbus töötada ja jamada (sõber andis täieliku nõusoleku modelli treenimiseks oma nägu), aga ma mõtlen tollesse aega tagasi, praegu täiesti kohkudes.

Meie sadade piltidega, mis on väljas, on inimestel juba olnud võimalik modelle koolitada inimeste näod, kes oma nõusolekut ei anna, peaaegu kõik, kellel on endast avalikult fotosid vaadatav. Kujutage nüüd ette, et saate luua kellestki pildi ja seejärel animeerida seda joonist kasutades Stable Video Diffusion?

Sellel on palju tagajärgi, alates privaatsuse rikkumistest kuni ebaseadusliku piirimaile. Olen juba kuulnud naistest sisuloojate ruumis, kes on mulle rääkinud fännide AI-st, kes loob nende kohta pornograafiat ja saates selle neile tagasi, peaaegu nagu oleksid need "fännid" uhked selle üle, et nad on rikkunud teise inimese privaatsust. See on kestnud juba üle aasta ja see on mulle tuttav näide. See pole kaugeltki selliste tööriistade ainus mõju privaatsusele ja tegelikult läheb see tõenäoliselt ainult hullemaks.

Stabiilse video difusiooni näited on juba saadaval

Hirmutav, kuid uskumatu

Ülaltoodud video, mille on välja andnud Stability AI, näitab stabiilse video hajutamise võimsust. Teised on samuti näidanud tehnoloogia võimsust, näidates, kuidas see suudab väikeses, mõnesekundilises aknas praktiliselt kõik liikuma panna ja animeerida. See võtab palju arvutusvõimsust, kuid on palju teenuseid, nagu Hugging Face ja Replicator, mille abil inimesed saavad sisuliselt töötlemisaega rentida. Käivitasin seda kohapeal, kasutades allolevat pilti (levitati koos tarkvaraga Stable Video DIffusion), et testida, kui hea see oli.

Ma kahtlustan, et ülaltoodud pilt on AI loodud, kuna ma ei leia sellele võrgust täpseid vasteid. Sellest hoolimata on see ideaalne kandidaat testimiseks. Käivitasin selle pildiga kohapeal Stable Video Diffusion mudelit ja veidi alla tunni pärast oli järgmine neljasekundiline klipp.

See on šokeerivalt hea. Kuigi see on praegu madala kaadrisagedusega, nagu juba mainitud, on see arendusjärgus mudel, mis pole veel mõeldud üldiseks kasutamiseks. Proovisin enda fotoga, fotoga udus saabuvast rongist.

Kahjuks ei olnud tulemus nii hea, kuigi tänu udule oli tehisintellekti jaoks raskem töötada.

Muljetavaldavalt näis ikka aru saavat, et rong oli noh, rong. See lihtsalt liikus teisele rongiteele. Siiski on see beetatarkvara ja tulemused on sellegipoolest muljetavaldavad.

Stabiilne video hajutamine on alles algus

Olenemata sellest, mida te selle tehnika muljetavaldava kohta arvate, on see alles algus. See on esimene avatud lähtekoodiga mudel, mille inimesed kahtlemata lahti võtavad, täiustavad ja võib-olla kasutavad seda eetikast hoolimata. Interneti-meedia tulevik on ohus, suuresti tänu tehisintellekti videole ja piltidele ning kui need muutuvad paremaks ja parem, sellel on kaugeleulatuvad tagajärjed, mis avavad järgmiste kuude jooksul mitu Pandora laeka versiooni ja aastad.

Arvutiteadlasena on tehnoloogia nii uskumatult muljetavaldav, et ajab mõistuse pähe, ning generatiivse AI maastiku kiire kasv on nii muljetavaldav. Kuid nagu a isik, see tehnoloogia hirmutab mind.