Mēs spēlējām ar Stable Video Diffusion, un tas norāda uz biedējošu AI dziļo viltojumu nākotni

click fraud protection

Stabila video difūzija ir klāt, un, lai gan tas noteikti ir forši, tas nozīmē satraucošu nākotni, kad runa ir par dziļiem viltojumiem.

Key Takeaways

  • Ģeneratīvā AI, piemēram, Stable Video Diffusion, var izveidot ļoti reālistiskus un pielāgojamus attēlus un videoklipus, pamatojoties uz sniegtajām uzvednēm.
  • AI ģenerētu attēlu un videoklipu izmantošana dezinformācijas un privātuma pārkāpumiem kļūst arvien izplatītāka, tādējādi apšaubot vizuālo pierādījumu ticamību internetā.
  • Stabila video izplatība ir tikai sākums, un, AI tehnoloģijai turpinot attīstīties, tiešsaistes mediju nākotni apdraud iespējama ļaunprātīga izmantošana un ētiskas bažas.

AI revolūcija ir bijis viens no lielākajiem un svarīgākajiem sasniegumiem 2023. gadā. Tā kā OpenAI pārņem pasauli ar ChatGPT un citiem, piemēram, Bing Chat un Google Bard, ģeneratīvā AI ir diezgan spēcīga tehnoloģija. Kur tas kļūst satraucoši AI attēlu ģenerēšanarīki, kas var izveidot pielāgotus attēlus, pamatojoties uz tiem sniegtajām uzvednēm. Tagad, izmantojot stabilu video izplatību, lietas kļūs vēl sliktākas.

Es esmu tālu no bailēm, kad runa ir par tehnoloģijām, un es domāju, ka ģeneratīvajam AI ir daudz pielietojuma abās jomās. pieejamība un jautri konteksti, taču nav šaubu, ka šo tehnoloģiju var izmantot arī ļaunumam. Dezinformācija ir parādība, kas kļūst arvien biežāka, un jau ir pierādīts, ka ģenerēti viltoti attēli var maldināt lietotājus daudzos dažādos kontekstos. Vai atceraties pāvesta Franciska fotoattēlu, kurā viņš bija ģērbies garā baltā jakā? Šis attēls nebija īsts, bet daudzi cilvēki tā domāja. Attēli vairs nav sudraba pierādījumu lode, kādu cilvēki kādreiz bija gaidījuši.

Avots: ģeneratīvais AI

Ņemot vērā to, ka jau tagad ir neiespējami paļauties uz attēliem kā vienīgo pierādījumu kaut kam, un videoklipi ir nākamie griešanas blokā būs grūtāk nekā jebkad agrāk paļauties uz kaut ko, ko redzat internetā īsts.

Stabilitātes AI stabilā video difūzija ir šausmīgi laba

Tomēr tagad tas ir tikai testēšanā

Stable Video Diffusion seko pagājušajā gadā izdotajam Stable Diffusion, "atvērto svaru" modelim kas neapšaubāmi aizsāka AI attēlu ģeneratoru vilni, vismaz spēlējot nozīmīgu daļa. Šī konkrētā modeļa video forma ir tikpat pieejama, un to var palaist ikviens, kam ir kāds no labākie Nvidia GPU.

Tas, kā šis konkrētais modelis darbojas, ir diezgan interesants, un šobrīd tas ir diezgan ierobežots, cik daudz tas patiešām var paveikt. Kā norāda Stability AI: "Lai gan mēs ar nepacietību atjauninām savus modeļus ar jaunākajiem sasniegumiem un strādājam, lai iekļaujiet savas atsauksmes, šis modelis nav paredzēts reālai vai komerciālai lietošanai posms. Jūsu ieskats un atsauksmes par drošību un kvalitāti ir svarīgas, lai uzlabotu šo modeli tā iespējamai izlaišanai."

Lietotājiem ir pieejami divi pašreizējie modeļi; pirmais ir SVD, bet otrais ir SVD-XT. Tie var ģenerēt attiecīgi 14 un 25 kadrus ar kadru ātrumu, ko var pielāgot no 3 līdz 30 kadriem sekundē. Ar šāda veida mākslīgo intelektu, kas spēj paveikt tik daudz, ir tikai laika jautājums, kad cilvēki varēs mājās pagatavot savus dziļos viltojumus.

Stabilu video difūziju, visticamāk, būs viegli iestatīt

Tas ne vienmēr ir laba lieta

Kad Stable Diffusion pirmo reizi pacēlās, mans draugs apmācīja modeli savam draugam, lai pievienotu šo draugu Metal Gear Solid Visums smieklīgi muļķīgā, pēc pasūtījuma izgatavotā galerijā. Tā bija diezgan forša dāvana, ar kuru bija ļoti jautri strādāt un ar to nejaukt (draugs deva pilnīgu piekrišanu, lai modele tiktu trenēta uz viņa sejas), bet es domāju atpakaļ uz to laiku, tagad, pilnīgi šausmās.

Izmantojot simtiem mūsu attēlu, kas ir pieejami, cilvēkiem jau ir bijis iespējams apmācīt modeļus to cilvēku sejas, kuri nedod savu piekrišanu, gandrīz ikviens, kam ir publiski redzami viņu fotoattēli skatāms. Tagad iedomājieties, ka varat ģenerēt kāda cilvēka attēlu un pēc tam animēt šo zīmējumu, izmantojot stabilu video difūziju?

Tam ir daudz seku, sākot no privātuma pārkāpumiem līdz nelikumīgiem robežlīnijas pārkāpumiem. Esmu jau dzirdējis no sievietēm satura veidotāju telpā, kuras man ir stāstījušas par fanu AI, kas rada viņu pornogrāfiju un nosūtot to viņiem atpakaļ, gandrīz tā, it kā šie "fani" būtu lepni par to, ka viņi ir pārkāpuši citas personas privātumu. Tas notiek jau vairāk nekā gadu, un tas ir man pazīstams piemērs. Tā nekādā gadījumā nav vienīgā šādu rīku ietekme uz privātumu, un patiesībā tas, visticamāk, tikai pasliktināsies.

Stabilas video difūzijas piemēri jau ir pieejami

Biedējoši, bet neticami

Iepriekš minētais videoklips, ko izlaida Stability AI, parāda stabilas video difūzijas spēku. Arī citi ir parādījuši tehnoloģijas jaudu, demonstrējot, kā tā var praktiski jebko pārvietot un animēt nelielā, dažu sekunžu logā. Tas aizņem daudz skaitļošanas jaudas, taču ir daudz pakalpojumu, piemēram, Hugging Face un Replicator, ar kuriem cilvēki būtībā var iznomāt apstrādes laiku. Es to palaidu lokāli, izmantojot tālāk redzamo attēlu (izplatīts ar Stable Video DIffusion programmatūru), lai pārbaudītu, cik tas bija labs.

Iepriekš minētais attēls, manuprāt, ir AI ģenerēts, jo es nevaru atrast precīzas atbilstības tam tiešsaistē. Tomēr tas ir ideāls kandidāts testēšanai. Es lokāli izmantoju Stable Video Diffusion modeli, izmantojot šo attēlu, un pēc nepilnas stundas man bija šāds četru sekunžu klips.

Tas ir šokējoši labi. Lai gan tagad, kā jau minēts, tam ir zems kadru nomaiņas ātrums, šis ir izstrādes stadijā esošais modelis, kas vēl nav paredzēts vispārējai lietošanai. Mēģināju ar savu fotogrāfiju, fotogrāfiju, kurā redzams vilciens, kas ierodas miglā.

Diemžēl rezultāts nebija tik labs, lai gan, pateicoties miglai, AI bija grūtāk strādāt ar to.

Iespaidīgi, tas joprojām likās saprast, ka vilciens ir, nu, vilciens. Tas vienkārši beidzās pāriet uz otru vilciena sliežu ceļu. Tomēr šī ir beta programmatūra, un rezultāti tomēr ir iespaidīgi.

Stabila video difūzija ir tikai sākums

Neatkarīgi no tā, ko jūs domājat par to, cik iespaidīga ir šī tehnoloģija, tas ir tikai sākums. Šis ir pirmais atvērtā pirmkoda modelis, ko cilvēki neapšaubāmi izjauks, uzlabos un, iespējams, izmantos, neievērojot ētiku. Tiešsaistes mediju nākotne ir apdraudēta, galvenokārt pateicoties AI video un attēliem, un, tiem kļūstot labākiem un labāk, ir tālejošas sekas, kas nākamo mēnešu laikā atvērs vairākas Pandoras lādes versijas un gadiem.

Kā datorzinātniekam šī tehnoloģija ir tik neticami iespaidīga, ka tā satrauc prātu, un ģeneratīvās mākslīgā intelekta ainavas straujā izaugsme ir tik iespaidīga. Tomēr, kā a persona, šī tehnoloģija mani biedē.