Mes žaidėme su „Stable Video Diffusion“ ir tai rodo baisią AI gilių klastotės ateitį

„Stable Video Diffusion“ yra čia ir, nors tai tikrai šaunu, tai kelia nerimą keliančią ateitį, kai kalbama apie gilius klastotes.

Key Takeaways

Generatyvusis dirbtinis intelektas, pvz., „Stable Video Diffusion“, gali sukurti labai tikroviškus ir pritaikomus vaizdus bei vaizdo įrašus pagal pateiktus raginimus.
Dirbtinio intelekto sukurtų vaizdų ir vaizdo įrašų naudojimas dezinformacijai ir privatumo pažeidimams vis dažniau naudojamas, o tai kelia iššūkį vaizdinių įrodymų internete patikimumui.
Stabili vaizdo įrašų sklaida yra tik pradžia, o dirbtinio intelekto technologijai toliau tobulėjant, internetinės žiniasklaidos ateičiai kyla grėsmė dėl galimo netinkamo naudojimo ir etinių problemų.

AI revoliucija buvo vienas didžiausių ir svarbiausių 2023 m. pasiekimų. Tokiems žmonėms, kaip OpenAI, apėmus pasaulį su ChatGPT ir kitais, pvz., „Bing Chat“ ir „Google Bard“, generatyvus AI yra gana galinga technologija. Kur kelia nerimą AI vaizdo generavimas, įrankiai, galintys sukurti pagal užsakymą pagamintus vaizdus pagal jiems pateiktus raginimus. Dabar, naudojant stabilų vaizdo sklaidą, viskas dar labiau pablogės.

Kalbant apie technologijas, aš toli gražu nebijau ir manau, kad generatyvusis dirbtinis intelektas gali būti naudojamas tiek prieinamumas ir linksmi kontekstai, tačiau neabejotina, kad technologija gali būti panaudota ir blogiui. Dezinformacija yra vis dažnesnis reiškinys, ir jau buvo įrodyta, kad sukurti netikri vaizdai gali apgauti vartotojus įvairiuose kontekstuose. Prisimenate tą popiežiaus Pranciškaus nuotrauką, kuri ėjo aplinkui, kur jis vilkėjo ilgą baltą pūkuotą striukę? Tas vaizdas buvo netikras, bet daugelis žmonių taip manė. Vaizdai nebėra sidabrinis įrodymas, kurio žmonės kadaise tikėjosi.

Šaltinis: Generative AI

Atsižvelgiant į tai, kad šiais laikais jau neįmanoma pasikliauti vaizdais kaip vieninteliu kažko įrodymu, o vaizdo įrašai yra šalia pjaustant, bus sunkiau nei bet kada pasikliauti tuo, ką matote internete tikras.

Stabilumo AI stabili vaizdo sklaida yra siaubingai gera

Tačiau dabar tik bandoma

„Stable Video Diffusion“ tęsia praėjusiais metais išleistą „Stable Diffusion“ – „atvirų svorių“ modelį neabejotinai paskatino vaizdų generatorių AI bangą, bent jau suvaidinusi reikšmingą vaidmenį dalis. Šio konkretaus modelio vaizdo įrašų forma yra tokia pat prieinama ir gali būti naudojama bet kuriam asmeniui, kuris turi vieną iš šių geriausi Nvidia GPU.

Tai, kaip veikia šis konkretus modelis, yra gana įdomu ir šiuo metu yra gana ribota, kiek jis iš tikrųjų gali padaryti. Kaip teigia „Stability AI“: „Nors mes noriai atnaujiname savo modelius su naujausiais pasiekimais ir stengiamės įtraukite savo atsiliepimus, šis modelis nėra skirtas realaus pasaulio ar komercinėms programoms etapas. Jūsų įžvalgos ir atsiliepimai apie saugą ir kokybę yra svarbūs tobulinant šį modelį, kad jis būtų išleistas.

Šiuo metu vartotojai gali naudoti du modelius; pirmasis yra SVD, o antrasis - SVD-XT. Jie gali generuoti atitinkamai 14 ir 25 kadrus, kai kadrų dažnis yra pritaikomas nuo 3 iki 30 FPS. Su tokiu dirbtiniu intelektu galinčiu nuveikti tiek daug, tik laiko klausimas, kada žmonės galės pasigaminti savo gilių padirbinių kieno nors namuose.

Stabilią vaizdo sklaidą greičiausiai bus lengva nustatyti

Tai nebūtinai yra geras dalykas

Kai „Stable Diffusion“ pirmą kartą pakilo, mano draugas apmokė modelį ant savo draugo veido, kad pridėtų minėtą draugą į Metalinė pavara solidžiai visata juokingai kvailoje pagal užsakymą pagamintoje galerijoje. Tai buvo gana šauni dovana, be galo smagu dirbti ir su ja susitvarkyti (draugas davė visišką sutikimą, kad modelis būtų apmokytas ant jo veido), bet aš galvoju apie tą laiką, dabar, visiškai pasibaisėjęs.

Turėdami šimtus mūsų vaizdų, žmonės jau galėjo mokyti modelius žmonių, kurie neduoda sutikimo, veidai, beveik visi, kurie viešai turi savo nuotraukų matyti. Dabar įsivaizduokite, kad galite sukurti kažkieno atvaizdą ir tada animuoti tą piešinį naudodami „Stable Video Diffusion“?

Tai turi daug pasekmių, pradedant privatumo pažeidimais ir baigiant neteisėtais pasienio pažeidimais. Jau girdėjau iš moterų turinio kūrėjų erdvėje, kurios papasakojo apie gerbėjų AI, kuriančių jų pornografiją ir siunčiant jiems atgal, beveik taip, lyg tie „gerbėjai“ didžiuotųsi tuo, kad pažeidė kito žmogaus privatumą. Tai tęsiasi daugiau nei metus ir yra man žinomas pavyzdys. Tai jokiu būdu nėra vienintelis tokių įrankių privatumas, o iš tikrųjų tai greičiausiai tik pablogės.

Stabilios vaizdo sklaidos pavyzdžiai jau yra

Baisu, bet neįtikėtina

Aukščiau pateiktame vaizdo įraše, kurį išleido „Stability AI“, parodyta „Stable Video Diffusion“ galia. Kiti taip pat demonstravo technologijos galią, demonstruodami, kaip ji gali priversti praktiškai bet ką judėti ir būti animuota mažame kelių sekundžių langelyje. Tam reikia daug skaičiavimo galios, tačiau yra daugybė paslaugų, tokių kaip „Hugging Face“ ir „Replicator“, kurių apdorojimo laiką žmonės iš esmės gali išsinuomoti. Paleidau jį vietoje, naudodamas toliau pateiktą vaizdą (platintą su „Stable Video DIffusion“ programine įranga), kad patikrinčiau, ar jis geras.

Įtariu, kad aukščiau pateiktas vaizdas yra sukurtas dirbtiniu intelektu, nes negaliu rasti tikslių jo atitikčių internete. Nepaisant to, tai puikus kandidatas bandymams. Stable Video Diffusion modelį paleidau vietoje su šiuo vaizdu ir vos per mažiau nei valandą turėjau šį keturių sekundžių klipą.

Tai šokiruojančiai gerai. Nors dabar, kaip jau minėta, kadrų dažnis yra mažas, tai yra kuriamas modelis, kuris dar nėra skirtas bendram naudojimui. Bandžiau su savo nuotrauka, traukinio, atvažiuojančio migloje, nuotrauka.

Deja, rezultatas nebuvo toks geras, nors dirbtinio intelekto nuotrauka buvo sudėtingesnė dėl rūko.

Įspūdingai atrodė, kad vis tiek suprato, kad traukinys, na, traukinys. Jis tiesiog perėjo į kitą traukinio kelią. Vis dėlto tai yra beta programinė įranga, o rezultatai vis dėlto įspūdingi.

Stabili vaizdo sklaida yra tik pradžia

Nepriklausomai nuo to, ką galvojate apie tai, kokia įspūdinga yra ši technologija, tai tik pradžia. Tai yra pirmasis atvirojo kodo modelis, kurį žmonės neabejotinai išardys, patobulins ir galbūt pasinaudos, nesidomėdami etika. Internetinės žiniasklaidos ateičiai gresia pavojus, daugiausia dėl AI vaizdo įrašų ir vaizdų, o jiems tobulėjant ir geriau, yra toli siekiančių pasekmių, kurios per ateinančius mėnesius atvers kelias Pandoros skrynios versijas ir metų.

Kaip kompiuterių mokslininkas, ši technologija yra tokia neįtikėtinai įspūdinga, kad užkliūva protu, o greitas generatyvaus AI kraštovaizdžio augimas yra toks įspūdingas. Tačiau, kaip a asmuo, ši technologija mane gąsdina.