Stable Video Diffusion on täällä, ja vaikka se on varmasti siistiä, se lupaa huolestuttavan tulevaisuuden, kun kyse on syvästä väärennöksestä.
Avaimet takeawayt
- Generatiivisella tekoälyllä, kuten Stable Video Diffusionilla, on mahdollisuus luoda erittäin realistisia ja muokattavissa olevia kuvia ja videoita annettujen kehotteiden perusteella.
- Tekoälyn luomien kuvien ja videoiden käyttö disinformaatioon ja yksityisyyden loukkauksiin on yleistymässä, mikä haastaa visuaalisen todisteen luotettavuuden Internetissä.
- Vakaa videon leviäminen on vasta alkua, ja AI-tekniikan edistyessä verkkomedian tulevaisuutta uhkaavat mahdollinen väärinkäyttö ja eettiset huolenaiheet.
Tekoälyvallankumous on ollut yksi vuoden 2023 suurimmista ja tärkeimmistä edistysaskeleista. Koska OpenAI: n kaltaiset ihmiset valtaavat maailmaa ChatGPT: n ja muiden, kuten Bing Chatin ja Google Bardin, seurassa, generatiivinen tekoäly on melko tehokas tekniikka. Huolestuttava paikka on AI-kuvan luominen, työkalut, jotka voivat luoda räätälöityjä kuvia heille annettujen kehotteiden perusteella. Nyt, Stable Video Diffusion -tilanteessa, asiat ovat pahenemassa entisestään.
En ole kaukana pelosta teknologian suhteen, ja uskon, että generatiivisella tekoälyllä on paljon käyttöä molemmissa saavutettavuus ja hauskoja konteksteja, mutta ei ole epäilystäkään siitä, että tekniikkaa voidaan käyttää myös pahaan. Disinformaatio on yhä yleisempi ilmiö, ja väärennettyjen kuvien on jo osoitettu huijaavan käyttäjiä monissa eri yhteyksissä. Muistatko sen kuvan paavi Franciscuksesta, joka kulki ympäriinsä ja jossa hänellä oli yllään pitkä valkoinen puffitakki? Kuva ei ollut totta, mutta monet luulivat sen olevan. Kuvat eivät ole enää se hopealuodi, jota ihmiset aiemmin odottivat niiden olevan.
Lähde: Generatiivinen AI
Ottaen huomioon, että on jo nykyään mahdotonta luottaa kuviin ainoana todisteena jostakin, kun videot ovat seuraavana leikkuupalkin kohdalla tulee olemaan vaikeampaa kuin koskaan luottaa siihen, mitä näet Internetissä todellinen.
Stability AI: n Stable Video Diffusion on pelottavan hyvä
Se on kuitenkin vasta testissä
Stable Video Diffusion on jatkoa viime vuonna julkaistulle Stable Diffusion -mallille, "avoimien painojen" mallille joka käynnisti kuvageneraattoreiden tekoälyaallon, jolla oli ainakin merkittävä rooli osa. Tämän mallin videomuoto on yhtä helppokäyttöinen, ja sitä voivat käyttää kuka tahansa, jolla on jokin näistä parhaat Nvidia GPU: t.
Tämän mallin toiminta on melko mielenkiintoista, ja tällä hetkellä se on melko rajallinen sen suhteen, kuinka paljon se todella voi tehdä. Kuten Stability AI sanoo: "Päivitämme mallejamme innokkaasti uusimmilla parannuksilla ja pyrimme sisällytä palautteesi, tätä mallia ei ole tarkoitettu todellisiin tai kaupallisiin sovelluksiin vaiheessa. Tietosi ja palautteesi turvallisuudesta ja laadusta ovat tärkeitä tämän mallin jalostamiseksi sen mahdollista julkaisua varten."
Käyttäjien käytettävissä on kaksi nykyistä mallia; ensimmäinen on SVD ja toinen SVD-XT. Nämä voivat tuottaa 14 ja 25 kuvaa vastaavasti kehysnopeuksilla, jotka voidaan mukauttaa välillä 3 ja 30 FPS. Kun tällainen tekoäly pystyy tekemään niin paljon, on vain ajan kysymys, milloin ihmiset voivat valmistaa omia syviä väärennöksiä kenenkään kotona.
Stable Video Diffusion on todennäköisesti helppo asentaa
Se ei välttämättä ole hyvä asia
Kun Stable Diffusion nousi ensimmäisen kerran, eräs ystäväni koulutti mallin ystävänsä kasvoille lisätäkseen kyseisen ystävän Metalli Gear Solid universumi naurettavan typerässä mittatilaustyönä tehdyssä galleriassa. Se oli aika siisti lahja ja hauskaa työskennellä ja sotkea (ystävä antoi täyden suostumuksen mallin kouluttamiseen hänen kasvoilleen), mutta ajattelen tuohon aikaan, nyt, täysin kauhistuneena.
Satojen meistä olevien kuvien ansiosta ihmiset ovat jo voineet kouluttaa malleja ihmisten kasvot, jotka eivät anna suostumustaan, lähes kaikki, joilla on julkisia kuvia itsestään katseltavissa. Kuvittele nyt, että pystyt luomaan kuvan jostakin ja pystyisit sitten animoimaan sen piirustuksen Stable Video Diffusionin avulla?
Tällä on monia seurauksia, aina yksityisyyden loukkauksista laittomiin raja-alueisiin. Olen jo kuullut sisällöntuottajatilan naisilta, jotka ovat kertoneet fanien tekoälystä, joka tuottaa heistä pornografiaa ja lähettää sen heille takaisin, melkein kuin nuo "fanit" olisivat ylpeitä siitä, että he olivat loukannut toisen ihmisen yksityisyyttä. Tätä on jatkunut yli vuoden, ja se on minulle tuttu esimerkki. Se ei suinkaan ole tällaisten työkalujen ainoa yksityisyysvaikutus, ja itse asiassa se todennäköisesti vain pahenee.
Esimerkkejä vakaasta videodiffuusiosta on jo saatavilla
Pelottavaa mutta uskomatonta
Yllä oleva Stability AI: n julkaisema video näyttää Stable Video Diffusionin voiman. Toiset ovat myös osoittaneet tekniikan tehoa ja osoittaneet, kuinka se saa käytännössä kaiken liikkumaan ja animoitumaan pienessä, muutaman sekunnin ikkunassa. Se vie paljon laskentatehoa, mutta on olemassa paljon palveluita, kuten Hugging Face ja Replicator, joiden avulla ihmiset voivat vuokrata käsittelyaikaa. Suoritin sen paikallisesti käyttämällä alla olevaa kuvaa (jaettu Stable Video DIffusion -ohjelmiston kanssa) testatakseni, kuinka hyvä se oli.
Epäilen, että yllä oleva kuva on tekoälyn luoma, koska en löydä sille tarkkoja vastaavuuksia verkosta. Siitä huolimatta se on täydellinen ehdokas testattavaksi. Ajoin Stable Video Diffusion -mallin paikallisesti tällä kuvalla, ja vajaassa tunnissa minulla oli seuraava neljän sekunnin leike.
Tämä on järkyttävän hyvä. Vaikka se on nyt alhaisella kuvataajuudella, kuten jo mainittiin, tämä on kehitysvaiheessa oleva malli, jota ei ole vielä tarkoitettu yleiseen käyttöön. Yritin omalla valokuvallani, valokuvalla sumussa saapuvasta junasta.
Valitettavasti tulos ei ollut yhtä hyvä, vaikka se olikin haastavampi valokuva tekoälylle sumun ansiosta.
Vaikuttavalla tavalla se näytti silti ymmärtävän, että juna oli juna. Se vain päätyi siirtymään toiselle junaradalle. Tämä on kuitenkin beta-ohjelmisto, ja tulokset ovat kuitenkin vaikuttavia.
Stable Video Diffusion on vasta alkua
Riippumatta siitä, mitä ajattelet tämän tekniikan vaikuttavuudesta, se on vasta alkua. Tämä on ensimmäinen avoimen lähdekoodin malli, jonka ihmiset epäilemättä ottavat osiin, parantavat ja mahdollisesti hyödyntävät etiikasta piittaamatta. Verkkomedian tulevaisuus on vaarassa, suurelta osin tekoälyvideon ja kuvien ansiosta, ja kun ne paranevat ja parempi, sillä on kauaskantoisia seurauksia, jotka avaavat useita versioita Pandoran lippasta seuraavien kuukausien aikana ja vuosia.
Tietojenkäsittelytieteilijänä tekniikka on niin uskomattoman vaikuttavaa, että se saa mielen käsistä, ja generatiivisen tekoälyn nopea kasvu on niin vaikuttavaa. Kuitenkin kuten a henkilö, tämä tekniikka pelottaa minua.