Hrali sme so Stable Video Diffusion a signalizuje to desivú budúcnosť hlbokých falzifikátov AI

Stable Video Diffusion je tu a hoci je to určite skvelé, znamená to znepokojujúcu budúcnosť, pokiaľ ide o hlboké falzifikáty.

Kľúčové poznatky

Generatívna AI, podobne ako Stable Video Diffusion, má potenciál vytvárať vysoko realistické a prispôsobiteľné obrázky a videá na základe poskytnutých výziev.
Používanie obrázkov a videí generovaných AI na dezinformácie a porušovanie súkromia je čoraz bežnejšie, čo spochybňuje spoľahlivosť vizuálnych dôkazov na internete.
Stable Video Diffusion je len začiatok a keďže technológia AI neustále napreduje, budúcnosť online médií je ohrozená potenciálnym zneužitím a etickými obavami.

Revolúcia AI bola jedným z najväčších a najdôležitejších pokrokov roku 2023. S takými, ako OpenAI berú svet útokom pomocou ChatGPT a ďalšími, ako sú Bing Chat a Google Bard, je generatívna AI dosť výkonná technológia. Kde to začína byť znepokojujúce generovanie obrazu AI, nástroje, ktoré dokážu vytvárať obrázky na mieru na základe výziev, ktoré im boli poskytnuté. Teraz, so Stable Video Diffusion, sa veci ešte zhoršia.

Nemám ani zďaleka strach, pokiaľ ide o technológiu, a myslím si, že generatívna AI má veľa využití v oboch prístupnosť a zábavné kontexty, ale niet pochýb o tom, že túto technológiu možno použiť aj na zlo. Dezinformácie sú fenoménom, ktorý sa stáva čoraz častejším a už bolo preukázané, že generované falošné obrázky klamú používateľov v mnohých rôznych kontextoch. Pamätáte si tú fotku pápeža Františka, ktorá išla okolo, kde mal oblečenú dlhú bielu bundu? Ten obraz nebol skutočný, ale mnohí si mysleli, že je. Obrázky už nie sú tým strieborným dôkazom, že to ľudia kedysi očakávali.

Zdroj: Generative AI

Vzhľadom na to, že v dnešnej dobe je už nemožné spoliehať sa na obrázky ako na jediný dôkaz niečoho, pričom na rade sú videá na sekacom bloku bude ťažšie ako kedykoľvek predtým spoliehať sa na čokoľvek, čo vidíte na internete ako reálny.

Stabilita AI Stable Video Diffusion je desivo dobrá

Zatiaľ je to však len v testovaní

Stable Video Diffusion nadväzuje na Stable Diffusion vydanú minulý rok, model s „otvorenými váhami“. čo pravdepodobne odštartovalo vlnu AI obrazových generátorov, prinajmenšom hrajúcich význam časť. Video forma tohto konkrétneho modelu je rovnako prístupná a môže ju spustiť každý, kto má jednu z nich najlepšie GPU Nvidia.

To, ako tento konkrétny model funguje, je celkom zaujímavé a v súčasnosti je dosť obmedzené v tom, koľko toho skutočne dokáže. Ako hovorí Stability AI: „Zatiaľ čo netrpezlivo aktualizujeme naše modely o najnovšie vylepšenia a pracujeme na zahrňte svoju spätnú väzbu, tento model nie je určený pre reálny svet alebo komerčné aplikácie etapa. Vaše postrehy a spätná väzba týkajúce sa bezpečnosti a kvality sú dôležité pre zdokonalenie tohto modelu pre jeho prípadné vydanie."

Používatelia majú k dispozícii dva aktuálne modely; prvý je SVD a druhý je SVD-XT. Tieto môžu generovať 14 a 25 snímok pri obnovovacej frekvencii prispôsobiteľnej medzi 3 a 30 FPS. S týmto druhom AI, ktorý dokáže urobiť tak veľa, je len otázkou času, kedy si ľudia budú môcť pripraviť svoje vlastné hlboké falzifikáty doma u kohokoľvek.

Nastavenie stabilnej videodifúzie bude pravdepodobne jednoduché

To nie je nevyhnutne dobrá vec

Keď sa Stable Diffusion prvýkrát rozbehla, môj priateľ natrénoval model na tvári svojho priateľa, aby ho pridal do Metal Gear Solid vesmír v smiešne hlúpej galérii na mieru. Bol to celkom skvelý darček a veľa zábavy pri práci a motaní sa s ním (priateľ dal plný súhlas, aby si nechal natrénovať modelku na tvári), ale myslím, že vtedy som bol úplne zdesený.

So stovkami našich obrázkov, ktoré sú tam vonku, už bolo možné, aby ľudia trénovali modelky tváre ľudí, ktorí nedajú svoj súhlas, takmer každého, kto má svoje fotografie verejne viditeľné. Teraz si predstavte, že by ste dokázali vygenerovať obraz niekoho a potom by ste mohli túto kresbu animovať pomocou stabilnej videodifúzie?

Má to mnoho dôsledkov, od porušovania súkromia až po hraničnú nezákonnosť. Už som počul od žien v priestore tvorcov obsahu, ktoré mi povedali o fanúšikoch, ktorí umelou inteligenciou generujú ich pornografiu a posielať im to späť, skoro ako keby tí "fanúšikovia" boli hrdí na to, že narušili súkromie inej ľudskej bytosti. Toto sa deje už vyše roka a je to príklad, ktorý poznám. V žiadnom prípade to nie je jediný vplyv nástrojov, ako sú tieto, na súkromie a v skutočnosti sa to pravdepodobne len zhorší.

Príklady stabilnej videodifúzie sú už k dispozícii

Strašidelné, ale neuveriteľné

Vyššie uvedené video, ktoré vydala Stability AI, ukazuje silu Stable Video Diffusion. Iní tiež ukázali silu tejto technológie a ukázali, ako dokáže prakticky čokoľvek rozhýbať a ako animovať v malom, niekoľkosekundovom okne. Vyžaduje si to veľa výpočtového výkonu, ale existuje množstvo služieb ako Hugging Face a Replicator, ktoré si ľudia môžu v podstate prenajať na dobu spracovania. Spustil som to lokálne pomocou obrázka nižšie (distribuovaného so softvérom Stable Video DIFfusion), aby som otestoval, aké to bolo dobré.

Vyššie uvedený obrázok je pravdepodobne vytvorený AI, pretože nemôžem nájsť presné zhody online. Napriek tomu je to perfektný kandidát na testovanie. Lokálne som spustil model Stable Video Diffusion s týmto obrázkom a za menej ako hodinu som mal nasledujúci štvorsekundový klip.

Toto je šokujúco dobré. Aj keď je teraz pri nízkej snímkovej frekvencii, ako už bolo spomenuté, ide o model vo vývoji, ktorý zatiaľ nie je určený na všeobecné použitie. Skúsil som to s vlastnou fotkou, fotkou vlaku prichádzajúceho v hmle.

Bohužiaľ, výsledok nebol taký dobrý, aj keď to bola pre AI náročnejšia fotografia na prácu vďaka hmle.

Pôsobivo sa zdalo, že stále chápe, že vlak je, no, vlak. Skončilo to tak, že sa presunuli na druhú koľaj. Napriek tomu ide o beta softvér a výsledky sú napriek tomu pôsobivé.

Stabilná videodifúzia je len začiatok

Bez ohľadu na to, čo si myslíte o tom, aká pôsobivá je táto technológia, je to len začiatok. Toto je prvý model s otvoreným zdrojovým kódom, ktorý si ľudia nepochybne rozoberú, vylepšia a možno aj využijú s nedostatočnou starostlivosťou o etiku. Budúcnosť online médií je ohrozená, a to najmä vďaka videám a obrázkom umelej inteligencie a ako sa budú zlepšovať lepšie, existujú ďalekosiahle dôsledky, ktoré v priebehu nasledujúcich mesiacov otvoria viacero verzií Pandorinej skrinky a rokov.

Ako počítačový vedec je táto technológia taká neuveriteľne pôsobivá, že omráči myseľ, a rýchly rast generatívnej umelej inteligencie je taký pôsobivý. Avšak ako a osoba, táto technológia ma desí.