Hráli jsme se Stable Video Diffusion a signalizuje to děsivou budoucnost hlubokých padělků umělé inteligence

Stable Video Diffusion je tady, a i když je to určitě skvělé, znamená to znepokojivou budoucnost, pokud jde o hluboké padělky.

Klíčové věci

Generativní AI, stejně jako Stable Video Diffusion, má potenciál vytvářet vysoce realistické a přizpůsobitelné obrázky a videa na základě poskytnutých výzev.
Používání obrázků a videí generovaných umělou inteligencí k dezinformacím a porušování soukromí je stále běžnější, což zpochybňuje spolehlivost vizuálních důkazů na internetu.
Stable Video Diffusion je jen začátek a jak se technologie AI neustále vyvíjí, budoucnost online médií je ohrožena potenciálním zneužitím a etickými obavami.

Revoluce umělé inteligence byla jedním z největších a nejdůležitějších pokroků roku 2023. Vzhledem k tomu, že lidé jako OpenAI berou svět útokem pomocí ChatGPT a další, jako je Bing Chat a Google Bard, následují, generativní AI je docela výkonná technologie. Kde to začíná být znepokojivé Generování AI obrazu, nástroje, které mohou vytvářet vlastní obrázky na základě výzev, které jim byly poskytnuty. Nyní se Stable Video Diffusion se věci ještě zhorší.

Nemám strach, pokud jde o technologie, a myslím si, že generativní umělá inteligence má mnoho využití v obou přístupnost a zábavné kontexty, ale není pochyb o tom, že technologii lze použít i ke zlu. Dezinformace jsou fenoménem, který se stává stále častějším a již bylo prokázáno, že vytvořené falešné obrázky klamou uživatele v mnoha různých kontextech. Pamatujete si tu fotku papeže Františka, která chodila kolem, kde měl na sobě dlouhou bílou bundu? Ten obraz nebyl skutečný, ale mnoho lidí si myslelo, že ano. Obrázky už nejsou tím stříbrným důkazem, jak to lidé kdysi očekávali.

Zdroj: Generativní AI

Vzhledem k tomu, že v dnešní době je již nemožné spoléhat se na obrázky jako na jediný důkaz něčeho, přičemž na řadě jsou videa na špalku bude těžší než kdy jindy spoléhat na to, co vidíte na internetu jako nemovitý.

Stabilita AI Stable Video Diffusion je děsivě dobrá

Zatím je to ale jen ve fázi testování

Stable Video Diffusion navazuje na loni vydaný Stable Diffusion, model „otevřené váhy“. to pravděpodobně odstartovalo vlnu AI obrazových generátorů, přinejmenším hrálo významnou roli část. Video forma tohoto konkrétního modelu je stejně přístupná a může ji spustit kdokoli, kdo má jednu z nich nejlepší GPU Nvidia.

To, jak tento konkrétní model funguje, je docela zajímavé a v tuto chvíli je dost omezené v tom, kolik toho skutečně dokáže. Jak říká Stability AI: „Zatímco dychtivě aktualizujeme naše modely o nejnovější vylepšení a pracujeme na zahrňte svou zpětnou vazbu, tento model není určen pro reálné nebo komerční aplikace etapa. Vaše postřehy a zpětná vazba o bezpečnosti a kvalitě jsou důležité pro vylepšování tohoto modelu pro jeho případné vydání."

Uživatelé mají k dispozici dva aktuální modely; první je SVD a druhý je SVD-XT. Ty mohou generovat 14 a 25 snímků při obnovovací frekvenci nastavitelné mezi 3 a 30 FPS. S tímto druhem umělé inteligence, který toho dokáže tolik, je jen otázkou času, kdy si lidé budou moci u kohokoli doma uvařit své vlastní hluboké padělky.

Nastavení stabilního šíření videa bude pravděpodobně snadné

To není nutně dobrá věc

Když Stable Diffusion poprvé vzlétla, můj přítel natrénoval model na tváři svého přítele, aby přidal uvedeného přítele do Metal Gear Solid vesmír v směšně hloupé galerii na míru. Byl to docela skvělý dárek a byla to spousta zábavy při práci a hraní (přítel dal plný souhlas k tomu, aby si nechal natrénovat modelku na obličej), ale vzpomínám si na to, teď, úplně zděšený.

Se stovkami našich obrázků, které jsou tam venku, už bylo možné, aby lidé trénovali modelky tváře lidí, kteří nedají svůj souhlas, v podstatě kohokoli, kdo má své fotky veřejně zobrazitelné. A teď si představte, že dokážete vygenerovat obrázek někoho a pak budete moci tuto kresbu animovat pomocí Stable Video Diffusion?

To má mnoho důsledků, od porušování soukromí až po hraniční nezákonnost. Už se mi ozvaly ženy z prostoru tvůrců obsahu, které mi řekly o fanoušcích, kteří umělou inteligenci generují jejich pornografii a poslat jim to zpět, skoro jako by ti „fanoušci“ byli hrdí na to, že narušili soukromí jiné lidské bytosti. Trvá to už více než rok a je to příklad, který znám. V žádném případě to není jediný dopad nástrojů, jako jsou tyto, na soukromí a ve skutečnosti se to pravděpodobně jen zhorší.

Příklady Stable Video Diffusion jsou již k dispozici

Strašidelné, ale neuvěřitelné

Výše uvedené video vydané Stability AI ukazuje sílu Stable Video Diffusion. Jiní také ukázali sílu této technologie a ukázali, jak může prakticky cokoli rozpohybovat a být animováno v malém, několik sekund trvajícím okně. Vyžaduje to hodně výpočetního výkonu, ale existuje spousta služeb, jako je Hugging Face a Replicator, které si lidé mohou v podstatě pronajmout. Spustil jsem to lokálně pomocí obrázku níže (distribuovaného se softwarem Stable Video DIFfusion), abych otestoval, jak je dobrý.

Výše uvedený obrázek je podle mého názoru generován AI, protože s ním nemohu online najít přesné shody. Přesto je to perfektní kandidát na testování. Lokálně jsem spustil model Stable Video Diffusion s tímto obrázkem a za necelou hodinu jsem měl následující čtyřsekundový klip.

To je překvapivě dobré. I když má nyní nízkou snímkovou frekvenci, jak již bylo zmíněno, jedná se o model ve vývoji, který zatím není určen pro obecné použití. Zkusil jsem to s vlastní fotkou, fotkou vlaku přijíždějícího v mlze.

Výsledek bohužel nebyl tak dobrý, i když pro umělou inteligenci to byla kvůli mlze náročnější fotografie.

Působivě se zdálo, že stále chápal, že vlak je, no, vlak. Skončilo to přesunem na druhou kolej. Stále se však jedná o beta software a výsledky jsou přesto působivé.

Stabilní šíření videa je jen začátek

Bez ohledu na to, co si myslíte o tom, jak působivá tato technologie je, je to jen začátek. Toto je první model s otevřeným zdrojovým kódem, který lidé nepochybně rozeberou, vylepší a možná i využijí, aniž by dbali na etiku. Budoucnost online médií je ohrožena, z velké části díky AI videím a obrázkům, a jak se budou zlepšovat lépe, existují dalekosáhlé důsledky, které během příštích měsíců otevřou několik verzí Pandořiny skříňky a roky.

Jako počítačový vědec je tato technologie tak neuvěřitelně působivá, že omráčí mysl, a rychlý růst generativního prostředí umělé inteligence je tak, tak působivý. Nicméně, jako a osoba, tato technologie mě děsí.