Ne-am jucat cu Stable Video Diffusion și semnalează un viitor înfricoșător al falsurilor profunde AI

Stable Video Diffusion este aici și, deși este cu siguranță cool, înseamnă un viitor îngrijorător atunci când vine vorba de falsuri profunde.

Recomandări cheie

AI generativ, cum ar fi Stable Video Diffusion, are potențialul de a crea imagini și videoclipuri extrem de realiste și personalizabile pe baza instrucțiunilor furnizate.
Utilizarea imaginilor și videoclipurilor generate de inteligență artificială pentru dezinformare și încălcări ale confidențialității devine din ce în ce mai frecventă, provocând fiabilitatea dovezilor vizuale de pe internet.
Difuziunea video stabilă este doar începutul și, pe măsură ce tehnologia AI continuă să avanseze, viitorul mass-media online este amenințat de potențialele abuzuri și preocupări etice.

Revoluția AI a fost una dintre cele mai mari și mai importante progrese ale anului 2023. Având în vedere că OpenAI a luat lumea prin asalt cu ChatGPT și altele precum Bing Chat și Google Bard, AI generativ este o tehnologie destul de puternică. Unde devine îngrijorător este

Generare de imagini AI, instrumente care pot crea imagini personalizate pe baza solicitărilor furnizate acestora. Acum, cu Stable Video Diffusion, lucrurile sunt pe cale să se înrăutățească și mai mult.

Sunt departe de a fi frică când vine vorba de tehnologie și cred că AI generativă are multe utilizări în ambele accesibilitate și contexte distractive, dar nu există nicio îndoială că tehnologia poate fi folosită și pentru rău. Dezinformarea este un fenomen care devine din ce în ce mai frecvent, iar imaginile false generate au fost deja demonstrate pentru a păcăli utilizatorii în multe contexte diferite. Îți amintești de acea fotografie a Papei Francisc care se învârtea acolo unde purta un puf alb lung? Acea imagine nu era reală, dar mulți oameni au crezut că este. Imaginile nu mai sunt glonțul de argint al dovezii pe care oamenii se așteptau cândva să fie.

Sursa: Generative AI

Având în vedere că în zilele noastre este deja imposibil să te bazezi pe imagini ca singura dovadă a ceva, videoclipurile fiind următoarele pe blocul de tocat, va fi mai greu ca oricând să te bazezi pe orice vezi pe Internet ca fiind real.

Difuziunea video stabilă de la Stability AI este îngrozitor de bună

Totuși, este doar în testare acum

Stable Video Diffusion urmează după Stable Diffusion lansat anul trecut, un model de „greutăți deschise” care, fără îndoială, a dat startul valului AI de generatoare de imagini, cel puțin având un rol semnificativ parte. Forma video a acestui model special este la fel de accesibilă și poate fi rulată de oricine are unul dintre cele mai bune GPU-uri Nvidia.

Modul în care funcționează acest model este destul de interesant și, în prezent, este destul de limitat în ceea ce privește cât de mult poate face cu adevărat. După cum spune Stability AI, „Deși ne actualizăm cu nerăbdare modelele cu cele mai recente progrese și lucrăm pentru includeți feedback-ul dvs., acest model nu este destinat aplicațiilor din lumea reală sau comerciale etapă. Perspectivele și feedback-ul dumneavoastră cu privire la siguranță și calitate sunt importante pentru a perfecționa acest model pentru o eventuală lansare.”

Există două modele actuale disponibile pentru utilizare de către utilizatori; primul este SVD, iar al doilea este SVD-XT. Acestea pot genera 14 și, respectiv, 25 de cadre la rate de cadre personalizabile între 3 și 30 FPS. Cu acest tip de inteligență artificială capabilă să facă atât de multe, este doar o chestiune de timp până când oamenii își pot crea propriile falsuri profunde acasă ale oricui.

Difuziunea video stabilă va fi probabil ușor de configurat

Nu este neapărat un lucru bun

Când Stable Diffusion a decolat pentru prima dată, un prieten de-al meu a antrenat un model pe fața prietenului său pentru a-l adăuga pe respectivul prieten la Unelte din metal solid univers într-o galerie la comandă ridicol de proastă. A fost un cadou destul de cool și foarte distractiv la care să lucrezi și să te încurci (prietenul și-a dat acordul deplin să aibă un model antrenat pe față), dar mă gândesc la atunci, acum, complet îngrozit.

Cu sutele de imagini cu noi care există, a fost deja posibil ca oamenii să antreneze modele pe fețe ale unor oameni care nu își dau acordul, aproape oricine care are fotografii cu ei înșiși în mod public vizibilă. Acum imaginați-vă că puteți genera o imagine a cuiva și apoi puteți anima acel desen folosind Stable Video Diffusion?

Există multe implicații ale acestui lucru, de la încălcarea confidențialității până la limita ilegală. Am auzit deja de la femei din spațiul creatorilor de conținut care mi-au spus despre fani care AI generează pornografie cu ei și trimițându-le înapoi, aproape de parcă acei „fani” ar fi mândri de faptul că au încălcat intimitatea altei ființe umane. Acest lucru se întâmplă de peste un an și este un exemplu cu care sunt familiarizat. În niciun caz nu este singura implicație privind confidențialitatea unor instrumente ca acestea și, de fapt, probabil că se va înrăutăți.

Sunt deja disponibile exemple de difuzie video stabilă

Înfricoșător, dar incredibil

Videoclipul de mai sus, lansat de Stability AI, arată puterea Stable Video Diffusion. Alții au continuat să arate puterea tehnologiei, demonstrând cum poate face orice să se miște și să fie animat într-o fereastră mică, de câteva secunde. Este nevoie de multă putere de calcul, dar există o mulțime de servicii precum Hugging Face și Replicator pe care oamenii le pot închiria în esență timp de procesare. L-am rulat local, folosind imaginea de mai jos (distribuită cu software-ul Stable Video DIffusion) pentru a testa cât de bine a fost.

Imaginea de mai sus este una pe care o bănuiesc că este generată de AI, deoarece nu pot găsi potriviri exacte cu ea online. Cu toate acestea, este un candidat perfect pentru testare. Am rulat local modelul Stable Video Diffusion cu această imagine și, în puțin mai puțin de o oră, am avut următorul clip de patru secunde.

Acest lucru este șocant de bun. Deși acum este la o rată de cadre scăzută, așa cum am menționat deja, acesta este un model în curs de dezvoltare care nu este încă destinat utilizării generale. Am încercat cu propria mea fotografie, o fotografie a unui tren care sosește în ceață.

Din păcate, rezultatul nu a fost la fel de bun, deși a fost o fotografie mai provocatoare pentru ca un AI să lucreze cu ajutorul ceții.

Impresionant, încă părea să înțeleagă că trenul era, ei bine, un tren. Tocmai a ajuns să se mute pe cealaltă cale de tren. Totuși, acesta este un software beta, iar rezultatele sunt totuși impresionante.

Difuziunea video stabilă este doar începutul

Indiferent de ce vă puteți gândi despre cât de impresionantă este această tehnologie, este doar începutul. Acesta este primul model open-source pe care, fără îndoială, oamenii îl vor demonta, îl vor îmbunătăți și, eventual, îl vor folosi cu lipsă de grijă pentru etică. Viitorul mass-media online este în pericol, în mare parte datorită videoclipurilor și imaginilor AI și pe măsură ce acestea se îmbunătățesc și mai bine, există implicații de anvergură care vor deschide mai multe versiuni ale cutiei Pandorei în următoarele luni si ani.

În calitate de informatician, tehnologia este atât de incredibil de impresionantă încât năucește mintea, iar creșterea rapidă a peisajului AI generativ este atât de impresionantă. Cu toate acestea, ca a persoană, această tehnologie mă îngrozește.