We speelden met Stable Video Diffusion en het luidt een enge toekomst van AI deep fakes in

Stabiele videoverspreiding is er, en hoewel het zeker cool is, voorspelt het een zorgwekkende toekomst als het gaat om deep fakes.

Belangrijkste leerpunten

Generatieve AI heeft, net als Stable Video Diffusion, het potentieel om zeer realistische en aanpasbare afbeeldingen en video's te creëren op basis van de gegeven aanwijzingen.
Het gebruik van door AI gegenereerde afbeeldingen en video’s voor desinformatie en privacyschendingen komt steeds vaker voor, waardoor de betrouwbaarheid van visueel bewijsmateriaal op internet op de proef wordt gesteld.
Stabiele videoverspreiding is nog maar het begin, en naarmate de AI-technologie zich blijft ontwikkelen, wordt de toekomst van online media bedreigd door potentieel misbruik en ethische zorgen.

De AI-revolutie is een van de grootste en belangrijkste ontwikkelingen van 2023 geweest. Nu OpenAI de wereld stormenderhand verovert met ChatGPT en anderen zoals Bing Chat en Google Bard volgen, is generatieve AI een behoorlijk krachtige technologie. Waar het zorgelijk wordt, is

AI-beeldgeneratie, tools die op maat gemaakte afbeeldingen kunnen maken op basis van de aanwijzingen die ze krijgen. Nu, met Stable Video Diffusion, staan de zaken op het punt nog erger te worden.

Ik ben verre van bang als het om technologie gaat, en ik denk dat generatieve AI in beide toepassingen veel toepassingen kan hebben. toegankelijkheid En leuke contexten, maar er bestaat geen twijfel over dat de technologie ook voor het kwade kan worden gebruikt. Desinformatie is een fenomeen dat steeds vaker voorkomt, en het is al aangetoond dat de gegenereerde nepbeelden gebruikers in veel verschillende contexten kunnen misleiden. Weet je nog die foto van paus Franciscus die rondging en waarop hij een lang wit pufferjack droeg? Dat beeld was niet echt, maar veel mensen dachten van wel. Afbeeldingen zijn niet langer het wondermiddel dat mensen ooit verwachtten.

Bron: Generatieve AI

Gezien het feit dat het tegenwoordig al onmogelijk is om te vertrouwen op afbeeldingen als enig bewijs van iets, terwijl video's de volgende stap zijn Op het hakblok zal het moeilijker dan ooit zijn om te vertrouwen op alles wat je op internet ziet echt.

Stabiliteit AI's stabiele videodiffusie is griezelig goed

Het is echter nu alleen nog maar testen

Stable Video Diffusion is het vervolg op Stable Diffusion dat vorig jaar werd uitgebracht, een model met "open gewichten". dat heeft aantoonbaar de AI-golf van beeldgeneratoren op gang gebracht, en op zijn minst een belangrijke rol gespeeld deel. De videovorm van dit specifieke model is net zo toegankelijk en kan worden uitgevoerd door iedereen die er een heeft beste Nvidia GPU's.

Hoe dit specifieke model werkt is behoorlijk interessant, en op dit moment is het vrij beperkt in wat het werkelijk kan doen. Zoals Stability AI het verwoordt: “Terwijl we onze modellen gretig updaten met de nieuwste ontwikkelingen en eraan werken neem uw feedback op, dit model is niet bedoeld voor echte of commerciële toepassingen fase. Uw inzichten en feedback over veiligheid en kwaliteit zijn belangrijk bij het verfijnen van dit model voor de uiteindelijke release."

Er zijn momenteel twee modellen beschikbaar die gebruikers kunnen gebruiken; de eerste is SVD en de tweede is SVD-XT. Deze kunnen respectievelijk 14 en 25 frames genereren met aanpasbare framesnelheden tussen 3 en 30 FPS. Met dit soort AI dat zoveel kan, is het slechts een kwestie van tijd voordat mensen hun eigen deep fakes bij iedereen thuis kunnen brouwen.

Stabiele videodiffusie zal waarschijnlijk eenvoudig in te stellen zijn

Dat is niet noodzakelijk een goede zaak

Toen Stable Diffusion voor het eerst van start ging, trainde een vriend van mij een model op het gezicht van zijn vriend om die vriend aan de gezichten toe te voegen. Metalen tandwiel solide universum in een belachelijk gekke, op maat gemaakte galerij. Het was een behoorlijk cool cadeau en erg leuk om aan te werken en mee te rommelen (de vriend gaf volledige toestemming om een model op zijn gezicht te laten trainen), maar ik denk terug aan toen, nu, volkomen geschokt.

Met de honderden afbeeldingen van ons die er zijn, is het al mogelijk voor mensen om modellen te trainen op de gezichten van mensen die geen toestemming geven, vrijwel iedereen die publiekelijk foto's van zichzelf heeft zichtbaar. Stel je nu voor dat je een afbeelding van iemand kunt genereren en die tekening vervolgens kunt animeren met behulp van Stable Video Diffusion?

Hieraan zijn veel implicaties verbonden, variërend van privacyschendingen tot de grens van illegaal. Ik heb al gehoord van vrouwen in de ruimte voor het maken van inhoud die me hebben verteld over de AI van fans die pornografie van hen genereren en het naar hen terugsturen, bijna alsof die ‘fans’ trots waren op het feit dat ze de privacy van een ander mens hadden geschonden. Dit is al meer dan een jaar aan de gang en het is een voorbeeld dat ik ken. Dit is zeker niet de enige privacy-implicatie van dit soort tools, en het zal waarschijnlijk alleen maar erger worden.

Er zijn al voorbeelden van stabiele videodiffusie beschikbaar

Eng maar ongelooflijk

De bovenstaande video, uitgebracht door Stability AI, toont de kracht van Stable Video Diffusion. Anderen hebben ook de kracht van de technologie laten zien, door te laten zien hoe het vrijwel alles kan laten bewegen en animeren in een klein venster van enkele seconden. Het vergt veel rekenkracht, maar er zijn tal van diensten zoals Hugging Face en Replicator waarmee mensen in wezen verwerkingstijd kunnen huren. Ik heb het lokaal uitgevoerd met behulp van de onderstaande afbeelding (gedistribueerd met de Stable Video DIffusion-software) om te testen hoe goed het was.

Ik vermoed dat de bovenstaande afbeelding door AI is gegenereerd, omdat ik er online geen exacte overeenkomsten mee kan vinden. Niettemin is het een perfecte kandidaat om te testen. Ik heb het Stable Video Diffusion-model lokaal uitgevoerd met deze afbeelding en in iets minder dan een uur had ik de volgende clip van vier seconden.

Dit is schokkend goed. Hoewel het nu een lage framesnelheid heeft, zoals reeds vermeld, is dit een model in ontwikkeling dat nog niet bedoeld is voor algemeen gebruik. Ik probeerde het met mijn eigen foto, een foto van een trein die in de mist arriveert.

Helaas was het resultaat niet zo goed, hoewel het vanwege de mist een uitdagendere foto was voor een AI om mee te werken.

Op indrukwekkende wijze leek het nog steeds te begrijpen dat de trein, nou ja, een trein was. Het belandde uiteindelijk op het andere spoor. Toch is dit bètasoftware en de resultaten zijn niettemin indrukwekkend.

Stabiele videodiffusie is nog maar het begin

Ongeacht wat je misschien denkt over hoe indrukwekkend deze technologie is, het is nog maar het begin. Dit is het eerste open-sourcemodel dat mensen ongetwijfeld uit elkaar zullen halen, verbeteren en mogelijk zullen gebruiken zonder enige aandacht voor ethiek. De toekomst van online media is in gevaar, grotendeels dankzij AI-video en -afbeeldingen, en naarmate ze beter worden beter nog, er zijn verstrekkende gevolgen die de komende maanden meerdere versies van de doos van Pandora zullen openen en jaren.

Als computerwetenschapper is de technologie zo ongelooflijk indrukwekkend dat het de geest verbijstert, en de snelle groei van het generatieve AI-landschap is zo indrukwekkend. Echter, als een persoon, deze technologie beangstigt mij.