Nous avons joué avec Stable Video Diffusion, et cela annonce un avenir effrayant pour les deep fakes de l'IA.

La diffusion vidéo stable est là, et même si c'est certainement cool, cela laisse présager un avenir inquiétant en matière de contrefaçons profondes.

Points clés à retenir

L'IA générative, comme Stable Video Diffusion, a le potentiel de créer des images et des vidéos hautement réalistes et personnalisables en fonction des invites fournies.
L’utilisation d’images et de vidéos générées par l’IA à des fins de désinformation et de violation de la vie privée est de plus en plus courante, remettant en question la fiabilité des preuves visuelles sur Internet.
La diffusion vidéo stable n’est qu’un début et, à mesure que la technologie de l’IA continue de progresser, l’avenir des médias en ligne est menacé par d’éventuelles utilisations abusives et des problèmes éthiques.

La révolution de l’IA a été l’une des avancées les plus importantes de 2023. Avec OpenAI qui prend d'assaut le monde avec ChatGPT et d'autres comme Bing Chat et Google Bard qui suivent, l'IA générative est une technologie assez puissante. Là où ça devient inquiétant, c'est

Génération d'images IA, des outils capables de créer des images personnalisées en fonction des invites qui leur sont fournies. Aujourd’hui, avec la diffusion vidéo stable, les choses sont sur le point d’empirer encore.

Je suis loin d'avoir peur de la technologie et je pense que l'IA générative a de nombreuses utilités dans les deux domaines. accessibilité et contextes amusants, mais il ne fait aucun doute que la technologie peut également être utilisée à des fins malveillantes. La désinformation est un phénomène de plus en plus fréquent, et il a déjà été démontré que les fausses images générées pouvaient tromper les utilisateurs dans de nombreux contextes différents. Vous vous souvenez de cette photo du pape François qui circulait où il portait une longue doudoune blanche? Cette image n’était pas réelle, mais beaucoup de gens pensaient qu’elle l’était. Les images ne sont plus la solution miracle que les gens attendaient autrefois d’elles.

Source: IA générative

Étant donné qu'il est déjà impossible aujourd'hui de s'appuyer sur les images comme seule preuve de quelque chose, les vidéos étant ensuite sur le billot, il sera plus difficile que jamais de se fier à tout ce que vous voyez sur Internet comme étant réel.

La diffusion vidéo stable de Stability AI est terriblement bonne

Mais ce n'est qu'en test maintenant

Stable Video Diffusion fait suite à Stable Diffusion sorti l'année dernière, un modèle « à poids ouverts » qui a sans doute lancé la vague d'IA de générateurs d'images, jouant à tout le moins un rôle important partie. La forme vidéo de ce modèle particulier est tout aussi accessible et peut être exécutée par toute personne possédant l'un des meilleurs GPU Nvidia.

Le fonctionnement de ce modèle particulier est assez intéressant et, pour le moment, il est assez limité quant à ce qu'il peut réellement faire. Comme le dit Stability AI: « Bien que nous mettions à jour nos modèles avec les dernières avancées et que nous travaillons à Incorporez vos commentaires, ce modèle n'est pas destiné à des applications réelles ou commerciales pour le moment. scène. Vos idées et commentaires sur la sécurité et la qualité sont importants pour affiner ce modèle en vue de sa sortie éventuelle. »

Il existe actuellement deux modèles disponibles pour les utilisateurs; le premier est SVD et le second est SVD-XT. Ceux-ci peuvent générer respectivement 14 et 25 images à des fréquences d'images personnalisables entre 3 et 30 FPS. Avec ce type d'IA capable de faire tant de choses, ce n'est qu'une question de temps avant que les gens puissent créer leurs propres contrefaçons chez n'importe qui.

La diffusion vidéo stable sera probablement facile à mettre en place

Ce n'est pas forcément une bonne chose

Lorsque Stable Diffusion a décollé pour la première fois, un de mes amis a formé un modèle sur le visage de son ami afin d'ajouter ledit ami au Engrenage métallique solide univers dans une galerie sur mesure ridiculement idiote. C'était un cadeau plutôt cool et très amusant à travailler et à manipuler (l'ami a donné son plein consentement pour qu'un modèle soit formé sur son visage), mais j'y repense à l'époque, maintenant, complètement horrifié.

Avec les centaines d'images de nous qui existent, il est déjà possible pour les gens de former des modèles sur le terrain. visages de personnes qui ne donnent pas leur consentement, à peu près tous ceux qui ont des photos d'eux-mêmes publiquement visible. Imaginez maintenant pouvoir générer une image de quelqu'un, puis pouvoir animer ce dessin à l'aide de la diffusion vidéo stable ?

Cela a de nombreuses implications, allant de la violation de la vie privée à la limite de l'illégalité. J'ai déjà entendu des femmes dans le domaine des créateurs de contenu qui m'ont parlé de fans IA générant de la pornographie à leur sujet et le leur renvoyant, presque comme si ces « fans » étaient fiers du fait qu'ils avaient violé la vie privée d'un autre être humain. Cela dure depuis plus d'un an et c'est un exemple que je connais. Ce n’est en aucun cas la seule implication d’outils comme ceux-ci en matière de confidentialité, et en fait, cela ne fera probablement qu’empirer.

Des exemples de diffusion vidéo stable sont déjà disponibles

Effrayant mais incroyable

La vidéo ci-dessus, publiée par Stability AI, montre la puissance de la diffusion vidéo stable. D’autres ont également montré la puissance de la technologie, démontrant comment elle peut faire bouger et animer pratiquement tout dans une petite fenêtre de quelques secondes. Cela nécessite beaucoup de puissance de calcul, mais il existe de nombreux services comme Hugging Face et Replicator que les gens peuvent essentiellement louer pour du temps de traitement. Je l'ai exécuté localement, en utilisant l'image ci-dessous (distribuée avec le logiciel Stable Video DIffusion) pour tester sa qualité.

Je soupçonne que l'image ci-dessus est générée par l'IA, car je ne trouve pas de correspondance exacte en ligne. Néanmoins, c'est un candidat idéal pour les tests. J'ai exécuté le modèle de diffusion vidéo stable localement avec cette image et, en un peu moins d'une heure, j'ai obtenu le clip suivant de quatre secondes.

C’est incroyablement bon. Bien qu'il soit actuellement à une fréquence d'images faible, comme déjà mentionné, il s'agit d'un modèle en développement qui n'est pas encore destiné à un usage général. J'ai essayé avec ma propre photo, une photo d'un train arrivant dans la brume.

Malheureusement, le résultat n'était pas aussi bon, même s'il s'agissait d'une photo plus difficile à utiliser pour une IA en raison du brouillard.

Impressionnant, il semblait toujours comprendre que le train était, eh bien, un train. Il a fini par se déplacer vers l'autre voie ferrée. Il s’agit néanmoins d’un logiciel bêta et les résultats sont néanmoins impressionnants.

La diffusion vidéo stable n’est qu’un début

Peu importe ce que vous pensez de l’impressionnante technologie, ce n’est que le début. Il s’agit du premier modèle open source que les gens vont sans aucun doute démonter, améliorer et éventuellement utiliser sans se soucier de l’éthique. L’avenir des médias en ligne est en danger, en grande partie grâce à la vidéo et aux images de l’IA, et à mesure qu’elles s’améliorent et s’améliorent. mieux, il y a des implications de grande envergure qui ouvriront plusieurs versions de la boîte de Pandore au cours des prochains mois et des années.

En tant qu’informaticien, la technologie est si incroyablement impressionnante qu’elle est ahurissante, et la croissance rapide du paysage de l’IA générative est tellement impressionnante. Cependant, en tant que personne, cette technologie me terrifie.