Играхме със Stable Video Diffusion и това сигнализира за страшно бъдеще на дълбоките фалшификати на AI

Stable Video Diffusion е тук и макар да е страхотно, предвещава тревожно бъдеще, когато става въпрос за дълбоки фалшификати.

Ключови изводи

Generative AI, подобно на Stable Video Diffusion, има потенциала да създава изключително реалистични и адаптивни изображения и видеоклипове въз основа на предоставени подкани.
Използването на изображения и видеоклипове, генерирани от изкуствен интелект, за дезинформация и нарушения на поверителността става все по-често срещано, поставяйки под въпрос надеждността на визуалните доказателства в интернет.
Стабилното видео разпространение е само началото и тъй като AI технологията продължава да напредва, бъдещето на онлайн медиите е застрашено от потенциална злоупотреба и етични опасения.

Революцията на AI е едно от най-големите и важни постижения на 2023 г. С подобни на OpenAI, които завладяват света с ChatGPT и други като Bing Chat и Google Bard, генеративният AI е доста мощна технология. Там, където става тревожно, е AI генериране на изображения, инструменти, които могат да създават изображения по поръчка въз основа на подкани, предоставени им. Сега, със Stable Video Diffusion, нещата са на път да се влошат още повече.

Далеч не се страхувам, когато става дума за технологии, и мисля, че генеративният ИИ има много приложения и в двете достъпност и забавни контексти, но няма съмнение, че технологията може да се използва и за зло. Дезинформацията е феномен, който става все по-често срещан и вече е доказано, че генерираните фалшиви изображения подвеждат потребителите в много различни контексти. Спомняте ли си онази снимка на папа Франциск, която обикаляше, където той носеше дълго бяло пухено яке? Това изображение не беше истинско, но много хора си мислеха, че е така. Изображенията вече не са сребърното доказателство, което хората някога са очаквали да бъдат.

Източник: Generative AI

Като се има предвид, че в днешно време вече е невъзможно да се разчита на изображения като единствено доказателство за нещо, следват видеоклиповете на блока за рязане ще бъде по-трудно от всякога да разчитате на всичко, което виждате в интернет като истински.

Stability AI Stable Video Diffusion е плашещо добра

Сега обаче е само в процес на тестване

Stable Video Diffusion е продължение на Stable Diffusion, издаден миналата година, модел с „отворени тегла“ което вероятно даде тласък на AI вълната от генератори на изображения, като най-малкото изигра значителна роля част. Видео формата на този конкретен модел е също толкова достъпна и може да бъде стартирана от всеки, който има един от най-добрите графични процесори на Nvidia.

Как работи този конкретен модел е доста интересно и в момента е доста ограничено в това колко наистина може да направи. Както Stability AI казва: „Докато ние с нетърпение актуализираме нашите модели с най-новите постижения и работим за включете вашите отзиви, този модел не е предназначен за реални или търговски приложения сцена. Вашите прозрения и обратна връзка относно безопасността и качеството са важни за усъвършенстването на този модел за евентуалното му пускане на пазара."

Има два текущи модела, които потребителите могат да използват; първият е SVD, а вторият е SVD-XT. Те могат да генерират съответно 14 и 25 кадъра при кадрови честоти, които могат да се персонализират между 3 и 30 FPS. С този вид ИИ, способен да прави толкова много, е само въпрос на време хората да могат да приготвят свои собствени дълбоки фалшификати у дома на когото и да било.

Стабилната видео дифузия вероятно ще бъде лесна за настройка

Това не е непременно добро нещо

Когато Stable Diffusion стартира за първи път, един мой приятел обучи модел върху лицето на приятеля си, за да добави този приятел към Metal Gear Solid вселена в абсурдно глупава галерия, направена по поръчка. Беше доста страхотен подарък и беше много забавно да се работи и да се забърква с него (приятелят даде пълно съгласие да има модел, обучен върху лицето му), но се сещам за тогава, сега, напълно ужасен.

Със стотиците наши изображения, които са там, вече е възможно хората да обучават модели на лица на хора, които не дават съгласието си, почти всеки там, който има свои снимки публично видими. Сега си представете, че можете да генерирате изображение на някого и след това да можете да анимирате тази рисунка с помощта на Stable Video Diffusion?

Има много последици от това, вариращи от нарушения на поверителността до граничното незаконно. Вече чух от жени в пространството за създатели на съдържание, които ми казаха за феновете, които AI генерира порнография за тях и изпращайки го обратно на тях, почти сякаш тези „фенове“ се гордеят с факта, че са нарушили неприкосновеността на личния живот на друго човешко същество. Това продължава повече от година и това е пример, с който съм запознат. В никакъв случай това не е единственото въздействие върху поверителността на инструменти като тези и всъщност вероятно само ще се влоши.

Вече са налични примери за стабилна видео дифузия

Страшно, но невероятно

Горното видео, публикувано от Stability AI, показва силата на Stable Video Diffusion. Други също продължиха да показват силата на технологията, демонстрирайки как тя може да накара практически всичко да се движи и да бъде анимирано в малък прозорец от няколко секунди. Отнема много изчислителна мощност, но има много услуги като Hugging Face и Replicator, за които хората могат да наемат време за обработка. Пуснах го локално, като използвах изображението по-долу (разпространено със софтуера Stable Video DIffusion), за да тествам колко е добро.

Горното изображение е такова, което подозирам, че е генерирано от AI, тъй като не мога да намеря точни съвпадения с него онлайн. Въпреки това е перфектен кандидат за тестване. Пуснах локално модела Stable Video Diffusion с това изображение и след малко по-малко от час имах следния четирисекунден клип.

Това е шокиращо добро. Въпреки че сега е с ниска скорост на кадрите, както вече споменахме, това е модел в процес на разработка, който все още не е предназначен за обща употреба. Опитах с моя собствена снимка, снимка на влак, пристигащ в мъглата.

За съжаление резултатът не беше толкова добър, въпреки че снимката беше по-предизвикателна за работа с AI, благодарение на мъглата.

Впечатляващо, изглеждаше, че все още разбираше, че влакът е, добре, влак. Просто в крайна сметка се премести на другия влак. Все пак това е бета софтуер и въпреки това резултатите са впечатляващи.

Стабилното видео разпространение е само началото

Независимо какво си мислите колко впечатляваща е тази технология, това е само началото. Това е първият модел с отворен код, който хората несъмнено ще разделят, ще подобрят и евентуално ще използват без грижа за етиката. Бъдещето на онлайн медиите е в опасност, до голяма степен благодарение на AI видео и изображения, и тъй като те стават по-добри и по-добре, има далечни последици, които ще отворят множество версии на кутията на Пандора през следващите месеци и години.

Като компютърен учен технологията е толкова невероятно впечатляваща, че озадачава ума, а бързият растеж на генеративния AI пейзаж е толкова, толкова впечатляващ. Въпреки това, като a човек, тази технология ме ужасява.