Мы поигрались со Stable Video Diffusion, и это сигнализирует о страшном будущем глубоких фейков с использованием искусственного интеллекта.

Stable Video Diffusion уже здесь, и, хотя это, безусловно, круто, это предвещает тревожное будущее, когда дело касается дипфейков.

Ключевые выводы

Генеративный искусственный интеллект, такой как Stable Video Diffusion, может создавать очень реалистичные и настраиваемые изображения и видео на основе предоставленных подсказок.
Использование изображений и видео, созданных искусственным интеллектом, для дезинформации и нарушения конфиденциальности становится все более распространенным, что ставит под сомнение надежность визуальных доказательств в Интернете.
Стабильное распространение видео — это только начало, и по мере того, как технология искусственного интеллекта продолжает развиваться, будущему онлайн-медиа угрожают потенциальные злоупотребления и этические проблемы.

Революция искусственного интеллекта стала одним из крупнейших и наиболее важных достижений 2023 года. Учитывая, что OpenAI штурмует мир с помощью ChatGPT и других, таких как Bing Chat и Google Bard, генеративный ИИ является довольно мощной технологией. Что вызывает беспокойство, так это

Генерация изображений с помощью ИИ, инструменты, которые могут создавать собственные изображения на основе предоставленных им подсказок. Теперь, с появлением Stable Video Diffusion, ситуация станет еще хуже.

Я далек от страха, когда дело касается технологий, и думаю, что генеративный ИИ имеет множество применений как в доступность и забавные контексты, но нет никаких сомнений в том, что эту технологию можно использовать и во зло. Дезинформация становится все более частым явлением, и уже было продемонстрировано, что созданные фальшивые изображения обманывают пользователей в самых разных контекстах. Помните ту фотографию Папы Франциска, на которой он был одет в длинный белый пуховик? Это изображение не было реальным, но многие люди думали, что это так. Изображения больше не являются серебряной пулей доказательства, которой люди когда-то ожидали.

Источник: Генеративный ИИ.

Учитывая, что в настоящее время уже невозможно полагаться на изображения как на единственное доказательство чего-либо, на очереди видео. на плахе будет труднее, чем когда-либо, полагаться на все, что вы видите в Интернете, как на настоящий.

Стабильность Stable Video Diffusion от AI пугающе хороша

Хотя сейчас это только тестируется

Stable Video Diffusion является продолжением модели Stable Diffusion, выпущенной в прошлом году, модели с «открытыми весами». это, возможно, положило начало волне генераторов изображений искусственного интеллекта, по крайней мере, сыграв значительную роль. часть. Видео-форма этой конкретной модели так же доступна и может быть запущена любым, у кого есть один из лучшие графические процессоры Nvidia.

Как работает эта конкретная модель, довольно интересно, и на данный момент ее возможности весьма ограничены. Как говорит Stability AI: «Хотя мы охотно обновляем наши модели с учетом последних достижений и работаем над учитывая ваши отзывы, эта модель не предназначена для реального или коммерческого применения на данном этапе. этап. Ваши идеи и отзывы о безопасности и качестве важны для доработки этой модели для ее окончательного выпуска».

Пользователям доступны две текущие модели; первый - СВД, а второй - СВД-ХТ. Они могут генерировать 14 и 25 кадров соответственно с частотой кадров, настраиваемой от 3 до 30 кадров в секунду. С таким искусственным интеллектом, способным на многое, это только вопрос времени, когда люди смогут создавать свои собственные глубокие подделки дома у кого-либо.

Stable Video Diffusion, скорее всего, будет легко настроить.

Это не обязательно хорошо

Когда Stable Diffusion только появился, мой друг натренировал модель на лице своего друга, чтобы добавить его в список. Метал Гир Солид вселенная в смехотворно глупой галерее, сделанной по индивидуальному заказу. Это был довольно крутой подарок, над которым было очень весело работать и возиться (друг дал полное согласие на то, чтобы модель потренировалась на его лице), но я вспоминаю то время и сейчас в полном ужасе.

Имея сотни наших изображений, люди уже могут обучать модели на лица людей, которые не дают своего согласия, почти всех, кто публично публикует свои фотографии доступен для просмотра. А теперь представьте, что вы можете создать чье-то изображение, а затем анимировать этот рисунок с помощью Stable Video Diffusion?

Это имеет множество последствий: от нарушений конфиденциальности до граничащего с незаконным существованием. Я уже слышала от женщин из сферы создания контента, которые рассказали мне о том, как искусственный интеллект фанатов создает с их участием порнографию и отправляя его им обратно, как будто эти «фанаты» гордились тем фактом, что они нарушили частную жизнь другого человека. Это продолжается уже больше года, и это пример, с которым я знаком. Это ни в коем случае не единственное влияние подобных инструментов на конфиденциальность, и на самом деле, скорее всего, ситуация будет только ухудшаться.

Примеры стабильного распространения видео уже доступны.

Страшно, но невероятно

Видео выше, выпущенное Stability AI, демонстрирует возможности Stable Video Diffusion. Другие также продемонстрировали мощь этой технологии, продемонстрировав, как с ее помощью можно заставить двигаться и анимировать практически все что угодно в небольшом окне длительностью в несколько секунд. Это требует больших вычислительных мощностей, но существует множество сервисов, таких как Hugging Face и Replicator, с помощью которых люди могут арендовать время обработки. Я запустил его локально, используя изображение ниже (распространяется вместе с программным обеспечением Stable Video DIffusion), чтобы проверить, насколько оно хорошее.

Я подозреваю, что приведенное выше изображение создано искусственным интеллектом, поскольку я не могу найти ему точное совпадение в Интернете. Тем не менее, это идеальный кандидат для тестирования. Я локально запустил модель Stable Video Diffusion с этим изображением и менее чем за час получил следующий четырехсекундный клип.

Это потрясающе хорошо. Хотя сейчас, как уже упоминалось, частота кадров низкая, это модель, находящаяся в разработке и пока не предназначенная для общего использования. Я попробовал со своей фотографией, фотографией поезда, прибывающего в тумане.

К сожалению, результат оказался не таким хорошим, хотя из-за тумана ИИ было сложнее работать с этой фотографией.

Впечатляло то, что он, казалось, все еще понимал, что поезд — это… ну, поезд. В итоге он перешёл на другой железнодорожный путь. Тем не менее, это бета-версия программного обеспечения, и результаты, тем не менее, впечатляют.

Стабильная передача видео — это только начало

Независимо от того, что вы думаете о том, насколько впечатляющей является эта технология, это только начало. Это первая модель с открытым исходным кодом, которую люди, несомненно, будут разбирать, улучшать и, возможно, использовать, не заботясь об этике. Будущее онлайн-СМИ находится под угрозой, во многом из-за искусственного интеллекта в области видео и изображений. лучше, есть далеко идущие последствия, которые откроют несколько версий ящика Пандоры в течение следующих месяцев и годы.

Для ученого-компьютерщика эта технология настолько впечатляет, что поражает воображение, а быстрый рост сферы генеративного искусственного интеллекта просто впечатляет. Однако, как человек, эта технология меня пугает.