우리는 Stable Video Diffusion을 사용해 보았고 이는 AI 딥 페이크의 무서운 미래를 예고합니다.

안정적인 비디오 확산(Stable Video Diffusion)이 여기에 있습니다. 확실히 멋지기는 하지만 딥 페이크에 관해서는 걱정스러운 미래를 암시합니다.

주요 시사점

Stable Video Diffusion과 같은 생성적 AI는 제공된 프롬프트를 기반으로 매우 사실적이고 사용자 정의 가능한 이미지와 비디오를 생성할 수 있는 잠재력을 가지고 있습니다.
허위 정보와 개인 정보 침해를 위해 AI가 생성한 이미지와 비디오를 사용하는 것이 점점 일반화되어 인터넷상의 시각적 증거의 신뢰성에 도전하고 있습니다.
안정적인 비디오 확산은 시작에 불과하며, AI 기술이 계속해서 발전함에 따라 온라인 미디어의 미래는 잠재적인 오용과 윤리적 우려로 인해 위협받고 있습니다.

AI 혁명은 2023년의 가장 크고 중요한 발전 중 하나였습니다. OpenAI가 ChatGPT를 통해 세계를 강타하고 Bing Chat 및 Google Bard와 같은 다른 기술이 뒤따르는 가운데 생성 AI는 매우 강력한 기술입니다. 고민되는 곳은 AI 이미지 생성, 제공된 프롬프트를 기반으로 맞춤형 이미지를 생성할 수 있는 도구입니다. 이제 Stable Video Diffusion을 사용하면 상황이 더욱 악화될 것입니다.

나는 기술에 대한 두려움이 전혀 없으며, 생성 AI는 두 분야 모두에서 많은 용도로 활용될 수 있다고 생각합니다. 접근성 그리고 재미있는 맥락하지만 기술이 악용될 수도 있다는 점에는 의심의 여지가 없습니다. 허위 정보는 점점 더 자주 발생하는 현상이며, 생성된 가짜 이미지는 다양한 맥락에서 사용자를 속이는 것으로 이미 입증되었습니다. 길고 하얀 패딩을 입고 돌아다니던 프란치스코 교황의 사진을 기억하시나요? 그 이미지는 실제가 아니었지만 많은 사람들이 그렇게 생각했습니다. 이미지는 더 이상 사람들이 기대했던 증거의 묘약이 아닙니다.

출처: 생성적 AI

요즘에는 이미지를 무언가의 유일한 증거로 의존하는 것이 이미 불가능하다는 점을 고려하면 다음은 비디오입니다. 도마 위에서는 인터넷에서 보는 모든 것에 의존하는 것이 그 어느 때보다 더 어려울 것입니다. 진짜.

Stability AI의 Stable Video Diffusion이 겁나게 좋습니다.

지금은 테스트 중이지만

Stable Video Diffusion은 작년에 출시된 Stable Diffusion의 후속 모델인 "개방형 가중치" 모델입니다. 이는 아마도 이미지 생성기의 AI 물결을 시작했을 것입니다. 부분. 이 특정 모델의 비디오 형식은 액세스 가능하며 다음 중 하나를 가진 사람이라면 누구나 실행할 수 있습니다. 최고의 Nvidia GPU.

이 특정 모델이 작동하는 방식은 매우 흥미롭고 현재로서는 실제로 수행할 수 있는 작업이 상당히 제한되어 있습니다. Stability AI는 "우리는 최신 발전 사항으로 모델을 열심히 업데이트하고 귀하의 의견을 반영하여 이 모델은 실제 또는 상업용 애플리케이션을 위한 것이 아닙니다. 단계. 안전과 품질에 대한 귀하의 통찰력과 피드백은 최종 출시를 위해 이 모델을 개선하는 데 중요합니다."

현재 사용자가 사용할 수 있는 두 가지 모델이 있습니다. 첫 번째는 SVD이고 두 번째는 SVD-XT입니다. 이는 3~30FPS 사이에서 사용자 정의 가능한 프레임 속도로 각각 14~25개의 프레임을 생성할 수 있습니다. 이런 종류의 AI가 많은 일을 할 수 있기 때문에 사람들이 누구의 집에서 자신만의 딥페이크를 집에서 만들 수 있게 되는 것은 시간문제일 뿐입니다.

안정적인 영상확산은 설정이 쉬울 것 같습니다.

그게 반드시 좋은 건 아니죠

Stable Diffusion이 처음 시작되었을 때 내 친구는 해당 친구를 메탈 기어 솔리드 터무니없이 어리석은 맞춤형 갤러리의 우주. 꽤 멋진 선물이었고 작업하고 장난을 치는 데 많은 재미가 있었지만(친구는 자신의 얼굴에 모델을 훈련시키는 데 전적으로 동의했습니다), 그때를 생각하면 지금은 완전히 겁에 질려 있습니다.

세상에 나와 있는 수백 장의 우리 이미지를 통해 사람들이 모델을 훈련시키는 것이 이미 가능해졌습니다. 동의하지 않는 사람들의 얼굴, 자신의 사진을 공개적으로 갖고 있는 거의 모든 사람의 얼굴 볼 수 있습니다. 이제 누군가의 이미지를 생성한 다음 Stable Video Diffusion을 사용하여 해당 그림에 애니메이션을 적용할 수 있다고 상상해 보십시오.

이는 개인정보 침해부터 경계선 불법까지 다양한 의미를 갖습니다. 나는 이미 콘텐츠 제작자 공간의 여성들로부터 팬 AI가 포르노를 생성하고 있다는 이야기를 들었습니다. 마치 그 "팬들"이 다른 사람의 사생활을 침해했다는 사실을 자랑스러워하는 것처럼 말입니다. 이런 일이 1년 넘게 계속되었고, 이는 나에게 친숙한 예이다. 결코 이것이 이와 같은 도구의 유일한 개인 정보 보호 영향은 아니며 실제로 상황은 더욱 악화될 가능성이 높습니다.

안정적인 영상확산의 사례는 이미 나와 있습니다.

무섭지만 믿을 수 없다

Stability AI가 공개한 위 영상은 Stable Video Diffusion의 위력을 보여줍니다. 다른 사람들도 이 기술의 힘을 보여주었고, 이 기술이 어떻게 작은 몇 초의 창에서 거의 모든 것을 움직이고 애니메이션화할 수 있는지 보여주었습니다. 많은 계산 능력이 필요하지만 Hugging Face 및 Replicator와 같이 사람들이 기본적으로 처리 시간을 임대할 수 있는 서비스가 많이 있습니다. 아래 이미지(Stable Video DIffusion 소프트웨어와 함께 배포됨)를 사용하여 로컬에서 실행하여 얼마나 좋은지 테스트했습니다.

위 이미지는 온라인에서 정확히 일치하는 항목을 찾을 수 없기 때문에 AI가 생성한 것으로 의심되는 이미지입니다. 그럼에도 불구하고 테스트하기에 완벽한 후보입니다. 이 이미지를 사용하여 로컬에서 Stable Video Diffusion 모델을 실행했고, 단 한 시간도 안 되어 다음과 같은 4초짜리 클립을 얻었습니다.

이거 놀라울 정도로 좋습니다. 이미 언급했듯이 지금은 프레임 속도가 낮지만 아직은 일반적인 용도로 사용되지 않는 개발 중인 모델입니다. 나는 내 사진, 즉 안개 속에서 도착하는 기차의 사진을 사용해 보았습니다.

안타깝게도 결과는 좋지 않았지만 안개 때문에 AI가 작업하기에는 더 어려운 사진이었습니다.

놀랍게도 그 기차는 기차였다는 것을 여전히 이해하고 있는 것 같았습니다. 결국 다른 기차 선로로 이동하게 되었습니다. 하지만 이것은 베타 소프트웨어이고 그럼에도 불구하고 결과는 인상적입니다.

안정적인 영상확산은 시작일 뿐입니다

이 기술이 얼마나 인상적인지 어떻게 생각하든 상관없이 이는 시작에 불과합니다. 이는 의심할 여지 없이 사람들이 윤리에 대한 관심이 부족하여 분해하고 개선하고 사용할 가능성이 있는 최초의 오픈 소스 모델입니다. 온라인 미디어의 미래는 주로 AI 비디오와 이미지 덕분에 위험에 처해 있습니다. 더 나아가 앞으로 몇 달 동안 여러 버전의 판도라 상자가 열리게 될 광범위한 영향이 있습니다. 그리고 몇 년.

컴퓨터 과학자로서 이 기술은 믿을 수 없을 정도로 인상적이어서 마음이 흔들릴 정도이며, 생성 AI 환경의 빠른 성장은 너무나 인상적입니다. 그러나 사람, 이 기술은 저를 두렵게 합니다.