私たちは Stable Video Diffusion を試してみましたが、これは AI ディープフェイクの恐ろしい未来を示唆しています

click fraud protection

Stable Video Diffusion が登場しました。これは確かにクールですが、ディープ フェイクに関しては憂慮すべき未来をもたらします。

重要なポイント

  • Stable Video Diffusion のような生成 AI には、提供されたプロンプトに基づいて、非常にリアルでカスタマイズ可能な画像やビデオを作成できる可能性があります。
  • AI によって生成された画像やビデオが偽情報やプライバシー侵害に使用されることが一般的になり、インターネット上の視覚的証拠の信頼性に疑問が生じています。
  • 安定したビデオの普及は始まりにすぎません。AI テクノロジーが進歩し続けるにつれて、オンライン メディアの将来は潜在的な誤用や倫理的懸念によって脅かされています。

AI 革命は、2023 年の最大かつ最も重要な進歩の 1 つです。 OpenAI のようなものが ChatGPT で世界を席巻し、Bing Chat や Google Bard などがそれに続く中、生成 AI は非常に強力なテクノロジーです。 心配になるところは、 AI画像生成、提供されたプロンプトに基づいてカスタムメイドのイメージを作成できるツール。 Stable Video Diffusion の登場により、事態はさらに悪化しようとしています。

私はテクノロジーに関してはまったく恐れていません。生成 AI は両方の分野で多くの用途があると考えています。 アクセシビリティ そして 楽しいコンテキスト, しかし、このテクノロジーが悪にも利用できることは間違いありません。 偽情報はますます頻繁になる現象であり、生成された偽の画像がさまざまな状況でユーザーを騙すことがすでに実証されています。 長い白いダウンジャケットを着て回っていた教皇フランシスコの写真を覚えていますか? そのイメージは現実ではありませんでしたが、多くの人がそう思っていました。 画像は、かつて人々が期待していたような証拠の特効薬ではなくなりました。

出典: 生成 AI

現在、何かの唯一の証拠として画像に依存することはすでに不可能であることを考えると、次はビデオです。 まな板の上では、インターネット上にあるものすべてに依存することがこれまで以上に難しくなるでしょう。 本物。

Stability AI の Stable Video Diffusion は恐ろしいほど優れています

まだテスト中ですが、

Stable Video Diffusion は、昨年リリースされた「オープン ウェイト」モデルである Stable Diffusion に続くものです。 これはおそらく、画像ジェネレーターの AI の波を引き起こし、少なくとも重要な役割を果たしました。 一部。 この特定のモデルのビデオ フォームも同様にアクセスしやすく、次のいずれかを持っている人なら誰でも実行できます。 最高の Nvidia GPU.

この特定のモデルがどのように機能するかは非常に興味深いものですが、現時点では実際にできることはかなり限られています。 Stability AI が言うように、「私たちは最新の進歩でモデルを熱心に更新し、 あなたのフィードバックを取り入れてください。このモデルは、現時点では現実世界または商用アプリケーションを目的としていません。 ステージ。 安全性と品質に関するあなたの洞察とフィードバックは、最終的なリリースに向けてこのモデルを改良するために重要です。」

ユーザーが使用できる現在のモデルは 2 つあります。 1 つ目は SVD、2 つ目は SVD-XT です。 これらは、3 ~ 30 FPS の間でカスタマイズ可能なフレーム レートで、それぞれ 14 フレームと 25 フレームを生成できます。 この種の AI は非常に多くのことができるため、誰の自宅でも独自のディープ フェイクを自作できるようになるのも時間の問題です。

安定したビデオ拡散のセットアップは簡単になりそうです

それは必ずしも良いことではない

安定拡散が最初に普及したとき、私の友人は、その友人を メタルギアソリッド ばかばかしいカスタムメイドのギャラリーの宇宙。 それはとてもクールな贈り物で、加工したりいじったりするのはとても楽しかったです(友人はモデルに顔のトレーニングをさせることに完全に同意しました)、しかし今、私は当時を思い出して完全に恐怖していました。

私たちの画像が何百枚も世に出回っているため、人々がモデルをトレーニングすることはすでに可能です。 同意を与えていない人々の顔、自分の写真を公に公開しているほとんどすべての人 閲覧可能。 ここで、誰かの画像を生成し、Stable Video Diffusion を使用してその描画をアニメーション化できることを想像してみてください。

これには、プライバシー侵害から違法ギリギリまで、さまざまな影響があります。 コンテンツ クリエーターの分野に携わる女性たちから、AI がファンのポルノを生成しているという話をすでに聞いています。 まるでその「ファン」たちが、他人のプライバシーを侵害したという事実を誇りに思っているかのようだ。 これは1年以上続いており、私がよく知っている例です。 決して、このようなツールがプライバシーに与える影響はこれだけではありません。実際、それはさらに悪化する可能性があります。

安定したビデオ拡散の例はすでに利用可能です

怖いけど信じられない

Stability AI が公開した上記のビデオは、Stable Video Diffusion の威力を示しています。 また、他の企業もこのテクノロジーの威力を示し、小さな数秒のウィンドウで実際にあらゆるものを動かし、アニメーション化できることを実証しています。 多くの計算能力を必要としますが、Hugging Face や Replicator のような実質的に処理時間を借りることができるサービスはたくさんあります。 以下の画像 (Stable Video DIffusion ソフトウェアで配布) を使用してローカルで実行し、どれだけ優れているかをテストしました。

上の画像は、オンラインで完全に一致するものが見つからないため、AI が生成したものと思われる画像です。 それにもかかわらず、それはテストに最適な候補です。 この画像を使用して Stable Video Diffusion モデルをローカルで実行すると、1 時間弱で次の 4 秒のクリップが作成されました。

これは衝撃的に良いですね。 すでに述べたように、現在はフレーム レートが低いですが、これは開発中のモデルであり、まだ一般的な使用を目的としていません。 霧の中を到着する電車の写真を自分の写真で撮ってみました。

残念ながら、結果はそれほど良くありませんでしたが、霧のおかげで AI にとって作業がより困難な写真となりました。

印象的だったのは、それでも電車が、まあ、電車であることを理解しているようでした。 結局、別の線路に移動してしまいました。 ただし、これはベータ版ソフトウェアであり、それでも結果は印象的です。

安定したビデオの普及は始まりにすぎません

このテクノロジーがどれほど素晴らしいかについてどう思われるかは関係なく、それはほんの始まりにすぎません。 これは、間違いなく人々が倫理に配慮せずに分解し、改良し、おそらく利用することになる最初のオープンソース モデルです。 オンライン メディアの将来は危険にさらされています。これは主に AI ビデオや画像のおかげで、それらがより良くなり、 さらに良いことに、今後数か月間で複数のバージョンのパンドラの箱が開かれる広範な影響が考えられます。 そして何年も。

コンピューター科学者として、このテクノロジーは気が遠くなるほど信じられないほど印象的であり、生成 AI 環境の急速な成長は非常に印象的です。 ただし、 、この技術は恐ろしいです。