لقد لعبنا باستخدام Stable Video Diffusion، وهو يشير إلى مستقبل مخيف للتزييف العميق الذي يعتمد على الذكاء الاصطناعي

لقد أصبح التوزيع المستقر للفيديو موجودًا، وعلى الرغم من أنه أمر رائع بالتأكيد، إلا أنه ينبئ بمستقبل مثير للقلق عندما يتعلق الأمر بالتزييف العميق.

الماخذ الرئيسية

  • يتمتع الذكاء الاصطناعي التوليدي، مثل Stable Video Diffusion، بالقدرة على إنشاء صور ومقاطع فيديو واقعية للغاية وقابلة للتخصيص بناءً على المطالبات المقدمة.
  • أصبح استخدام الصور ومقاطع الفيديو التي ينشئها الذكاء الاصطناعي لأغراض التضليل وانتهاكات الخصوصية أكثر شيوعًا، مما يمثل تحديًا لموثوقية الأدلة المرئية على الإنترنت.
  • يعد النشر المستقر للفيديو مجرد البداية، ومع استمرار تقدم تكنولوجيا الذكاء الاصطناعي، فإن مستقبل الوسائط عبر الإنترنت مهدد بسبب سوء الاستخدام المحتمل والمخاوف الأخلاقية.

لقد كانت ثورة الذكاء الاصطناعي واحدة من أكبر وأهم التطورات في عام 2023. مع وجود أمثال OpenAI التي تغزو العالم من خلال ChatGPT وغيرها مثل Bing Chat وGoogle Bard، فإن الذكاء الاصطناعي التوليدي يعد تقنية قوية جدًا. حيث يصبح الأمر مثيرًا للقلق توليد الصور بالذكاء الاصطناعي، الأدوات التي يمكنها إنشاء صور مخصصة بناءً على المطالبات المقدمة لهم. الآن، مع ميزة Stable Video Diffusion، أصبحت الأمور على وشك أن تصبح أسوأ.

أنا لست خائفًا على الإطلاق عندما يتعلق الأمر بالتكنولوجيا، وأعتقد أن الذكاء الاصطناعي التوليدي له استخدامات كثيرة في كليهما إمكانية الوصول و سياقات ممتعةولكن ليس هناك شك في أن التكنولوجيا يمكن استخدامها في الشر أيضًا. أصبحت المعلومات المضللة ظاهرة متكررة بشكل متزايد، وقد ثبت بالفعل أن الصور المزيفة التي تم إنشاؤها تخدع المستخدمين في العديد من السياقات المختلفة. هل تتذكر صورة البابا فرانسيس التي كان يتجول حيث كان يرتدي سترة بيضاء طويلة منتفخة؟ لم تكن تلك الصورة حقيقية، لكن الكثير من الناس اعتقدوا أنها كذلك. لم تعد الصور بمثابة الدليل الفضي الذي توقعه الناس ذات يوم.

المصدر: الذكاء الاصطناعي التوليدي

نظرًا لأنه من المستحيل بالفعل في الوقت الحاضر الاعتماد على الصور كدليل وحيد على شيء ما، تليها مقاطع الفيديو على قطعة التقطيع، سيكون من الصعب أكثر من أي وقت مضى الاعتماد على أي شيء تراه على الإنترنت حقيقي.

يعد نشر الفيديو المستقر للذكاء الاصطناعي أمرًا جيدًا بشكل مخيف

ومع ذلك، فهو قيد الاختبار الآن فقط

يتبع Stable Video Diffusion نموذج Stable Diffusion الذي تم إصداره العام الماضي، وهو نموذج "الأوزان المفتوحة". يمكن القول إن ذلك أدى إلى إطلاق موجة الذكاء الاصطناعي لمولدات الصور، والتي على الأقل لعبت دورًا مهمًا جزء. يمكن الوصول إلى نموذج الفيديو الخاص بهذا النموذج المعين ويمكن تشغيله بواسطة أي شخص لديه أحد هذه النماذج أفضل وحدات معالجة الرسومات نفيديا.

إن كيفية عمل هذا النموذج تحديدًا مثيرة جدًا للاهتمام، وفي الوقت الحالي، محدود جدًا في مقدار ما يمكن أن يفعله حقًا. على حد تعبير Stability AI، "بينما نقوم بتحديث نماذجنا بفارغ الصبر بأحدث التطورات ونعمل على دمج ملاحظاتك، هذا النموذج ليس مخصصًا للتطبيقات الواقعية أو التجارية في هذا الوقت منصة. تعتبر رؤيتك وتعليقاتك بشأن السلامة والجودة مهمة لتحسين هذا النموذج لإصداره النهائي.

هناك نموذجان حاليان متاحان للمستخدمين لاستخدامهما؛ الأول هو SVD، والثاني هو SVD-XT. يمكنها إنشاء 14 و25 إطارًا على التوالي بمعدلات إطارات قابلة للتخصيص بين 3 و30 إطارًا في الثانية. مع هذا النوع من الذكاء الاصطناعي القادر على فعل الكثير، فهي مسألة وقت فقط قبل أن يتمكن الناس من تحضير منتجاتهم المزيفة في منزل أي شخص.

من المحتمل أن يكون من السهل إعداد نشر الفيديو الثابت

هذا ليس بالضرورة أمرا جيدا

عندما انطلق برنامج Stable Diffusion لأول مرة، قام أحد أصدقائي بتدريب نموذج على وجه صديقه من أجل إضافة الصديق المذكور إلى المجموعة معدن صلبة الجير الكون في معرض سخيف يبعث على السخرية حسب الطلب. لقد كانت هدية رائعة جدًا وكان العمل عليها والعبث بها ممتعًا جدًا (أعطى الصديق موافقته الكاملة على تدريب عارضة الأزياء على وجهه)، لكنني أفكر في ذلك الوقت، الآن، مرعوبًا تمامًا.

مع وجود مئات الصور لنا، أصبح من الممكن بالفعل للأشخاص تدريب العارضات على وجوه الأشخاص الذين لا يعطون موافقتهم، إلى حد كبير أي شخص لديه صور لأنفسهم علنًا للعرض. تخيل الآن أن تكون قادرًا على إنشاء صورة لشخص ما ثم أن تكون قادرًا على تحريك هذا الرسم باستخدام Stable Video Diffusion؟

هناك العديد من الآثار المترتبة على ذلك، بدءًا من انتهاكات الخصوصية وحتى الحدود غير القانونية. لقد سمعت بالفعل من نساء في مجال منشئي المحتوى أخبروني عن المعجبين الذين يقومون بإنشاء مواد إباحية من خلال الذكاء الاصطناعي و إعادتها إليهم، كما لو كان هؤلاء "المعجبون" فخورين بحقيقة أنهم انتهكوا خصوصية إنسان آخر. لقد استمر هذا لأكثر من عام، وهو مثال أعرفه. وهذا ليس بأي حال من الأحوال التأثير الوحيد على الخصوصية لأدوات مثل هذه، وفي الواقع، من المرجح أن يزداد الأمر سوءًا.

تتوفر بالفعل أمثلة على نشر الفيديو المستقر

مخيف ولكن لا يصدق

يُظهر الفيديو أعلاه، الصادر عن Stability AI، قوة Stable Video Diffusion. كما واصل آخرون أيضًا إظهار قوة هذه التكنولوجيا، موضحين كيف يمكنها عمليًا جعل أي شيء يتحرك وتحريكه في نافذة صغيرة لا تتجاوز بضع ثوانٍ. يتطلب الأمر الكثير من القوة الحسابية، ولكن هناك الكثير من الخدمات مثل Hugging Face وReplicator التي يمكن للأشخاص استئجار وقت المعالجة بشكل أساسي. لقد قمت بتشغيله محليًا باستخدام الصورة أدناه (الموزعة باستخدام برنامج Stable Video DIffusion) لاختبار مدى جودته.

الصورة أعلاه هي إحدى الصور التي أظن أنها تم إنشاؤها بواسطة الذكاء الاصطناعي، حيث لا يمكنني العثور على تطابقات تامة معها عبر الإنترنت. ومع ذلك، فهو مرشح مثالي للاختبار. قمت بتشغيل نموذج Stable Video Diffusion محليًا باستخدام هذه الصورة، وفي أقل من ساعة بقليل، حصلت على المقطع التالي الذي تبلغ مدته أربع ثوانٍ.

هذا أمر جيد بشكل مثير للصدمة. على الرغم من أنه بمعدل إطارات منخفض الآن، كما ذكرنا سابقًا، إلا أن هذا نموذج قيد التطوير وليس مخصصًا للاستخدام العام بعد. حاولت باستخدام صورتي الخاصة، صورة قطار يصل وسط الضباب.

للأسف، لم تكن النتيجة جيدة، على الرغم من أنها كانت صورة أكثر تحديًا بالنسبة للذكاء الاصطناعي للتعامل معها بفضل الضباب.

ومن المثير للإعجاب أنه ما زال يبدو وكأنه يفهم أن القطار كان قطارًا. لقد انتهى الأمر للتو بالانتقال إلى مسار القطار الآخر. ومع ذلك، لا يزال هذا برنامجًا تجريبيًا، والنتائج مثيرة للإعجاب رغم ذلك.

إن نشر الفيديو المستقر هو مجرد البداية

وبغض النظر عما قد تعتقده بشأن مدى روعة هذه التقنية، فهي مجرد البداية. هذا هو أول نموذج مفتوح المصدر سوف يقوم الناس بلا شك بتفكيكه وتحسينه وربما الاستفادة منه مع عدم الاهتمام بالأخلاقيات. إن مستقبل الوسائط عبر الإنترنت في خطر، ويرجع ذلك إلى حد كبير إلى الفيديو والصور التي تعمل بتقنية الذكاء الاصطناعي، ومع تحسنها والأفضل من ذلك أن هناك آثاراً بعيدة المدى من شأنها أن تفتح إصدارات متعددة من صندوق باندورا خلال الأشهر المقبلة وسنوات.

باعتباري عالم كمبيوتر، فإن التكنولوجيا مثيرة للإعجاب بشكل لا يصدق لدرجة أنها تحير العقل، والنمو السريع في مشهد الذكاء الاصطناعي التوليدي مثير للإعجاب للغاية. ومع ذلك، باعتباره شخص، هذه التكنولوجيا تخيفني.