हमने स्टेबल वीडियो डिफ्यूजन के साथ खेला, और यह एआई डीप फेक के डरावने भविष्य का संकेत देता है

स्थिर वीडियो प्रसार यहाँ है, और हालांकि यह निश्चित रूप से अच्छा है, लेकिन जब डीप फेक की बात आती है तो यह एक चिंताजनक भविष्य का संकेत देता है।

चाबी छीनना

स्टेबल वीडियो डिफ्यूजन की तरह जेनरेटिव एआई में दिए गए संकेतों के आधार पर अत्यधिक यथार्थवादी और अनुकूलन योग्य छवियां और वीडियो बनाने की क्षमता है।
दुष्प्रचार और गोपनीयता के उल्लंघन के लिए एआई-जनरेटेड छवियों और वीडियो का उपयोग आम होता जा रहा है, जो इंटरनेट पर दृश्य साक्ष्य की विश्वसनीयता को चुनौती दे रहा है।
स्थिर वीडियो प्रसार केवल शुरुआत है, और जैसे-जैसे एआई तकनीक आगे बढ़ रही है, ऑनलाइन मीडिया का भविष्य संभावित दुरुपयोग और नैतिक चिंताओं से खतरे में है।

एआई क्रांति 2023 की सबसे बड़ी और महत्वपूर्ण प्रगति में से एक रही है। ओपनएआई जैसे चैटजीपीटी और बिंग चैट और गूगल बार्ड जैसे अन्य लोगों के साथ दुनिया में तूफान आने के साथ, जेनरेटिव एआई एक बहुत शक्तिशाली तकनीक है। जहां यह चिंताजनक हो जाता है एआई छवि निर्माण, उपकरण जो उन्हें दिए गए संकेतों के आधार पर कस्टम-निर्मित छवियां बना सकते हैं। अब, स्थिर वीडियो प्रसार के साथ, चीज़ें और भी बदतर होने वाली हैं।

जब प्रौद्योगिकी की बात आती है तो मैं भयभीत नहीं होता, और मुझे लगता है कि जेनरेटिव एआई का दोनों में बहुत उपयोग है अभिगम्यता और मज़ेदार प्रसंग, लेकिन इसमें कोई संदेह नहीं है कि प्रौद्योगिकी का उपयोग बुराई के लिए भी किया जा सकता है। दुष्प्रचार एक ऐसी घटना है जो लगातार बढ़ती जा रही है, और कई अलग-अलग संदर्भों में उपयोगकर्ताओं को धोखा देने के लिए उत्पन्न नकली छवियों का प्रदर्शन पहले ही किया जा चुका है। क्या आपको पोप फ्रांसिस की वह तस्वीर याद है जो घूम रही थी जिसमें उन्होंने लंबी सफेद पफर जैकेट पहनी हुई थी? वह छवि वास्तविक नहीं थी, लेकिन कई लोगों ने सोचा कि यह वास्तविक थी। छवियाँ अब प्रमाण की वह चाँदी की गोली नहीं रह गई हैं जिसकी लोगों ने कभी उनसे अपेक्षा की थी।

स्रोत: जनरेटिव एआई

यह देखते हुए कि आजकल किसी चीज़ के एकमात्र प्रमाण के रूप में छवियों पर भरोसा करना पहले से ही असंभव है, इसके बाद वीडियो हैं चॉपिंग ब्लॉक पर, आप इंटरनेट पर जो कुछ भी देखते हैं उस पर भरोसा करना पहले से कहीं अधिक कठिन होता जा रहा है असली।

स्टेबिलिटी एआई का स्टेबल वीडियो डिफ्यूजन बेहद अच्छा है

हालाँकि, यह अभी केवल परीक्षण में है

स्टेबल वीडियो डिफ्यूजन पिछले साल जारी स्टेबल डिफ्यूजन, एक "ओपन वेट" मॉडल का अनुसरण करता है इसने निश्चित रूप से छवि जनरेटर की एआई लहर को किकस्टार्ट किया, कम से कम एक महत्वपूर्ण भूमिका निभाई भाग। इस विशेष मॉडल का वीडियो फॉर्म बिल्कुल सुलभ है और इसे कोई भी व्यक्ति चला सकता है जिसके पास इनमें से कोई एक है सर्वश्रेष्ठ एनवीडिया जीपीयू.

यह विशेष मॉडल कैसे काम करता है यह काफी दिलचस्प है, और फिलहाल यह काफी सीमित है कि यह वास्तव में कितना काम कर सकता है। जैसा कि स्टेबिलिटी एआई कहता है, "जबकि हम अपने मॉडलों को नवीनतम प्रगति के साथ उत्सुकता से अपडेट करते हैं और काम करते हैं अपनी प्रतिक्रिया शामिल करें, यह मॉडल वास्तविक दुनिया या व्यावसायिक अनुप्रयोगों के लिए नहीं है अवस्था। सुरक्षा और गुणवत्ता पर आपकी अंतर्दृष्टि और प्रतिक्रिया इस मॉडल को अंतिम रूप से जारी करने के लिए इसे परिष्कृत करने के लिए महत्वपूर्ण हैं।"

उपयोगकर्ताओं के उपयोग के लिए दो मौजूदा मॉडल उपलब्ध हैं; पहला है SVD, और दूसरा है SVD-XT. ये 3 और 30 एफपीएस के बीच अनुकूलन योग्य फ्रेम दर पर क्रमशः 14 और 25 फ्रेम उत्पन्न कर सकते हैं। इस प्रकार की एआई इतना कुछ करने में सक्षम होने के कारण, यह केवल समय की बात है कि लोग किसी के भी घर पर अपने स्वयं के डीप फेक बना सकते हैं।

स्थिर वीडियो प्रसार स्थापित करना संभवतः आसान होगा

जरूरी नहीं कि यह अच्छी बात हो

जब स्टेबल डिफ्यूज़न पहली बार शुरू हुआ, तो मेरे एक दोस्त ने उक्त दोस्त को इसमें जोड़ने के लिए अपने दोस्त के चेहरे पर एक मॉडल को प्रशिक्षित किया। धातु गियर ठोस एक हास्यास्पद मूर्खतापूर्ण कस्टम-निर्मित गैलरी में ब्रह्मांड। यह एक बहुत अच्छा उपहार था और इस पर काम करने और गड़बड़ करने में बहुत मज़ा आया (दोस्त ने अपने चेहरे पर एक मॉडल को प्रशिक्षित करने के लिए पूरी सहमति दी), लेकिन मैं तब के बारे में सोचता हूं, अब, पूरी तरह से भयभीत हूं।

वहां मौजूद हमारी सैकड़ों छवियों के साथ, लोगों के लिए मॉडलों को प्रशिक्षित करना पहले से ही संभव हो गया है ऐसे लोगों के चेहरे जो अपनी सहमति नहीं देते, लगभग हर कोई जिसके पास सार्वजनिक रूप से अपनी तस्वीरें हैं देखने योग्य. अब कल्पना कीजिए कि आप किसी की छवि बनाने में सक्षम हो सकते हैं और फिर स्थिर वीडियो डिफ्यूजन का उपयोग करके उस ड्राइंग को एनिमेट करने में सक्षम हो सकते हैं?

इसके कई निहितार्थ हैं, जिनमें गोपनीयता के उल्लंघन से लेकर सीमा रेखा के अवैध होने तक शामिल हैं। मैंने पहले ही सामग्री निर्माता क्षेत्र की महिलाओं से सुना है जिन्होंने मुझे प्रशंसकों के एआई द्वारा उनके लिए अश्लील साहित्य तैयार करने के बारे में बताया है इसे उन्हें वापस भेजना, लगभग ऐसा था मानो उन "प्रशंसकों" को इस तथ्य पर गर्व हो कि उन्होंने किसी अन्य इंसान की गोपनीयता का उल्लंघन किया है। यह एक वर्ष से अधिक समय से चल रहा है, और यह एक ऐसा उदाहरण है जिससे मैं परिचित हूँ। किसी भी तरह से यह इन जैसे उपकरणों का एकमात्र गोपनीयता निहितार्थ नहीं है, और वास्तव में, यह केवल बदतर होने की संभावना है।

स्थिर वीडियो प्रसार के उदाहरण पहले से ही उपलब्ध हैं

डरावना लेकिन अविश्वसनीय

स्टेबिलिटी एआई द्वारा जारी उपरोक्त वीडियो, स्टेबल वीडियो डिफ्यूजन की शक्ति को दर्शाता है। अन्य लोगों ने भी प्रौद्योगिकी की शक्ति का प्रदर्शन किया है, यह प्रदर्शित करते हुए कि कैसे यह व्यावहारिक रूप से कुछ भी स्थानांतरित कर सकता है और एक छोटी, कुछ सेकंड की विंडो में एनिमेटेड हो सकता है। इसमें बहुत अधिक कम्प्यूटेशनल शक्ति लगती है, लेकिन हगिंग फेस और रेप्लिकेटर जैसी बहुत सारी सेवाएँ हैं जिन्हें लोग अनिवार्य रूप से प्रसंस्करण समय के लिए किराए पर ले सकते हैं। यह कितना अच्छा था, इसका परीक्षण करने के लिए मैंने नीचे दी गई छवि (स्टेबल वीडियो डिफ्यूजन सॉफ़्टवेयर के साथ वितरित) का उपयोग करके इसे स्थानीय रूप से चलाया।

मुझे संदेह है कि उपरोक्त छवि एआई द्वारा निर्मित है, क्योंकि मुझे ऑनलाइन इसका सटीक मिलान नहीं मिल रहा है। फिर भी, यह परीक्षण के लिए एक आदर्श उम्मीदवार है। मैंने इस छवि के साथ स्थानीय स्तर पर स्थिर वीडियो डिफ्यूज़न मॉडल चलाया, और केवल एक घंटे से भी कम समय में, मेरे पास निम्नलिखित चार-सेकंड की क्लिप थी।

यह आश्चर्यजनक रूप से अच्छा है. हालाँकि यह अब कम फ्रेम दर पर है, जैसा कि पहले ही उल्लेख किया गया है, यह एक इन-डेवलपमेंट मॉडल है जो अभी तक सामान्य उपयोग के लिए नहीं है। मैंने अपनी तस्वीर के साथ कोशिश की, धुंध में आती ट्रेन की तस्वीर।

अफसोस की बात है कि परिणाम उतना अच्छा नहीं था, हालांकि कोहरे के कारण एआई के लिए यह एक अधिक चुनौतीपूर्ण फोटो थी।

प्रभावशाली ढंग से, यह अभी भी समझ में आ रहा था कि ट्रेन, ठीक है, एक ट्रेन थी। यह बस दूसरे रेल ट्रैक पर जाकर समाप्त हो गया। हालाँकि, यह बीटा सॉफ़्टवेयर है, और फिर भी परिणाम प्रभावशाली हैं।

स्थिर वीडियो प्रसार तो बस शुरुआत है

चाहे आप इस बारे में कुछ भी सोचें कि यह तकनीक कितनी प्रभावशाली है, यह केवल शुरुआत है। यह पहला ओपन-सोर्स मॉडल है जिसे लोग निस्संदेह अलग कर देंगे, सुधार करेंगे और संभवतः नैतिकता की देखभाल की कमी के साथ इसका उपयोग करेंगे। ऑनलाइन मीडिया का भविष्य खतरे में है, मुख्य रूप से एआई वीडियो और छवियों के कारण, और जैसे-जैसे वे बेहतर होते जा रहे हैं बेहतर, इसके दूरगामी निहितार्थ हैं जो अगले महीनों में पेंडोरा बॉक्स के कई संस्करण खोल देंगे और वर्ष.

एक कंप्यूटर वैज्ञानिक के रूप में, तकनीक इतनी अविश्वसनीय रूप से प्रभावशाली है कि यह दिमाग को चकरा देती है, और जेनेरिक एआई परिदृश्य का तेजी से विकास इतना प्रभावशाली है। हालाँकि, एक के रूप में व्यक्ति, यह तकनीक मुझे डराती है।