ჩვენ ვითამაშეთ Stable Video Diffusion-ით და ეს მიუთითებს ხელოვნური ინტელექტის ღრმა ყალბების საშინელ მომავალზე

Stable Video Diffusion არის აქ, და მიუხედავად იმისა, რომ ის ნამდვილად მაგარია, ის შემაშფოთებელ მომავალს ასახავს, როდესაც საქმე ღრმა ყალბებს ეხება.

გასაღები Takeaways

გენერაციულ AI-ს, როგორიცაა Stable Video Diffusion, აქვს პოტენციალი შექმნას უაღრესად რეალისტური და კონფიგურირებადი სურათები და ვიდეოები მოწოდებული მოთხოვნების საფუძველზე.
ხელოვნური ინტელექტის მიერ გენერირებული სურათებისა და ვიდეოების გამოყენება დეზინფორმაციისა და კონფიდენციალურობის დარღვევისთვის სულ უფრო ხშირად ხდება, რაც ეჭვქვეშ აყენებს ინტერნეტში ვიზუალური მტკიცებულებების სანდოობას.
სტაბილური ვიდეო დიფუზია მხოლოდ დასაწყისია და AI ტექნოლოგია აგრძელებს წინსვლას, ონლაინ მედიის მომავალს საფრთხე ემუქრება პოტენციური ბოროტად გამოყენებისა და ეთიკური შეშფოთების გამო.

ხელოვნური ინტელექტის რევოლუცია 2023 წლის ერთ-ერთი ყველაზე დიდი და მნიშვნელოვანი წინსვლა იყო. ისეთი, როგორიც არის OpenAI-ი, რომელიც მსოფლიოს ქარიშხლით ართმევს ChatGPT-ს და სხვებს, როგორიცაა Bing Chat და Google Bard-ის მიმდევრები, გენერაციული AI საკმაოდ ძლიერი ტექნოლოგიაა. სადაც ეს შემაშფოთებელია არის

AI სურათების გენერაცია, ხელსაწყოები, რომლებსაც შეუძლიათ შექმნან მორგებული სურათები მათთვის მიწოდებული მოთხოვნების საფუძველზე. ახლა, სტაბილური ვიდეო დიფუზიით, ყველაფერი კიდევ უფრო გაუარესდება.

მე შორს ვარ შიშისგან, როდესაც საქმე ეხება ტექნოლოგიას და ვფიქრობ, რომ გენერაციულ AI-ს ორივეში ბევრი გამოყენება აქვს ხელმისაწვდომობა და მხიარული კონტექსტი, მაგრამ ეჭვგარეშეა, რომ ტექნოლოგია შეიძლება გამოყენებულ იქნას ბოროტებისთვისაც. დეზინფორმაცია არის ფენომენი, რომელიც სულ უფრო და უფრო ხშირია და უკვე დადასტურებულია, რომ გენერირებული ყალბი სურათები ატყუებენ მომხმარებლებს სხვადასხვა კონტექსტში. გახსოვთ პაპ ფრანცისკეს ის ფოტო, რომელიც ტრიალებდა, სადაც მას გრძელი თეთრი ქურთუკი ეცვა? ეს სურათი არ იყო რეალური, მაგრამ ბევრს ეგონა. სურათები აღარ არის ის ვერცხლის ტყვია იმისა, რასაც ხალხი ოდესღაც ელოდა.

წყარო: Generative AI

იმის გათვალისწინებით, რომ დღეს უკვე შეუძლებელია სურათებზე დაყრდნობა, როგორც რაღაცის ერთადერთი მტკიცებულება, შემდეგი ვიდეო იქნება რაც შეეხება ბლოკს, უფრო რთული იქნება, ვიდრე ოდესმე, დაეყრდნო ყველაფერს, რასაც ინტერნეტში ხედავთ. რეალური.

Stability AI-ს სტაბილური ვიდეო დიფუზია საშინლად კარგია

თუმცა ახლა მხოლოდ ტესტირების პროცესშია

Stable Video Diffusion მოჰყვება შარშან გამოშვებულ Stable Diffusion-ს, "ღია წონის" მოდელს ამან, სავარაუდოდ, დაიწყო გამოსახულების გენერატორების ხელოვნური ინტელექტის ტალღა, სულ მცირე, მნიშვნელოვანი ნაწილი. ამ კონკრეტული მოდელის ვიდეო ფორმა ისეთივე ხელმისაწვდომია და მისი მართვა ნებისმიერს შეუძლია საუკეთესო Nvidia GPU.

როგორ მუშაობს ეს კონკრეტული მოდელი საკმაოდ საინტერესოა და ამ დროისთვის საკმაოდ შეზღუდულია, რამდენად შეუძლია მას რეალურად. როგორც Stability AI ამბობს, „მიუხედავად იმისა, რომ ჩვენ მოუთმენლად ვაახლებთ ჩვენს მოდელებს უახლესი მიღწევებით და ვმუშაობთ ჩართეთ თქვენი გამოხმაურება, ეს მოდელი არ არის განკუთვნილი რეალურ სამყაროში ან კომერციული აპლიკაციებისთვის ეტაპი. თქვენი შეხედულებები და გამოხმაურება უსაფრთხოებისა და ხარისხის შესახებ მნიშვნელოვანია ამ მოდელის საბოლოო გამოშვებისთვის."

მომხმარებლებისთვის ხელმისაწვდომია ორი მიმდინარე მოდელი; პირველი არის SVD, ხოლო მეორე არის SVD-XT. მათ შეუძლიათ შექმნან 14 და 25 კადრები, შესაბამისად, კადრების სიხშირით, რომელიც მორგებულია 3-დან 30 FPS-მდე. ამ ტიპის ხელოვნური ინტელექტის წყალობით, რომელსაც შეუძლია ამდენი რამის გაკეთება, მხოლოდ დროის საკითხია, სანამ ადამიანები შეძლებენ საკუთარი ღრმა ყალბების დამზადებას ვინმეს სახლში.

სტაბილური ვიდეო დიფუზიის დაყენება, სავარაუდოდ, ადვილი იქნება

ეს სულაც არ არის კარგი

როდესაც სტაბილური დიფუზია პირველად აფრინდა, ჩემმა მეგობარმა ავარჯიშა მოდელი თავის მეგობრის სახეზე, რათა დაემატა ეს მეგობარი. Metal Gear Solid სამყარო სასაცილოდ სულელურად შეკვეთილ გალერეაში. ეს იყო საკმაოდ მაგარი საჩუქარი და ძალიან სახალისო მუშაობა და არეულობა (მეგობარმა სრული თანხმობა მისცა მოდელს სახეზე მოემზადებინა), მაგრამ მე ვფიქრობ, რომ მაშინ, ახლა, სრულიად შეშინებული.

ჩვენი ასობით გამოსახულებით, რომლებიც არსებობს, უკვე შესაძლებელი გახდა ადამიანებისთვის მოდელების მომზადება ადამიანების სახეები, რომლებიც არ იძლევიან თანხმობას, თითქმის ყველას, ვისაც საჯაროდ აქვს საკუთარი ფოტოები ხილვადი. ახლა წარმოიდგინეთ, რომ შეგეძლოთ ვინმეს გამოსახულების გენერირება და შემდეგ ამ ნახატის ანიმაცია სტაბილური ვიდეო დიფუზიის გამოყენებით?

ამას ბევრი შედეგი მოჰყვება, დაწყებული კონფიდენციალურობის დარღვევიდან დაწყებული სასაზღვრო ზოლის უკანონობამდე. მე უკვე მსმენია ქალებისგან კონტენტის შემქმნელთა სივრცეში, რომლებმაც მითხრეს გულშემატკივრების შესახებ ხელოვნური ხელოვნური ინტელექტის შესახებ, რომელიც აწარმოებს მათ პორნოგრაფიას და უგზავნიდა მათ უკან, თითქმის ისე, თითქოს ეს "ფანები" ამაყობდნენ იმით, რომ მათ დაარღვიეს სხვა ადამიანის კონფიდენციალურობა. ეს გრძელდება ერთ წელზე მეტი ხნის განმავლობაში და ეს არის მაგალითი, რომელსაც მე ვიცნობ. არავითარ შემთხვევაში არ არის ეს მსგავსი ხელსაწყოების კონფიდენციალურობის ერთადერთი მნიშვნელობა და, ფაქტობრივად, ის, სავარაუდოდ, მხოლოდ გაუარესდება.

სტაბილური ვიდეო დიფუზიის მაგალითები უკვე ხელმისაწვდომია

საშინელი, მაგრამ წარმოუდგენელი

ზემოთ მოყვანილი ვიდეო, რომელიც გამოქვეყნებულია Stability AI-ის მიერ, აჩვენებს სტაბილური ვიდეო დიფუზიის ძალას. სხვებმა ასევე აჩვენეს ტექნოლოგიის ძალა და აჩვენეს, თუ როგორ შეუძლია მას პრაქტიკულად ნებისმიერი გადაადგილება და ანიმაცია პატარა, რამდენიმე წამიან ფანჯარაში. მას დიდი გამოთვლითი ძალა სჭირდება, მაგრამ არსებობს უამრავი სერვისი, როგორიცაა Hugging Face და Replicator, რომლითაც ადამიანებს შეუძლიათ არსებითად იქირაონ დამუშავების დრო. მე გავუშვი ლოკალურად, ქვემოთ მოცემული სურათის გამოყენებით (გავრცელებული Stable Video DIffusion პროგრამული უზრუნველყოფით) იმის შესამოწმებლად, რამდენად კარგი იყო.

ზემოაღნიშნული სურათი არის ის, რაც მე ეჭვი მაქვს, რომ ხელოვნური ინტელექტის გენერირებულია, რადგან მე ვერ ვპოულობ ზუსტ შესატყვისს ინტერნეტში. მიუხედავად ამისა, ეს არის შესანიშნავი კანდიდატი ტესტირებისთვის. მე გავუშვი სტაბილური ვიდეო დიფუზიის მოდელი ადგილობრივად ამ სურათით და სულ რაღაც ერთ საათში მქონდა შემდეგი ოთხწამიანი კლიპი.

ეს საოცრად კარგია. მიუხედავად იმისა, რომ ის ახლა კადრების დაბალ სიჩქარეზეა, როგორც უკვე აღვნიშნეთ, ეს არის განვითარებადი მოდელი, რომელიც ჯერ არ არის განკუთვნილი ზოგადი გამოყენებისთვის. ვცადე ჩემივე ფოტოთი, ნისლში ჩასული მატარებლის ფოტო.

სამწუხაროდ, შედეგი არც თუ ისე კარგი იყო, თუმცა ნისლის წყალობით ხელოვნური ინტელექტის მუშაობისთვის უფრო რთული ფოტო იყო.

შთამბეჭდავია, როგორც ჩანს, ჯერ კიდევ ესმოდა, რომ მატარებელი მატარებელი იყო. უბრალოდ დასრულდა სხვა მატარებლის ლიანდაგზე გადასვლა. მიუხედავად ამისა, ეს არის ბეტა პროგრამული უზრუნველყოფა და შედეგები მაინც შთამბეჭდავია.

სტაბილური ვიდეო დიფუზია მხოლოდ დასაწყისია

მიუხედავად იმისა, თუ რას ფიქრობთ, რამდენად შთამბეჭდავია ეს ტექნოლოგია, ეს მხოლოდ დასაწყისია. ეს არის პირველი ღია კოდის მოდელი, რომელსაც ადამიანები უდავოდ გამოყოფენ, გააუმჯობესებენ და, შესაძლოა, გამოიყენებენ ეთიკის ნაკლებობის გამო. ონლაინ მედიის მომავალს საფრთხე ემუქრება, ძირითადად ხელოვნური ინტელექტის მქონე ვიდეოებისა და სურათების წყალობით, და რამდენადაც ისინი უკეთესდებიან და უკეთესია, არსებობს შორსმიმავალი შედეგები, რომელიც გახსნის პანდორას ყუთის მრავალ ვერსიას მომდევნო თვეებში და წლები.

როგორც კომპიუტერის მეცნიერი, ტექნოლოგია იმდენად შთამბეჭდავია, რომ გონებას აბნევს და გენერაციული AI ლანდშაფტის სწრაფი ზრდა იმდენად, ისე შთამბეჭდავია. თუმცა, როგორც ა პირი, ეს ტექნოლოგია მეშინია.