Stable Video Diffusion тут, і, хоча це, безперечно, круто, воно передбачає тривожне майбутнє, коли мова йде про глибокі фейки.
Ключові висновки
- Generative AI, як і Stable Video Diffusion, має потенціал для створення дуже реалістичних і настроюваних зображень і відео на основі наданих підказок.
- Використання зображень і відео, створених ШІ, для дезінформації та порушення конфіденційності стає все більш поширеним, що ставить під сумнів надійність візуальних доказів в Інтернеті.
- Стабільне розповсюдження відео – це лише початок, і оскільки технологія штучного інтелекту продовжує розвиватися, майбутньому онлайн-медіа загрожує потенційне зловживання та етичні проблеми.
Революція ШІ стала одним із найбільших і найважливіших досягнень 2023 року. З такими, як OpenAI, які захоплюють світ з ChatGPT та іншими, такими як Bing Chat і Google Bard, генеративний ШІ є досить потужною технологією. Де це стає тривожним Генерація зображень ШІ, інструменти, які можуть створювати власні зображення на основі наданих їм підказок. Тепер із Stable Video Diffusion все стане ще гірше.
Я далекий від страху, коли справа доходить до технологій, і я думаю, що генеративний ШІ має багато застосувань в обох доступність і веселі контексти, але немає сумніву, що цю технологію можна використовувати й для зла. Дезінформація — це явище, яке стає все більш частим, і вже було продемонстровано, що генеровані фейкові зображення вводять користувачів в оману в багатьох різних контекстах. Пам’ятаєте ту фотографію Папи Франциска, яка ходила навколо, де він був одягнений у довгу білу пухову куртку? Це зображення не було справжнім, але багато людей думали, що це так. Зображення більше не є срібною кулею доказу, якою люди колись очікували.
Джерело: Generative AI
Враховуючи те, що сьогодні вже неможливо покладатися на зображення як єдиний доказ чогось, на черзі відео на брилі, буде важче, ніж будь-коли, покладатися на все, що ви бачите в Інтернеті як справжній.
Стабільність Стабільне розповсюдження відео зі штучним інтелектом надзвичайно хороше
Однак зараз він лише тестується
Stable Video Diffusion є продовженням Stable Diffusion, випущеного минулого року, моделі «відкритих ваг». що, ймовірно, поклало початок хвилі генераторів зображень штучного інтелекту, принаймні зігравши значну роль частина. Відеоформа цієї конкретної моделі так само доступна, і її може запускати будь-хто, хто має одну з них найкращі графічні процесори Nvidia.
Те, як ця конкретна модель працює, досить цікаво, і на даний момент досить обмежено, наскільки вона дійсно може зробити. Як зазначає Stability AI, «хоча ми з нетерпінням оновлюємо наші моделі за допомогою останніх досягнень і працюємо над врахуйте ваші відгуки, ця модель не призначена для реальних або комерційних застосувань етап. Ваші думки та відгуки про безпеку та якість важливі для вдосконалення цієї моделі для її остаточного випуску».
Для користувачів доступні дві поточні моделі; перший - SVD, а другий - SVD-XT. Вони можуть генерувати 14 і 25 кадрів відповідно з частотою кадрів, що настроюється від 3 до 30 кадрів в секунду. З таким штучним інтелектом, який здатний робити так багато, це лише питання часу, коли люди зможуть варити власні глибокі підробки вдома у будь-кого.
Стабільне розповсюдження відео буде легко налаштувати
Це не обов’язково добре
Коли Stable Diffusion вперше стартував, мій друг навчив модель на обличчі свого друга, щоб додати цього друга до Metal Gear Solid Всесвіт у смішно дурній галереї, виготовленій на замовлення. Це був дуже крутий подарунок, з яким було дуже весело працювати та возитися (друг дав повну згоду на те, щоб на його обличчі потренували модель), але я думаю про те, що було тоді, зараз я в повному жаху.
Завдяки сотням наших зображень люди вже можуть тренувати моделей на обличчя людей, які не дають своєї згоди, майже будь-кого, хто має свої фотографії у відкритому доступі доступний для перегляду. А тепер уявіть, що ви можете створити зображення когось, а потім мати можливість анімувати цей малюнок за допомогою Stable Video Diffusion?
Це пов’язано з багатьма наслідками, починаючи від порушення конфіденційності та закінчуючи межею незаконним. Я вже чув від жінок у просторі творців контенту, які розповідали мені про те, що штучний інтелект шанувальників створює їхню порнографію та надсилаючи це назад їм, майже так, ніби ці «фанати» пишаються тим фактом, що вони порушили приватне життя іншої людини. Це триває вже більше року, і це приклад, який мені відомий. У жодному разі це не єдиний наслідок подібних інструментів для конфіденційності, і насправді це, ймовірно, лише погіршиться.
Приклади стабільної дифузії відео вже доступні
Страшно, але неймовірно
Наведене вище відео, опубліковане Stability AI, демонструє потужність Stable Video Diffusion. Інші також показали потужність технології, продемонструвавши, як вона може змусити практично будь-що рухатися та бути анімованим у маленькому вікні тривалістю кілька секунд. Це потребує великої обчислювальної потужності, але є багато сервісів, таких як Hugging Face і Replicator, які люди можуть фактично орендувати час обробки. Я запустив його локально, використовуючи зображення нижче (розповсюджене разом із програмним забезпеченням Stable Video DIffusion), щоб перевірити, наскільки воно добре.
Зображення вище, я підозрюю, створено штучним інтелектом, оскільки я не можу знайти точні збіги з ним в Інтернеті. Тим не менш, це ідеальний кандидат для тестування. Я запустив локально модель Stable Video Diffusion із цим зображенням і менш ніж за годину отримав наступний чотирисекундний кліп.
Це приголомшливо добре. Хоча зараз у нього низька частота кадрів, як уже згадувалося, це модель у розробці, яка ще не призначена для загального використання. Я спробував зі своїм фото, фото поїзда, що прибуває в тумані.
На жаль, результат був не таким хорошим, хоча ШІ було складніше працювати з ним через туман.
Вражаюче те, що все ще здавалося розуміти, що поїзд був, ну, поїздом. Він просто закінчився тим, що переїхав на іншу залізничну колію. Однак це бета-версія програмного забезпечення, і все одно результати вражаючі.
Stable Video Diffusion – це лише початок
Незалежно від того, що ви думаєте про вражаючу цю технологію, це лише початок. Це перша модель з відкритим вихідним кодом, яку люди, безсумнівно, розбиратимуть, вдосконалюватимуть і, можливо, використовуватимуть без уваги до етики. Майбутнє онлайн-медіа під загрозою, головним чином завдяки штучному інтелекту відео та зображенням, а також тому, що вони стають кращими краще, є далекосяжні наслідки, які відкриють кілька версій скриньки Пандори протягом наступних місяців і років.
Як комп’ютерний вчений, ця технологія настільки неймовірно вражаюча, що вражає розум, а швидке зростання генеративного штучного інтелекту настільки вражає. Однак, як зазначив а людина, ця технологія мене жахає.