Стабилна видео дифузија је ту, и иако је свакако кул, она представља забрињавајућу будућност када су у питању дубоки лажњаци.
Кључне Такеаваис
- Генеративна АИ, попут стабилне видео дифузије, има потенцијал да креира веома реалистичне и прилагодљиве слике и видео записе на основу пружених упита.
- Употреба слика и видео снимака генерисаних вештачком интелигенцијом за дезинформације и кршење приватности постаје све чешћа, што доводи у питање поузданост визуелних доказа на интернету.
- Стабилна видео дифузија је само почетак, а како технологија вештачке интелигенције наставља да напредује, будућност онлајн медија је угрожена потенцијалном злоупотребом и етичким проблемима.
Револуција вештачке интелигенције је један од највећих и најважнијих напредака 2023. Уз ОпенАИ који осваја свет са ЦхатГПТ-ом и друге попут Бинг Цхат-а и Гоогле Барда који прате, генеративна АИ је прилично моћна технологија. Оно што постаје забрињавајуће је АИ генерисање слике, алати који могу да креирају слике по мери на основу упутстава која су им дата. Сада, са стабилном видео дифузијом, ствари ће постати још горе.
Далеко сам од тога да се плашим када је у питању технологија, и мислим да генеративна АИ има много користи у оба приступачност и забавни контексти, али нема сумње да се технологија може користити и за зло. Дезинформације су све чешћа појава, а већ се показало да лажне слике које се генеришу да преваре кориснике у много различитих контекста. Сећате се оне фотографије папе Фрање која је ишао около где је носио дугу белу јакну од пудера? Та слика није била стварна, али су многи људи мислили да јесте. Слике више нису сребрни метак доказа какав су људи некада очекивали да буду.
Извор: Генеративни АИ
С обзиром да је данас већ немогуће ослонити се на слике као једини доказ нечега, а видео су следећи на блоку за резање, биће теже него икад да се ослоните на било шта што видите на интернету као прави.
Стабилност Стабилна видео дифузија АИ је застрашујуће добра
Међутим, сада је само на тестирању
Стабле Видео Диффусион се наставља на Стабле Диффусион објављен прошле године, модел "отворених тежина" који је вероватно покренуо АИ талас генератора слика, у најмању руку играјући значајно део. Видео облик овог конкретног модела је једнако доступан и може га покренути свако ко има један од ових модела најбољи Нвидиа ГПУ-ови.
Начин на који овај модел функционише је прилично занимљив и тренутно је прилично ограничен у томе колико заиста може да уради. Како Стабилити АИ каже, „Док ми жељно ажурирамо наше моделе најновијим достигнућима и радимо на томе да укључите ваше повратне информације, овај модел није намењен за реалне или комерцијалне апликације фаза. Ваши увиди и повратне информације о безбедности и квалитету су важни за усавршавање овог модела за његово евентуално издавање."
Постоје два тренутна модела доступна корисницима; први је СВД, а други СВД-КСТ. Они могу да генеришу 14 и 25 кадрова при брзини кадрова која се може прилагодити између 3 и 30 фпс. Са овом врстом вештачке интелигенције која је способна да уради толико тога, само је питање времена када ће људи моћи да праве своје дубоке лажне ствари код куће било кога.
Стабилну видео дифузију ће вероватно бити лако подесити
То није нужно добра ствар
Када је Стабле Диффусион први пут узео маха, мој пријатељ је обукао модел на лице свог пријатеља како би додао тог пријатеља у Метал Геар Солид универзум у смешно глупој галерији по мери. Био је то прилично кул поклон и забавно је радити и петљати се са њим (пријатељ је дао потпуну сагласност да се модел обуче на његовом лицу), али мислим да сам тада, сада, потпуно ужаснут.
Са стотинама наших слика које су тамо, већ је било могуће да људи обучавају моделе на лица људи који не дају сагласност, скоро свакога ко има своје фотографије јавно видљиво. Сада замислите да можете да генеришете нечију слику, а затим да анимирате тај цртеж користећи стабилну видео дифузију?
Постоје многе импликације овога, у распону од кршења приватности до граничне незаконитости. Већ сам чуо од жена у простору за креаторе садржаја које су ми говориле о обожаватељима које АИ генеришу њихову порнографију и враћајући им то, скоро као да су ти „навијачи“ поносни на чињеницу да су нарушили приватност другог човека. Ово траје више од годину дана, и то је пример који ми је познат. Ни у ком случају то није једина импликација на приватност оваквих алата, а у ствари, вероватно ће се само погоршати.
Примери стабилне видео дифузије су већ доступни
Страшно али невероватно
Горњи видео, који је објавио Стабилити АИ, показује моћ Стабле Видео Диффусион. Други су такође наставили да показују снагу технологије, показујући како она може да покрене практично све и да буде анимирана у малом прозору од неколико секунди. Потребно је много рачунарске снаге, али постоји много услуга као што су Хуггинг Фаце и Реплицатор за које људи у суштини могу да изнајме време обраде. Покренуо сам га локално, користећи слику испод (дистрибуирану са софтвером Стабле Видео ДИффусион) да тестирам колико је добар.
Горња слика је она за коју сумњам да је генерисана вештачком интелигенцијом, јер не могу да пронађем тачна подударања са њом на мрежи. Ипак, то је савршен кандидат за тестирање. Локално сам покренуо модел Стабле Видео Диффусион са овом сликом и за нешто мање од сат времена имао сам следећи снимак од четири секунде.
Ово је шокантно добро. Иако је сада са малом брзином кадрова, као што је већ поменуто, ово је модел у развоју који још увек није намењен за општу употребу. Покушао сам са својом фотографијом, фотографијом воза који стиже у магли.
Нажалост, резултат није био тако добар, иако је АИ била изазовнија фотографија за рад захваљујући магли.
Импресивно, и даље се чинило да разуме да је воз, па, воз. Само се на крају пребацило на другу пругу. Ипак, ово је бета софтвер, а резултати су ипак импресивни.
Стабилна видео дифузија је само почетак
Без обзира на то шта мислите о томе колико је ова технологија импресивна, то је само почетак. Ово је први модел отвореног кода који ће људи несумњиво раставити, побољшати и евентуално искористити без бриге о етици. Будућност онлајн медија је у опасности, углавном захваљујући АИ видео записима и сликама, и како они постају све бољи и боље, постоје далекосежне импликације које ће отворити више верзија Пандорине кутије током наредних месеци и године.
Као компјутерски научник, технологија је тако невероватно импресивна да запањује ум, а брз раст генеративног АИ пејзажа је тако, тако импресиван. Међутим, као а особа, ова технологија ме ужасава.