Παίξαμε με το Stable Video Diffusion και σηματοδοτεί ένα τρομακτικό μέλλον των πλαστών τεχνητής νοημοσύνης

Το Stable Video Diffusion είναι εδώ, και παρόλο που είναι σίγουρα ωραίο, προμηνύει ένα ανησυχητικό μέλλον όσον αφορά τα deep fakes.

Βασικά Takeaways

Το Generative AI, όπως το Stable Video Diffusion, έχει τη δυνατότητα να δημιουργεί εξαιρετικά ρεαλιστικές και προσαρμόσιμες εικόνες και βίντεο με βάση τα παρεχόμενα μηνύματα.
Η χρήση εικόνων και βίντεο που δημιουργούνται από την τεχνητή νοημοσύνη για παραπληροφόρηση και παραβιάσεις της ιδιωτικής ζωής γίνεται πιο κοινή, αμφισβητώντας την αξιοπιστία των οπτικών αποδεικτικών στοιχείων στο διαδίκτυο.
Το Stable Video Diffusion είναι μόνο η αρχή και καθώς η τεχνολογία AI συνεχίζει να προοδεύει, το μέλλον των διαδικτυακών μέσων απειλείται από πιθανή κακή χρήση και ηθικές ανησυχίες.

Η επανάσταση της τεχνητής νοημοσύνης υπήρξε μια από τις μεγαλύτερες και πιο σημαντικές εξελίξεις του 2023. Με το OpenAI να κατακτά τον κόσμο με το ChatGPT και άλλους όπως το Bing Chat και το Google Bard να ακολουθούν, η γενετική τεχνητή νοημοσύνη είναι μια αρκετά ισχυρή τεχνολογία. Εκεί που γίνεται ανησυχητικό είναι

Δημιουργία εικόνων AI, εργαλεία που μπορούν να δημιουργήσουν προσαρμοσμένες εικόνες με βάση τις προτροπές που τους παρέχονται. Τώρα, με το Stable Video Diffusion, τα πράγματα πρόκειται να γίνουν ακόμη χειρότερα.

Δεν φοβάμαι πολύ όταν πρόκειται για τεχνολογία και νομίζω ότι η γενετική τεχνητή νοημοσύνη έχει πολλές χρήσεις και στα δύο προσιτότητα και διασκεδαστικά πλαίσια, αλλά δεν υπάρχει αμφιβολία ότι η τεχνολογία μπορεί να χρησιμοποιηθεί και για το κακό. Η παραπληροφόρηση είναι ένα φαινόμενο που γίνεται όλο και πιο συχνό και οι ψεύτικες εικόνες που δημιουργούνται έχουν ήδη αποδειχθεί ότι εξαπατούν τους χρήστες σε πολλά διαφορετικά περιβάλλοντα. Θυμάστε εκείνη τη φωτογραφία του Πάπα Φραγκίσκου που κυκλοφορούσε όπου φορούσε ένα μακρύ λευκό τζάκετ; Αυτή η εικόνα δεν ήταν αληθινή, αλλά πολλοί άνθρωποι πίστευαν ότι ήταν. Οι εικόνες δεν είναι πλέον η ασημένια απόδειξη ότι κάποτε περίμεναν οι άνθρωποι να είναι.

Πηγή: Generative AI

Δεδομένου ότι είναι ήδη αδύνατο στις μέρες μας να βασιστείς σε εικόνες ως μοναδική απόδειξη για κάτι, με τα βίντεο να είναι τα επόμενα στο μπλοκ κοπής, θα είναι πιο δύσκολο από ποτέ να βασιστείς σε οτιδήποτε βλέπεις στο Διαδίκτυο ως πραγματικός.

Η Stable Video Diffusion του Stability AI είναι τρομακτικά καλή

Είναι μόνο σε δοκιμή τώρα, όμως

Το Stable Video Diffusion ακολουθεί το Stable Diffusion που κυκλοφόρησε πέρυσι, ένα μοντέλο "ανοιχτών βαρών" που αναμφισβήτητα ξεκίνησε το κύμα AI των γεννητριών εικόνων, παίζοντας τουλάχιστον ένα σημαντικό μέρος. Η φόρμα βίντεο του συγκεκριμένου μοντέλου είναι εξίσου προσβάσιμη και μπορεί να εκτελεστεί από οποιονδήποτε έχει ένα από αυτά τις καλύτερες GPU της Nvidia.

Το πώς λειτουργεί αυτό το συγκεκριμένο μοντέλο είναι αρκετά ενδιαφέρον και αυτή τη στιγμή είναι αρκετά περιορισμένο στο πόσο μπορεί πραγματικά να κάνει. Όπως το θέτει το Stability AI, «Ενώ ενημερώνουμε με ανυπομονησία τα μοντέλα μας με τις πιο πρόσφατες εξελίξεις και εργαζόμαστε για να ενσωματώστε τα σχόλιά σας, αυτό το μοντέλο δεν προορίζεται για πραγματικές ή εμπορικές εφαρμογές στάδιο. Οι γνώσεις και τα σχόλιά σας σχετικά με την ασφάλεια και την ποιότητα είναι σημαντικά για τη βελτίωση αυτού του μοντέλου για την τελική κυκλοφορία του."

Υπάρχουν δύο τρέχοντα μοντέλα διαθέσιμα για χρήση από τους χρήστες. το πρώτο είναι SVD και το δεύτερο είναι SVD-XT. Αυτά μπορούν να δημιουργήσουν 14 και 25 καρέ αντίστοιχα με ρυθμούς καρέ που μπορούν να προσαρμοστούν μεταξύ 3 και 30 FPS. Με αυτό το είδος τεχνητής νοημοσύνης ικανό να κάνει τόσα πολλά, είναι θέμα χρόνου να μπορέσουν οι άνθρωποι να φτιάξουν τα δικά τους βαθιά ψεύτικα στο σπίτι οποιουδήποτε.

Το Stable Video Diffusion πιθανότατα θα είναι εύκολο να ρυθμιστεί

Αυτό δεν είναι απαραίτητα καλό

Όταν το Stable Diffusion απογειώθηκε για πρώτη φορά, ένας φίλος μου εκπαίδευσε ένα μοντέλο στο πρόσωπο του φίλου του για να προσθέσει τον εν λόγω φίλο στο Metal Gear Solid σύμπαν σε μια γελοία ανόητη custom-made γκαλερί. Ήταν ένα πολύ ωραίο δώρο και πολύ διασκεδαστικό να το δουλεύεις και να το μπερδεύεις (ο φίλος έδωσε την πλήρη συγκατάθεσή του να εκπαιδευτεί ένα μοντέλο στο πρόσωπό του), αλλά νομίζω ότι τότε, τώρα, είμαι εντελώς τρομοκρατημένος.

Με τις εκατοντάδες εικόνες μας που υπάρχουν εκεί έξω, είναι ήδη δυνατό για τους ανθρώπους να εκπαιδεύσουν μοντέλα στο πρόσωπα ανθρώπων που δεν δίνουν τη συγκατάθεσή τους, σχεδόν οποιουδήποτε εκεί έξω που έχει φωτογραφίες του εαυτού τους δημόσια ορατό. Τώρα φανταστείτε να είστε σε θέση να δημιουργήσετε μια εικόνα κάποιου και στη συνέχεια να μπορείτε να ζωντανέψετε αυτό το σχέδιο χρησιμοποιώντας τη σταθερή διάχυση βίντεο;

Υπάρχουν πολλές συνέπειες από αυτό, που κυμαίνονται από παραβιάσεις της ιδιωτικής ζωής έως το παράνομο οριακό. Έχω ήδη ακούσει από γυναίκες στο χώρο των δημιουργών περιεχομένου που μου είπαν για θαυμαστές που η τεχνητή νοημοσύνη τους δημιουργεί πορνογραφία και στέλνοντάς τους πίσω, σχεδόν σαν να ήταν περήφανοι αυτοί οι «θαυμαστές» για το γεγονός ότι είχαν παραβιάσει την ιδιωτική ζωή ενός άλλου ανθρώπου. Αυτό συμβαίνει για περισσότερο από ένα χρόνο, και είναι ένα παράδειγμα που γνωρίζω. Σε καμία περίπτωση δεν είναι η μόνη επίπτωση της ιδιωτικής ζωής εργαλείων όπως αυτά, και στην πραγματικότητα, είναι πιθανό να χειροτερέψει.

Παραδείγματα Stable Video Diffusion είναι ήδη διαθέσιμα

Τρομακτικό αλλά απίστευτο

Το παραπάνω βίντεο, που κυκλοφόρησε από την Stability AI, δείχνει τη δύναμη του Stable Video Diffusion. Άλλοι συνέχισαν επίσης να δείχνουν τη δύναμη της τεχνολογίας, δείχνοντας πώς μπορεί να κάνει σχεδόν οτιδήποτε να κινείται και να κινείται σε ένα μικρό παράθυρο λίγων δευτερολέπτων. Χρειάζεται πολλή υπολογιστική ισχύς, αλλά υπάρχουν πολλές υπηρεσίες όπως το Hugging Face και το Replicator που οι άνθρωποι μπορούν ουσιαστικά να νοικιάσουν χρόνο επεξεργασίας. Το έτρεξα τοπικά, χρησιμοποιώντας την παρακάτω εικόνα (διανεμημένη με το λογισμικό Stable Video DIffusion) για να δοκιμάσω πόσο καλό ήταν.

Η παραπάνω εικόνα είναι μια που υποπτεύομαι ότι έχει δημιουργηθεί AI, καθώς δεν μπορώ να βρω ακριβείς αντιστοιχίες σε αυτήν στο διαδίκτυο. Ωστόσο, είναι ένας τέλειος υποψήφιος για δοκιμή. Έτρεξα το μοντέλο Stable Video Diffusion τοπικά με αυτήν την εικόνα και σε λίγο λιγότερο από μία ώρα, είχα το ακόλουθο κλιπ τεσσάρων δευτερολέπτων.

Αυτό είναι συγκλονιστικά καλό. Αν και είναι σε χαμηλό ρυθμό καρέ τώρα, όπως ήδη αναφέρθηκε, αυτό είναι ένα υπό ανάπτυξη μοντέλο που δεν προορίζεται ακόμη για γενική χρήση. Δοκίμασα με τη δική μου φωτογραφία, μια φωτογραφία ενός τρένου που φτάνει στην ομίχλη.

Δυστυχώς, το αποτέλεσμα δεν ήταν τόσο καλό, αν και ήταν μια πιο προκλητική φωτογραφία για να δουλέψει ένα AI χάρη στην ομίχλη.

Εντυπωσιακά, φαινόταν ακόμα να καταλαβαίνει ότι το τρένο ήταν, λοιπόν, ένα τρένο. Μόλις κατέληξε να μετακινείται στην άλλη γραμμή του τρένου. Παρόλα αυτά, αυτό είναι λογισμικό beta και τα αποτελέσματα είναι ωστόσο εντυπωσιακά.

Το Stable Video Diffusion είναι μόνο η αρχή

Ανεξάρτητα από το τι μπορεί να σκεφτείτε για το πόσο εντυπωσιακή είναι αυτή η τεχνολογία, είναι μόνο η αρχή. Αυτό είναι το πρώτο μοντέλο ανοιχτού κώδικα που οι άνθρωποι αναμφίβολα θα καταργήσουν, θα βελτιώσουν και, ενδεχομένως, θα το χρησιμοποιήσουν με έλλειψη φροντίδας για την ηθική. Το μέλλον των διαδικτυακών μέσων βρίσκεται σε κίνδυνο, κυρίως χάρη στα βίντεο και τις εικόνες τεχνητής νοημοσύνης, και καθώς βελτιώνονται και καλύτερα, υπάρχουν εκτεταμένες συνέπειες που θα ανοίξουν πολλές εκδόσεις του κουτιού της Πανδώρας τους επόμενους μήνες και χρόνια.

Ως επιστήμονας υπολογιστών, η τεχνολογία είναι τόσο απίστευτα εντυπωσιακή που μπερδεύει το μυαλό και η γρήγορη ανάπτυξη του τοπίου της γενετικής τεχνητής νοημοσύνης είναι τόσο, τόσο εντυπωσιακή. Ωστόσο, ως α πρόσωπο, αυτή η τεχνολογία με τρομάζει.