Η Google ανοίγει ένα εργαλείο που χρησιμοποιείται για την ενεργοποίηση λειτουργιών που μοιάζουν με πορτραίτο από το Pixel 2

Η Google κυκλοφόρησε τον πηγαίο κώδικα για το DeepLab-v3, μια τεχνολογία AI που μπορεί να χρησιμοποιηθεί για την ενεργοποίηση του Portrait Λειτουργία στην Κάμερα Google, επιτρέποντας στους προγραμματιστές να χρησιμοποιούν την ίδια τεχνολογία στις δικές τους εφαρμογές για άλλες σκοποί.

Ενημέρωση 05:02 μ.μ. CST: Η Google προσέγγισε για να διευκρινίσει ότι η ίδια η τεχνολογία Λειτουργίας Πορτραίτου δεν είναι ανοιχτή πηγή, αλλά μάλλον, ότι η τεχνολογία που το καθιστά δυνατό—σημασιολογική τμηματοποίηση εικόνας—είναι τώρα ανοιχτή πηγή. Ο τίτλος έχει τροποποιηθεί για να αντικατοπτρίζει αυτή τη διόρθωση.

Οι περισσότεροι άνθρωποι συμφωνούν ότι η οικογένεια Pixel 2 έχει τις καλύτερες κάμερες σε οποιοδήποτε smartphone αυτή τη στιγμή. Το ίδιο το υλικό της κάμερας είναι εξαιρετικό, αλλά το μεγαλύτερο μέρος της μαγείας συμβαίνει από την πλευρά του λογισμικού. Για παράδειγμα, η δυνατότητα HDR+ κάνει σχεδόν οποιαδήποτε κάμερα καλύτερη πότε είναι έχει μεταφερθεί σε άλλα τηλέφωνα. Μια νέα δυνατότητα λογισμικού στο Pixel 2 είναι η "Λειτουργία Πορτραίτου". Σας προσδιορίζει και θολώνει το φόντο για να δημιουργήσει ένα δροσερό εφέ.

Η κάμερα χρησιμοποιεί σημασιολογική τμηματοποίηση εικόνας για να το πετύχει. Βασικά, κατηγοριοποιεί κάθε pixel με μια ετικέτα όπως "πρόσωπο" ή "ουρανός". Αυτό βοηθά την κάμερα να κάνει διαφοροποίηση μεταξύ ενός ατόμου στο προσκήνιο και του ουρανού στο παρασκήνιο. Η Google έχει κυκλοφορήσει αυτήν την τεχνολογία ως ανοιχτού κώδικα, πράγμα που σημαίνει ότι οι προγραμματιστές μπορούν να χρησιμοποιούν την ίδια τεχνολογία στις δικές τους εφαρμογές. Η Λειτουργία Πορτραίτου είναι μόνο ένα παράδειγμα για το πώς μπορεί να χρησιμοποιηθεί αυτή η τεχνολογία. Οι προγραμματιστές μπορούν να κάνουν ακόμα πιο ωραία πράγματα.

Αυτή η έκδοση περιλαμβάνει μοντέλα DeepLab-v3+ χτισμένα πάνω σε μια ισχυρή αρχιτεκτονική κορμού συνελικτικού νευρωνικού δικτύου (CNN) [2, 3] για τα πιο ακριβή αποτελέσματα, που προορίζονται για ανάπτυξη από την πλευρά του διακομιστή. Ως μέρος αυτής της έκδοσης, κοινοποιούμε επιπλέον τον κώδικα εκπαίδευσης και αξιολόγησης του μοντέλου Tensorflow, όπως καθώς και μοντέλα ήδη προεκπαιδευμένα στη σημασιολογική τμηματοποίηση του Pascal VOC 2012 και του Cityscapes καθήκοντα.

Πηγή: Google Research