Google-მა გახსნა ინსტრუმენტი, რომელიც გამოიყენება Pixel 2-ის პორტრეტის რეჟიმის მსგავსი ფუნქციების გასააქტიურებლად

Google-მა გამოუშვა DeepLab-v3-ის საწყისი კოდი, ხელოვნური ინტელექტის ტექნოლოგია, რომელიც შეიძლება გამოყენებულ იქნას პორტრეტის გასააქტიურებლად. რეჟიმი Google კამერაზე, რაც დეველოპერებს საშუალებას აძლევს გამოიყენონ იგივე ტექნოლოგია საკუთარ აპებში სხვებისთვის მიზნები.

განახლება 05:02 PM CST: Google-მა მიმართა იმის გარკვევას, რომ თავად პორტრეტის რეჟიმის ტექნოლოგია არ არის ღია წყარო, არამედ, რომ ტექნოლოგია, რომელიც შესაძლებელს ხდის - სემანტიკური გამოსახულების სეგმენტაცია - ახლა ღიაა წყაროს. სათაური შეიცვალა ამ შესწორების ასახვისთვის.

ადამიანების უმეტესობა თანხმდება, რომ Pixel 2-ის ოჯახს ამჟამად საუკეთესო კამერები აქვს ნებისმიერ სმარტფონზე. თავად კამერის აპარატურა შესანიშნავია, მაგრამ მაგიის უმეტესი ნაწილი პროგრამული უზრუნველყოფის მხარეს ხდება. მაგალითად, HDR+ ფუნქცია ქმნის თითქმის ნებისმიერი კამერა უკეთესია როცა პორტირებულია სხვა ტელეფონებზე. ახალი პროგრამული ფუნქცია Pixel 2-ზე არის "პორტრეტის რეჟიმი". ის ამოიცნობს თქვენს იდენტიფიკაციას და ბუნდოვანებს ფონს მაგარი ეფექტის შესაქმნელად.

ამის მისაღწევად კამერა იყენებს გამოსახულების სემანტიკურ სეგმენტაციას. ძირითადად, ის კატეგორიზაციას უწევს ყველა პიქსელს ისეთი ეტიკეტით, როგორიცაა „ადამიანი“ ან „ცა“. ეს ეხმარება კამერას განასხვავოს ადამიანი წინა პლანზე და ცა ფონზე. Google-მა გამოუშვა ეს ტექნოლოგია ღია კოდის სახით, რაც ნიშნავს, რომ დეველოპერებს შეუძლიათ გამოიყენონ იგივე ტექნოლოგია საკუთარ აპებში. პორტრეტის რეჟიმი მხოლოდ ერთი მაგალითია იმისა, თუ როგორ შეიძლება ამ ტექნოლოგიის გამოყენება. დეველოპერებს შეუძლიათ კიდევ უფრო მაგარი საქმის გაკეთება.

ეს გამოცემა მოიცავს DeepLab-v3+ მოდელებს, რომლებიც აგებულია მძლავრი კონვოლუციური ნერვული ქსელის (CNN) ხერხემლის არქიტექტურაზე [2, 3] ყველაზე ზუსტი შედეგებისთვის, რომელიც განკუთვნილია სერვერის მხარეს განლაგებისთვის. როგორც ამ გამოშვების ნაწილი, ჩვენ დამატებით ვუზიარებთ ჩვენს Tensorflow მოდელის ტრენინგს და შეფასების კოდს, როგორც ასევე უკვე წინასწარ მომზადებული მოდელები Pascal VOC 2012-ზე და Cityscapes-ის საორიენტაციო სემანტიკური სეგმენტაცია დავალებები.


წყარო: Google Research