Google open source nástroj používaný k aktivaci funkcí podobných režimu Portrét z Pixelu 2

Google zveřejnil zdrojový kód pro DeepLab-v3, technologii umělé inteligence, kterou lze použít k aktivaci Portrétu Režim fotoaparátu Google, který vývojářům umožňuje používat stejnou technologii ve vlastních aplikacích pro jiné účely.

Aktualizace 17:02 CST: Google se natáhl, aby objasnil, že samotná technologie režimu na výšku není otevřená zdroj, ale spíše, že technologie, která to umožňuje – sémantická segmentace obrazu – je nyní otevřená ze zdrojů. Název byl změněn tak, aby odrážel tuto opravu.

Většina lidí souhlasí s tím, že rodina Pixel 2 má momentálně nejlepší fotoaparáty na jakémkoli smartphonu. Samotný hardware fotoaparátu je skvělý, ale většina kouzel se odehrává na straně softwaru. Například funkce HDR+ dělá téměř jakýkoli fotoaparát lepší když je to přeneseny na jiné telefony. Nová softwarová funkce na Pixel 2 je „Portrait Mode“. Identifikuje vás a rozmaže pozadí, aby vytvořil skvělý efekt.

Kamera k tomu používá sémantickou segmentaci obrazu. V zásadě kategorizuje každý pixel štítkem jako „osoba“ nebo „obloha“. To pomáhá fotoaparátu rozlišit mezi osobou v popředí a oblohou v pozadí. Google vydal tuto technologii jako open source, což znamená, že vývojáři mohou stejnou technologii používat ve svých vlastních aplikacích. Režim Portrét je jen jedním příkladem toho, jak lze tuto technologii použít. Vývojáři mohou dělat ještě více skvělých věcí.

Tato verze obsahuje modely DeepLab-v3+ postavené na výkonné páteřní architektuře konvoluční neuronové sítě (CNN) [2, 3] pro co nejpřesnější výsledky, určené pro nasazení na straně serveru. V rámci této verze navíc sdílíme náš školicí a hodnotící kód modelu Tensorflow, as stejně jako modely, které již byly předtrénovány na sémantické segmentaci benchmarku Pascal VOC 2012 a Cityscapes úkoly.

Zdroj: Google Research