Google пусна изходния код за DeepLab-v3, AI технология, която може да се използва за активиране на Portrait Режим на Google Камера, позволяващ на разработчиците да използват същата технология в собствените си приложения за други цели.
Актуализация в 05:02 CST: Google се свърза, за да изясни, че самата технология за портретен режим не е отворена източник, а по-скоро, че технологията, която го прави възможна – семантично сегментиране на изображения – вече е отворена източник. Заглавието е променено, за да отрази тази корекция.
Повечето хора са съгласни, че семейството Pixel 2 има най-добрите камери на всеки смартфон в момента. Самият хардуер на камерата е страхотен, но по-голямата част от магията се случва от страна на софтуера. Например функцията HDR+ прави почти всяка камера е по-добра когато е пренесени към други телефони. Нова софтуерна функция на Pixel 2 е „Портретен режим“. Той ви идентифицира и замъглява фона, за да създаде страхотен ефект.
Камерата използва семантично сегментиране на изображението, за да постигне това. По принцип той категоризира всеки пиксел с етикет като „човек“ или „небе“. Това помага на камерата да направи разлика между човек на преден план и небето на заден план. Google пусна тази технология като отворен код, което означава, че разработчиците могат да използват същата технология в собствените си приложения. Портретният режим е само един пример за това как може да се използва тази технология. Разработчиците могат да правят още по-страхотни неща.
Тази версия включва модели DeepLab-v3+, изградени върху мощна опорна архитектура на конволюционна невронна мрежа (CNN) [2, 3] за най-точни резултати, предназначени за внедряване от страна на сървъра. Като част от тази версия, ние допълнително споделяме нашия код за обучение и оценка на модел Tensorflow, като както и модели, които вече са обучени предварително на Pascal VOC 2012 и семантично сегментиране на бенчмарка Cityscapes задачи.
Източник: Google Research