Google открывает исходный код инструмента, используемого для включения функций, подобных портретному режиму, в Pixel 2.

Google опубликовала исходный код DeepLab-v3, технологии искусственного интеллекта, которую можно использовать для включения портретного режима. Режим Google Camera, позволяющий разработчикам использовать ту же технологию в своих приложениях для других целей.

Обновление в 17:02 по центральному поясному времени.: Google разъяснил, что сама технология портретного режима не открыта. источник, а скорее, что технология, которая делает это возможным — семантическая сегментация изображений — теперь открыта источник. Название было изменено, чтобы отразить это исправление.

Большинство людей согласны с тем, что семейство Pixel 2 на данный момент имеет лучшие камеры на любом смартфоне. Аппаратное обеспечение камеры само по себе великолепно, но большая часть волшебства происходит на стороне программного обеспечения. Например, функция HDR+ позволяет почти любая камера лучше когда это портировано на другие телефоны. Новая программная функция Pixel 2 — «Портретный режим». Он идентифицирует вас и размывает фон, создавая крутой эффект.

Для этого камера использует семантическую сегментацию изображения. По сути, он классифицирует каждый пиксель с помощью метки, например «человек» или «небо». Это помогает камере различать человека на переднем плане и небо на заднем плане. Google выпустила эту технологию с открытым исходным кодом, что означает, что разработчики могут использовать ту же технологию в своих собственных приложениях. Портретный режим — лишь один пример того, как можно использовать эту технологию. Разработчики могут сделать еще больше крутых вещей.

В этот выпуск включены модели DeepLab-v3+, построенные на базе мощной магистральной архитектуры сверточной нейронной сети (CNN) [2, 3] для получения наиболее точных результатов и предназначенные для развертывания на стороне сервера. В рамках этого выпуска мы дополнительно делимся нашим кодом обучения и оценки модели Tensorflow, а именно: а также модели, уже предварительно обученные на тестах семантической сегментации Pascal VOC 2012 и Cityscapes. задания.


Источник: исследования Google.