Google open sources, un outil utilisé pour activer les fonctionnalités de type portrait du Pixel 2

Google a publié le code source de DeepLab-v3, une technologie d'IA qui peut être utilisée pour activer Portrait Mode sur l'appareil photo Google, permettant aux développeurs d'utiliser la même technologie dans leurs propres applications pour d'autres fins.

Mise à jour à 17h02 CST: Google a contacté pour clarifier que la technologie du mode Portrait elle-même n'est pas ouverte mais plutôt que la technologie qui rend cela possible – la segmentation sémantique des images – est désormais ouverte sourcé. Le titre a été modifié pour refléter cette correction.

La plupart des gens conviennent que la famille Pixel 2 possède actuellement les meilleurs appareils photo sur tous les smartphones. Le matériel de la caméra lui-même est excellent, mais l'essentiel de la magie se produit du côté logiciel. Par exemple, la fonctionnalité HDR+ permet presque n'importe quel appareil photo est meilleur quand il est porté sur d'autres téléphones. Une nouvelle fonctionnalité logicielle sur le Pixel 2 est le « Mode Portrait ». Il vous identifie et brouille l'arrière-plan pour créer un effet sympa.

La caméra utilise la segmentation sémantique des images pour y parvenir. Fondamentalement, il classe chaque pixel avec une étiquette telle que « personne » ou « ciel ». Cela aide la caméra à faire la différence entre une personne au premier plan et le ciel en arrière-plan. Google a publié cette technologie en open source, ce qui signifie que les développeurs peuvent utiliser la même technologie dans leurs propres applications. Le mode Portrait n'est qu'un exemple de la manière dont cette technologie peut être utilisée. Les développeurs peuvent faire des choses encore plus intéressantes.

Cette version inclut des modèles DeepLab-v3+ construits sur une puissante architecture de base de réseau neuronal convolutionnel (CNN) [2, 3] pour les résultats les plus précis, destinés au déploiement côté serveur. Dans le cadre de cette version, nous partageons également notre code de formation et d'évaluation du modèle Tensorflow, ainsi que ainsi que des modèles déjà pré-entraînés sur le benchmark de segmentation sémantique Pascal VOC 2012 et Cityscapes Tâches.


Source: recherche Google