Google rende open source uno strumento utilizzato per abilitare funzionalità simili alla modalità Ritratto del Pixel 2

Google ha rilasciato il codice sorgente per DeepLab-v3, una tecnologia AI che può essere utilizzata per abilitare Portrait Modalità su Google Camera, che consente agli sviluppatori di utilizzare la stessa tecnologia nelle proprie app per altri scopi.

Aggiornamento 17:02 CST: Google ci ha contattato per chiarire che la tecnologia della modalità Ritratto in sé non è aperta ma piuttosto che la tecnologia che lo rende possibile – la segmentazione semantica delle immagini – è ora aperta provenienza. Il titolo è stato modificato per riflettere questa correzione.

La maggior parte delle persone concorda sul fatto che la famiglia Pixel 2 abbia le migliori fotocamere su qualsiasi smartphone in questo momento. L'hardware della fotocamera in sé è eccezionale, ma la maggior parte della magia avviene dal lato software. Ad esempio, la funzionalità HDR+ rende quasi qualsiasi fotocamera è migliore quando è portato su altri telefoni. Una nuova funzionalità software del Pixel 2 è la "Modalità Ritratto". Ti identifica e sfoca lo sfondo per creare un effetto interessante.

La fotocamera utilizza la segmentazione semantica dell'immagine per raggiungere questo obiettivo. Fondamentalmente classifica ogni pixel con un'etichetta come "persona" o "cielo". Ciò aiuta la fotocamera a distinguere tra una persona in primo piano e il cielo sullo sfondo. Google ha rilasciato questa tecnologia come open source, il che significa che gli sviluppatori possono utilizzare la stessa tecnologia nelle proprie app. La modalità Ritratto è solo un esempio di come può essere utilizzata questa tecnologia. Gli sviluppatori possono fare cose ancora più interessanti.

Questa versione include modelli DeepLab-v3+ basati su una potente architettura backbone di rete neurale convoluzionale (CNN) [2, 3] per risultati più accurati, destinati alla distribuzione lato server. Come parte di questa versione, condividiamo inoltre il nostro codice di formazione e valutazione del modello Tensorflow, come nonché modelli già pre-addestrati sulla segmentazione semantica del benchmark Pascal VOC 2012 e Cityscapes compiti.


Fonte: Ricerca Google