Google Open Source ist ein Tool, mit dem Porträtmodus-ähnliche Funktionen des Pixel 2 aktiviert werden

Google hat den Quellcode für DeepLab-v3 veröffentlicht, eine KI-Technologie, die zur Aktivierung von Porträts verwendet werden kann Modus auf der Google-Kamera, der es Entwicklern ermöglicht, dieselbe Technologie in ihren eigenen Apps für andere zu verwenden Zwecke.

Update 17:02 Uhr CST: Google hat mitgeteilt, dass die Porträtmodus-Technologie selbst nicht offengelegt wird belegen, sondern vielmehr, dass die Technologie, die dies ermöglicht – die semantische Bildsegmentierung – jetzt offen ist bezogen. Der Titel wurde geändert, um diese Korrektur widerzuspiegeln.

Die meisten Leute sind sich einig, dass die Pixel-2-Familie derzeit über die besten Kameras aller Smartphones verfügt. Die Kamera-Hardware selbst ist großartig, aber der größte Teil der Magie geschieht auf der Software-Seite. Zum Beispiel macht die HDR+-Funktion fast jede Kamera besser wenn es auf andere Telefone portiert. Eine neue Softwarefunktion des Pixel 2 ist der „Portrait-Modus“. Es identifiziert Sie und verwischt den Hintergrund, um einen coolen Effekt zu erzielen.

Um dies zu erreichen, nutzt die Kamera semantische Bildsegmentierung. Grundsätzlich wird jedes Pixel mit einer Bezeichnung wie „Person“ oder „Himmel“ kategorisiert. Dies hilft der Kamera, zwischen einer Person im Vordergrund und dem Himmel im Hintergrund zu unterscheiden. Google hat diese Technologie als Open Source veröffentlicht, was bedeutet, dass Entwickler dieselbe Technologie in ihren eigenen Apps verwenden können. Der Porträtmodus ist nur ein Beispiel dafür, wie diese Technologie genutzt werden kann. Entwickler können noch mehr coole Sachen machen.

Diese Version enthält DeepLab-v3+-Modelle, die auf einer leistungsstarken Convolutional Neural Network (CNN)-Backbone-Architektur [2, 3] aufbauen, um genaueste Ergebnisse zu erzielen und für die serverseitige Bereitstellung vorgesehen zu sein. Im Rahmen dieser Version teilen wir zusätzlich unseren Trainings- und Evaluierungscode für das Tensorflow-Modell sowie Modelle, die bereits auf der semantischen Segmentierung von Pascal VOC 2012 und Cityscapes Benchmark vorab trainiert wurden Aufgaben.


Quelle: Google Research