Firma Google udostępniła kod źródłowy DeepLab-v3, technologii sztucznej inteligencji, której można użyć do włączenia funkcji Portret Tryb w Aparacie Google, umożliwiający programistom korzystanie z tej samej technologii we własnych aplikacjach dla innych cele.
Aktualizacja o 17:02 CST: Google skontaktowało się z nami, aby wyjaśnić, że sama technologia trybu portretowego nie jest dostępna źródła, ale raczej, że technologia, która to umożliwia – semantyczna segmentacja obrazu – jest teraz otwarta źródłowe. Tytuł został zmieniony, aby odzwierciedlić tę poprawkę.
Większość osób zgadza się, że rodzina Pixel 2 ma obecnie najlepsze aparaty w każdym smartfonie. Sam sprzęt aparatu jest świetny, ale większość magii dzieje się po stronie oprogramowania. Na przykład funkcja HDR+ sprawia, że prawie każdy aparat lepszy Kiedy jest przeniesiony na inne telefony. Nową funkcją oprogramowania Pixela 2 jest „Tryb portretowy”. Identyfikuje Cię i rozmywa tło, tworząc fajny efekt.
Aby to osiągnąć, kamera wykorzystuje semantyczną segmentację obrazu. Zasadniczo kategoryzuje każdy piksel za pomocą etykiety, takiej jak „osoba” lub „niebo”. Pomaga to aparatowi odróżnić osobę na pierwszym planie od nieba w tle. Firma Google udostępniła tę technologię jako oprogramowanie typu open source, co oznacza, że programiści mogą używać tej samej technologii we własnych aplikacjach. Tryb portretowy to tylko jeden z przykładów wykorzystania tej technologii. Programiści mogą zrobić jeszcze więcej fajnych rzeczy.
To wydanie zawiera modele DeepLab-v3+ zbudowane w oparciu o potężną architekturę szkieletu splotowej sieci neuronowej (CNN) [2, 3] w celu uzyskania jak najdokładniejszych wyników, przeznaczone do wdrożenia po stronie serwera. W ramach tej wersji dodatkowo udostępniamy nasz kod szkoleniowy i ewaluacyjny modelu Tensorflow, as a także modele już wstępnie przeszkolone w zakresie segmentacji semantycznej w benchmarku Pascal VOC 2012 i Cityscapes zadania.
Źródło: badania Google