Google ir izlaidusi avota kodu DeepLab-v3 — AI tehnoloģijai, ko var izmantot, lai iespējotu portretu Google kameras režīms, kas ļauj izstrādātājiem izmantot to pašu tehnoloģiju savās lietotnēs citām lietotnēm mērķiem.
Atjauninājums 05:02 CST: Google ir sazinājies, lai precizētu, ka pati portreta režīma tehnoloģija netiek atvērta avots, bet drīzāk ir atvērta tehnoloģija, kas to padara iespējamu — semantiskā attēla segmentācija iegūts. Virsraksts ir grozīts, lai atspoguļotu šo labojumu.
Lielākā daļa cilvēku piekrīt, ka Pixel 2 saimei šobrīd ir labākās kameras jebkurā viedtālrunī. Pati kameras aparatūra ir lieliska, taču lielākā daļa burvju notiek programmatūras pusē. Piemēram, HDR+ funkcija padara gandrīz jebkura kamera ir labāka kad tas ir pārnests uz citiem tālruņiem. Jauna programmatūras funkcija Pixel 2 ir "Portreta režīms". Tas jūs identificē un aizmiglo fonu, lai radītu vēsu efektu.
Lai to panāktu, kamera izmanto semantisko attēla segmentāciju. Būtībā katrs pikselis tiek klasificēts kategorijās ar etiķeti, piemēram, "persona" vai "debesis". Tas palīdz kamerai atšķirt cilvēku priekšplānā no debesīm fonā. Google ir izlaidusi šo tehnoloģiju kā atvērtā pirmkoda, kas nozīmē, ka izstrādātāji var izmantot to pašu tehnoloģiju savās lietotnēs. Portreta režīms ir tikai viens piemērs tam, kā šo tehnoloģiju var izmantot. Izstrādātāji var paveikt vēl vairāk lielisku lietu.
Šajā laidienā ir iekļauti DeepLab-v3+ modeļi, kas izveidoti, izmantojot jaudīgu konvolucionālā neironu tīkla (CNN) mugurkaula arhitektūru [2, 3], lai iegūtu visprecīzākos rezultātus, kas paredzēti izvietošanai servera pusē. Kā daļu no šī laidiena mēs papildus kopīgojam mūsu Tensorflow modeļa apmācības un novērtēšanas kodu, kā kā arī modeļi, kas jau iepriekš apmācīti Pascal VOC 2012 un Cityscapes etalona semantiskajai segmentācijai uzdevumus.
Avots: Google Research