Google pakub avatud lähtekoodiga tööriista, mida kasutatakse Pixel 2 portreerežiimi sarnaste funktsioonide lubamiseks

Google on välja andnud DeepLab-v3 lähtekoodi, AI-tehnoloogia, mida saab kasutada portree lubamiseks Režiim Google'i kaameras, mis võimaldab arendajatel kasutada sama tehnoloogiat oma rakendustes teiste jaoks eesmärkidel.

Värskendus 05:02 CST: Google on võtnud ühendust, et selgitada, et portreerežiimi tehnoloogia ise ei ole avatud allikas, vaid pigem see, et tehnoloogia, mis seda võimaldab – semantiline kujutise segmenteerimine – on nüüd avatud pärit. Pealkirja on selle paranduse kajastamiseks muudetud.

Enamik inimesi nõustub, et Pixel 2 perekonnal on praegu kõigi nutitelefonide parimad kaamerad. Kaamera riistvara iseenesest on suurepärane, kuid suurem osa maagiast toimub tarkvara poolel. Näiteks HDR+ funktsioon teeb peaaegu iga kaamera parem kui see on teisaldatud teistele telefonidele. Pixel 2 uus tarkvarafunktsioon on portreerežiim. See tuvastab teid ja hägustab tausta, et luua lahe efekt.

Selle saavutamiseks kasutab kaamera semantilist kujutise segmenteerimist. Põhimõtteliselt kategoriseerib see iga piksli sildiga, näiteks "inimene" või "taevas". See aitab kaameral eristada esiplaanil olevat inimest ja taustal olevat taevast. Google on selle tehnoloogia välja andnud avatud lähtekoodiga, mis tähendab, et arendajad saavad kasutada sama tehnoloogiat oma rakendustes. Portreerežiim on vaid üks näide selle tehnoloogia kasutamisest. Arendajad saavad teha veelgi lahedamaid asju.

See väljalase sisaldab DeepLab-v3+ mudeleid, mis on ehitatud võimsa konvolutsioonilise närvivõrgu (CNN) põhiarhitektuuri peale [2, 3], et saada kõige täpsemad tulemused ja mis on mõeldud serveripoolseks juurutamiseks. Selle väljalase osana jagame lisaks oma Tensorflow mudeli koolitus- ja hindamiskoodi, as samuti mudelid, mis on juba eelnevalt koolitatud Pascal VOC 2012 ja Cityscapesi semantilise segmenteerimise jaoks ülesandeid.

Allikas: Google Research