Google ML komplektā ievieš entītiju ekstrakcijas, pašbildes segmentācijas API

Google ML komplektā ir ieviesis divus jaunus API: entītiju ekstrakciju un pašbildes segmentēšanu. Lasiet tālāk, lai uzzinātu vairāk par tiem!

Pirms dažiem gadiem Google iepazīstināja ar ML komplektu lai izstrādātājiem būtu vieglāk ieviest mašīnmācīšanos savās lietotnēs. Kopš tā laika esam redzējuši API digitālās tintes atpazīšanai, tulkošanai ierīcē un sejas noteikšanai. Tagad Google ML komplektam pievieno jaunu entītiju ieguvi, kā arī jaunu pašbildes segmentācijas funkciju.

Google teica jaunā Entity Extraction API ļaus izstrādātājiem atklāt un atrast entītijas no neapstrādāta teksta un veikt darbības, pamatojoties uz šīm entītijām.

"API darbojas ar statisku tekstu un arī reāllaikā, kamēr lietotājs raksta," sacīja Google. "Tas atbalsta 11 dažādas entītijas un 15 dažādas valodas (nākotnē būs vēl vairāk), lai izstrādātāji varētu padarīt jebkuru teksta mijiedarbību lietotājam bagātāku."

Šeit ir atbalstītās entītijas:

Adrese(350 trešā iela, Kembridža)
Datums Laiks*(12/12/2020, rīt plkst. 15:00) (tiekamies rīt plkst. 18:00)

E-pasts([email protected])
Avioreisa numurs*(LX37)
IBAN*(CH52 0483 0000 0000 0000 9)
ISBN*(978-1101904190)
Nauda (ieskaitot valūtu)*(12 $, 25 USD)
Maksājumu karte*(4111 1111 1111 1111)
Telefona numurs((555) 225-3556, 12345)
Izsekošanas numurs*(1Z204E380338943508)
URL(www.google.lv, https://en.wikipedia.org/wiki/Platypus, seznam.cz)

Google paziņoja, ka ir testējis Entity Extraction API ar TamTam, lai ļautu lietotnei sniegt noderīgus ieteikumus lietotājiem tērzēšanas sarunu laikā. Piemēram, ja ekrānā ir redzama adrese, noklikšķinot uz tās, tiks atvērta izvēlne, lai kopētu adresi, atvērtu ar citu lietotni vai saņemtu norādes uz atrašanās vietu.

Neironu tīklu anotatori/modeļi Entity Extraction API darbojas šādi: dotais ievades teksts vispirms tiek sadalīts vārdos (pamatojoties uz atstarpi), pēc tam tiek sadalītas visas iespējamās vārdu apakšsecības. tiek ģenerēts noteikts maksimālais garums (15 vārdi iepriekš minētajā piemērā), un katram kandidātam vērtēšanas neironu tīkls piešķir vērtību (no 0 līdz 1), pamatojoties uz to, vai tas apzīmē derīgu entītiju.

Pēc tam tiek noņemtas ģenerētās entītijas, kas pārklājas, dodot priekšroku tām, kurām ir augstāks rādītājs, nevis konfliktējošām entītijām ar zemāku punktu skaitu. Pēc tam tiek izmantots otrs neironu tīkls, lai klasificētu entītijas veidu kā tālruņa numuru, adresi vai dažos gadījumos neentītiju.

Google teica, ka ML komplekta entītiju ieguves API pamatā ir tehnoloģija, kas nodrošina Smart Linkify funkciju, kas ieviesta operētājsistēmā Android 10.

Papildus uz tekstu balstītai entītiju ekstrakcijai Google paziņoja arī par jaunu pašbildes segmentācijas API. Šī funkcija ļaus izstrādātājiem atdalīt fonu no ainas. Tas ļaus lietotājiem pievienot foršus efektus pašbildēm vai pat ievietot sevi labākā fonā. Google teica, ka jaunā API spēj nodrošināt lieliskus rezultātus ar zemu latentumu gan operētājsistēmā Android, gan iOS.

ML Kit SDK ietver Google gadu ilgo darbu mašīnmācīšanās jomā Firebase pakotnē, ko mobilo lietotņu izstrādātāji var izmantot savu lietotņu uzlabošanai. Kopš ML komplekta ieviešanas ir atklātas vairākas API, kas izstrādātājiem ievērojami atvieglo mašīnmācības funkciju ieviešanu lietotnēs. Izmantojot entītiju ekstrakciju un pašbilžu segmentēšanu, nākotnes lietotnes kļūs vēl labākas.