Huawei har sluppet HiAI-motoren med Huawei P20. HiAI-motoren åpner applikasjonsfunksjoner og integrerer "en flerhet av AI-funksjoner." Dens funksjoner er: scenegjenkjenning, dokumentgjenkjenning og dokumentkorrigering, kodegjenkjenning, ansiktsgjenkjenning og mer.
Huawei lanserte Mate 10-serien i oktober med HiSilicon Kirin 970-systemet-på-brikke. Kirin 970 har spesielt dedikert maskinvare for AI, i form av en Neural Processing Unit (NPU). Forrige måned, vi viste også hvordan Huawei utviklet HiAssistant (drevet av HiAI), en Google Assistant + Google Lens-konkurrent for det kinesiske markedet. Nå har Huawei sluppet HiAI Engine sammen med Huawei P20.
HiAI er Huaweis AI-databehandlingsplattform. For øyeblikket brukes den dedikerte NPU-en på Kirin 970-telefonene til funksjoner som sanntidsgjenkjenning av objekter og scener i kameraappen, samt akselerert frakoblet oversettelse i Microsoft Translator. Imidlertid er disse egenskapene en liten del av det totale potensialet til maskinlæring og nevrale nettverk. Det er rettferdig å si at det er tidlige dager ennå for AI i smarttelefoner, men de potensielle egenskapene er lovende.
I følge Huawei åpner HiAI-motoren applikasjonsfunksjoner, integrerer "en rekke AI-funksjoner og apper [som gjør] appene er mer intelligente og kraftige." Utviklere kan nå laste ned DDK (Driver Development Kit), SDK og IDE for HiAI Motor.
Applikasjonsmulighetene til HiAI-motoren inkluderer en datamaskinsynsmotor (CV). En Computer Vision-motor refererer til "egenskapene som datamaskiner simulerer det menneskelige visuelle systemet til sanse det omgivende miljøet, og bestemme, gjenkjenne og forstå sammensetningen av rommet," ifølge Huawei. Funksjonene til CV-motoren inkluderer superoppløsning for bilde, ansiktsgjenkjenning og objektgjenkjenning (som er forklart mer detaljert nedenfor).
HiAI-motoren inkluderer også en automatisk talegjenkjenningsmotor (ASR). Det er imidlertid ikke åpent utenfor Kina. En ASR-motor er det som konverterer menneskelig stemme til tekst, og dens funksjoner inkluderer talegjenkjenning, talekonvertering og tekst-til-tale (TTS).
En motor for naturlig språkforståelse (NLU) er også en del av funksjonene til HiAI-motoren, men som ASR-motoren er den ikke åpen utenfor Kina. Den gjør det mulig for datamaskiner å forstå menneskelig stemme, noe som lar dem utføre kommunikasjon eller naturlige handlinger. Dens evner inkluderer ordsegmentering, gjenkjennelse av tekstenhet, analyse av følelsesmessige tendenser og maskinoversettelse.
Funksjonene til HiAI Engine er:
- Scenegjenkjenning: Den "kategoriserer raskt" bilder ved å gjenkjenne scenene i bildets innhold. Huawei opplyser at gjenkjenning av flere typer scener for øyeblikket støttes med høy nøyaktighet.
- Dokumentretting og dokumentgjenkjenning: Det er en assistentforbedringsfunksjon som kan korrigere vinkelen på dokumentet. Den kan også automatisk gjenkjenne plasseringsinformasjonen til dokumentet i bildet.
- Ansiktsgjenkjenning og Ansiktssammenligning: Huawei uttaler: "I ansiktsgjenkjenning, informasjon om plasseringen, karakteristiske punkter og stillinger for det menneskelige ansiktet i et gitt bilde oppdages, og rektangulære ansiktskoordinater med høy presisjon returneres."
- Bildekategorietikett: Den identifiserer informasjon som objekter, scener og atferd i et bilde på grunnlag av dyplæringsmetoden.
- Bilde superoppløsning: Det sies å forstørre et bilde på en intelligent måte basert på dyp læring. Den kan også undertrykke artefakter mens oppløsningen holdes uendret for et klarere og skarpere bilde.
- Karakterbilde superoppløsning: Den kan forstørre et bilde inkludert tegn med ni ganger. Det kan også "forsterke" definisjonen av tegnene på bildet.
- Kodegjenkjenning: I følge Huawei, "Kodedeteksjon leser raske svar (QR)-koder og strekkoder for å få informasjon inkludert i kodene, og gir dermed relaterte tjenester senere. Kodedeteksjonsevnen er integrert i applikasjoner."
Utviklere kan nå laste ned DDK, SDK og IDE til HiAI Engine via kildelenkene.
Takk til XDA-medlem Evolutios for tipset!
Kilde: HuaweiKilde 2: HuaweiKilde 3: Huawei