Huawei har frigivet HiAI-motoren med Huawei P20. HiAI-motoren åbner applikationsmuligheder og integrerer "en flerhed af AI-kapaciteter." Dens funktioner er: scenegenkendelse, dokumentgenkendelse og dokumentkorrektion, kodegenkendelse, ansigtsgenkendelse og mere.
Huawei lancerede Mate 10-serien i oktober med HiSilicon Kirin 970 system-on-chip. Kirin 970 har især dedikeret hardware til AI, i form af en Neural Processing Unit (NPU). Sidste måned, vi viste også, hvordan Huawei udviklede HiAssistant (drevet af HiAI), en Google Assistant + Google Lens-konkurrent til det kinesiske marked. Nu har Huawei frigivet HiAI Engine sammen med Huawei P20.
HiAI er Huaweis AI-computerplatform. I øjeblikket bruges den dedikerede NPU på Kirin 970-telefonerne til funktioner såsom objekt- og scenegenkendelse i realtid i kamera-appen, samt accelereret offlineoversættelse i Microsoft Translator. Disse egenskaber er dog en lille del af det samlede potentiale for maskinlæring og neurale netværk. Det er rimeligt at sige, at det er tidlige dage endnu for AI i smartphones, men de potentielle muligheder er lovende.
Ifølge Huawei åbner HiAI Engine applikationsfunktioner, integrerer "en flerhed af AI-funktioner og apps [der gør] apps mere intelligente og kraftfulde." Udviklere kan nu downloade DDK (Driver Development Kit), SDK og IDE til HiAI Motor.
HiAI-motorens applikationsmuligheder omfatter en computersynsmotor (CV). En Computer Vision-motor refererer til de "egenskaber, som computere simulerer det menneskelige visuelle system til fornemme det omgivende miljø og bestemme, genkende og forstå rummets sammensætning," ifølge Huawei. Funktionerne i CV-motoren omfatter billedsuperopløsning, ansigtsgenkendelse og objektgenkendelse (som forklares mere detaljeret nedenfor).
HiAI-motoren inkluderer også en automatisk talegenkendelsesmotor (ASR). Det er dog ikke åbent uden for Kina. En ASR-motor er det, der konverterer menneskelig stemme til tekst, og dens muligheder omfatter talegenkendelse, talekonvertering og tekst-til-tale (TTS).
En motor til naturlig sprogforståelse (NLU) er også en del af HiAI-motorens muligheder, men ligesom ASR-motoren er den ikke åben uden for Kina. Det gør det muligt for computere at forstå menneskelig stemme, hvilket giver dem mulighed for at udføre kommunikation eller naturlige handlinger. Dens muligheder omfatter ordsegmentering, tekstentitetsgenkendelse, følelsesmæssig tendensanalyse og maskinoversættelse.
Funktionerne i HiAI Engine er:
- Sceneregistrering: Den "kategoriserer hurtigt" billeder ved at genkende scenerne i billedets indhold. Huawei oplyser, at genkendelse af flere typer scener i øjeblikket understøttes med høj nøjagtighed.
- Dokumentkorrektion og dokumentgenkendelse: Det er en assistentforbedringsfunktion, som kan korrigere dokumentets vinkel. Den kan også automatisk genkende placeringsoplysningerne for dokumentet på billedet.
- Ansigtsgenkendelse og Ansigtssammenligning: Huawei udtaler: "Ved ansigtsgenkendelse, information om placering, karakteristiske punkter og stillinger af det menneskelige ansigt i et givet billede detekteres, og højpræcisions rektangulære ansigtskoordinater returneres."
- Billedkategorietikett: Den identificerer information som objekter, scener og adfærd i et billede på baggrund af deep learning-metoden.
- Billede super opløsning: Det siges, at det intelligent forstørrer et billede baseret på dyb læring. Det kan også undertrykke artefakter, mens opløsningen holdes uændret for et klarere og skarpere billede.
- Karakterbillede superopløsning: Det kan forstørre et billede inklusive tegn med ni gange. Det kan også "forstærke" definitionen af tegnene på billedet.
- Koderegistrering: Ifølge Huawei, "Kodedetektion læser quick response (QR) koder og stregkoder for at få information inkluderet i koderne, og derved levere relaterede tjenester efterfølgende. Kodedetektionsevnen er integreret i applikationer."
Udviklere kan nu downloade DDK, SDK og IDE af HiAI Engine via kildelinkene.
Tak til XDA-medlem Evolutios for tippet!
Kilde: HuaweiKilde 2: HuaweiKilde 3: Huawei