Huawei har släppt HiAI-motorn med Huawei P20. HiAI-motorn öppnar applikationsmöjligheter och integrerar "ett flertal AI-funktioner." Dess funktioner är: scenigenkänning, dokumentdetektering och dokumentkorrigering, koddetektering, ansiktsdetektering och mer.
Huawei lanserade Mate 10-serien i oktober med HiSilicon Kirin 970 system-on-chip. Kirin 970 har särskilt dedikerad hårdvara för AI, i form av en Neural Processing Unit (NPU). Förra månaden, vi visade också hur Huawei utvecklade HiAssistant (driven av HiAI), en Google Assistant + Google Lens-konkurrent för den kinesiska marknaden. Nu har Huawei släppt HiAI Engine tillsammans med Huawei P20.
HiAI är Huaweis AI-datorplattform. För närvarande används den dedikerade NPU på Kirin 970-telefonerna för funktioner som objekt- och scenigenkänning i realtid i kameraappen, samt accelererad offlineöversättning i Microsoft Translator. Dessa funktioner är dock en liten del av den totala potentialen för maskininlärning och neurala nätverk. Det är rättvist att säga att det är tidiga dagar ännu för AI i smartphones, men de potentiella funktionerna är lovande.
Enligt Huawei öppnar HiAI Engine applikationsfunktioner, integrerar "ett flertal AI-funktioner och appar [som gör] apparna mer intelligenta och kraftfulla." Utvecklare kan nu ladda ner DDK (Driver Development Kit), SDK och IDE för HiAI Motor.
Tillämpningsmöjligheterna för HiAI-motorn inkluderar en datorvisionsmotor (CV). En Computer Vision-motor hänvisar till "funktionerna som datorer simulerar det mänskliga visuella systemet till känna av den omgivande miljön och bestämma, känna igen och förstå rymdens sammansättning", enligt Huawei. CV-motorns funktioner inkluderar superupplösning för bild, ansiktsigenkänning och objektigenkänning (vilka förklaras mer i detalj nedan).
HiAI-motorn inkluderar också en automatisk taligenkänningsmotor (ASR). Det är dock inte öppet utanför Kina. En ASR-motor är det som omvandlar mänsklig röst till text, och dess funktioner inkluderar taligenkänning, talkonvertering och text-till-tal (TTS).
En motor för naturlig språkförståelse (NLU) är också en del av funktionerna i HiAI-motorn, men liksom ASR-motorn är den inte öppen utanför Kina. Det gör det möjligt för datorer att förstå mänsklig röst, vilket gör att de kan utföra kommunikation eller naturliga handlingar. Dess funktioner inkluderar ordsegmentering, textenhetsigenkänning, känslomässiga tendensanalys och maskinöversättning.
Funktionerna hos HiAI Engine är:
- Scenavkänning: Den "kategoriserar snabbt" bilder genom att känna igen scenerna i bildens innehåll. Huawei uppger att igenkänning av flera typer av scener för närvarande stöds med hög noggrannhet.
- Dokumentkorrigering och dokumentavkänning: Det är en assisterande förbättringsfunktion som kan korrigera dokumentets vinkel. Den kan också automatiskt känna igen platsinformationen för dokumentet i bilden.
- Ansiktsavkänning och Ansiktsjämförelse: Huawei säger: "Vid ansiktsdetektion, information om platsen, karakteristiska punkter och ställningar för det mänskliga ansiktet i en given bild detekteras, och högprecisions ansiktsrektangulära koordinater returneras."
- Bildkategorietikett: Den identifierar information som objekt, scener och beteende i en bild utifrån metoden för djupinlärning.
- Bild superupplösning: Det sägs att det på ett intelligent sätt förstora en bild baserat på djupinlärning. Det kan också undertrycka artefakter samtidigt som upplösningen hålls oförändrad för en tydligare och skarpare bild.
- Karaktärsbild Superupplösning: Det kan förstora en bild inklusive tecken med nio gånger. Det kan också "förbättra" definitionen av tecknen på bilden.
- Koddetektering: Enligt Huawei läser koddetektering snabba svar (QR)-koder och streckkoder för att få information som ingår i koderna, och tillhandahåller därmed relaterade tjänster i efterhand. Funktionen för koddetektering är integrerad i applikationer."
Utvecklare kan nu ladda ner DDK, SDK och IDE för HiAI Engine via källlänkarna.
Tack till XDA-medlem Evolutios för tipset!
Källa: HuaweiKälla 2: HuaweiKälla 3: Huawei