Huawei uvolňuje HiAI Engine s Huawei P20

Huawei uvolnil HiAI engine s Huawei P20. Motor HiAI otevírá možnosti aplikací a integruje „množství schopností AI“. Jeho vlastnosti jsou: rozpoznávání scén, detekce a oprava dokumentů, detekce kódu, detekce obličeje a další.

Huawei spustil Řada Mate 10 v říjnu se systémem HiSilicon Kirin 970 na čipu. Kirin 970 má zejména vyhrazený hardware pro umělou inteligenci ve formě neurální procesorové jednotky (NPU). Minulý měsíc, také jsme ukázali, jak Huawei vyvíjí HiAssistant (využívá technologii HiAI), konkurenta Google Assistant + Google Lens pro čínský trh. Nyní Huawei vydal HiAI Engine spolu s Huawei P20.

HiAI je výpočetní platforma AI společnosti Huawei. V současné době se vyhrazený NPU na telefonech Kirin 970 používá pro funkce, jako je rozpoznávání objektů a scén v reálném čase v aplikaci fotoaparátu a také zrychlený offline překlad v Microsoft Translator. Tyto schopnosti jsou však malou částí celkového potenciálu strojového učení a neuronových sítí. Je fér říci, že na AI v chytrých telefonech je ještě brzy, ale potenciální schopnosti jsou slibné.

Podle Huawei otevírá HiAI Engine možnosti aplikací, integruje „množství možností umělé inteligence a aplikací [které vytvářejí] aplikace jsou inteligentnější a výkonnější." Vývojáři si nyní mohou stáhnout DDK (Driver Development Kit), SDK a IDE pro HiAI Motor.

Aplikační schopnosti enginu HiAI zahrnují motor počítačového vidění (CV). Engine Computer Vision odkazuje na „schopnosti, kterými počítače simulují lidský vizuální systém vnímat okolní prostředí a určovat, rozpoznávat a chápat složení prostoru,“ uvádí Huawei. Mezi schopnosti CV motoru patří Image Super Resolution, Facial Recognition a Object Recognition (které jsou podrobněji vysvětleny níže).

Motor HiAI také obsahuje motor automatického rozpoznávání řeči (ASR). Mimo Čínu však otevřeno není. ASR engine je to, co převádí lidský hlas na text, a jeho schopnosti zahrnují rozpoznávání řeči, převod řeči a převod textu na řeč (TTS).

Součástí schopností motoru HiAI je také engine pro porozumění přirozenému jazyku (NLU), ale stejně jako motor ASR není otevřený mimo Čínu. Umožňuje počítačům porozumět lidskému hlasu, což jim umožňuje provádět komunikaci nebo přirozené akce. Mezi jeho schopnosti patří segmentace slov, rozpoznávání textových entit, analýza emotivních tendencí a strojový překlad.

Funkce HiAI Engine jsou:

  • Detekce scény: „Rychle kategorizuje“ snímky rozpoznáním scén v obsahu snímku. Huawei uvádí, že rozpoznávání více typů scén je v současnosti podporováno s vysokou přesností.
  • Oprava a detekce dokumentů: Je to funkce asistenta vylepšení, která dokáže opravit úhel dokumentu. Dokáže také automaticky rozpoznat informace o umístění dokumentu na obrázku.
  • Detekce obličeje a Porovnání obličeje: Huawei uvádí: „Při detekci obličeje informace o poloze, charakteristických bodech a pozicích je detekována lidská tvář na daném obrázku a jsou vráceny vysoce přesné pravoúhlé souřadnice obličeje."
  • Štítek kategorie obrázku: Na základě metody hlubokého učení identifikuje informace, jako jsou předměty, scény a chování v obraze.
  • Super rozlišení obrazu: Říká se, že inteligentně zvětšuje obraz na základě hlubokého učení. Dokáže také potlačit artefakty při zachování rozlišení beze změny pro jasnější a ostřejší obraz.
  • Obrázek postavy Super rozlišení: Může devětkrát zvětšit obrázek včetně znaků. Může také "vylepšit" definici znaků na obrázku.
  • Detekce kódu: Podle Huawei „Detekce kódu čte kódy rychlé odezvy (QR) a čárové kódy, aby získala informace obsažené v kódech, čímž následně poskytuje související služby. Schopnost detekce kódu je integrována do aplikací."

Vývojáři si nyní mohou stáhnout DDK, SDK a IDE HiAI Engine prostřednictvím zdrojových odkazů.

Díky člen XDA Evolutios za tip!


Zdroj: HuaweiZdroj 2: HuaweiZdroj 3: Huawei