Huawei lance le moteur HiAI avec le Huawei P20

Huawei a lancé le moteur HiAI avec le Huawei P20. Le moteur HiAI ouvre les capacités des applications et intègre « une pluralité de capacités d'IA ». Ses fonctionnalités sont: la reconnaissance de scène, la détection et la correction de documents, la détection de code, la détection de visage, etc.

Huawei a lancé le Série Mate 10 en octobre avec le système sur puce HiSilicon Kirin 970. Le Kirin 970 dispose notamment d'un matériel dédié à l'IA, sous la forme d'une Neural Processing Unit (NPU). Le mois dernier, nous avons également montré comment Huawei développait HiAssistant (optimisé par HiAI), un concurrent de Google Assistant + Google Lens pour le marché chinois. Aujourd'hui, Huawei a lancé le moteur HiAI aux côtés du Huawei P20.

HiAI est la plateforme informatique d'IA de Huawei. Actuellement, le NPU dédié des téléphones Kirin 970 est utilisé pour des fonctionnalités telles que la reconnaissance d'objets et de scènes en temps réel dans l'application appareil photo, ainsi que pour traduction hors ligne accélérée dans Microsoft Translator

. Cependant, ces capacités ne représentent qu’une petite partie du potentiel global de l’apprentissage automatique et des réseaux neuronaux. Il est juste de dire que l’IA dans les smartphones n’en est qu’à ses débuts, mais les capacités potentielles sont prometteuses.

Selon Huawei, le moteur HiAI ouvre les capacités des applications, intègre « une pluralité de capacités et d'applications d'IA [qui font] les applications plus intelligentes et puissantes. " Les développeurs peuvent désormais télécharger le DDK (Driver Development Kit), le SDK et l'IDE pour HiAI. Moteur.

Les capacités d'application du moteur HiAI incluent un moteur de vision par ordinateur (CV). Un moteur de vision par ordinateur fait référence aux « capacités par lesquelles les ordinateurs simulent le système visuel humain pour ressentir l'environnement ambiant et déterminer, reconnaître et comprendre la composition de l'espace », selon Huawei. Les capacités du moteur CV incluent la super résolution d'image, la reconnaissance faciale et la reconnaissance d'objets (qui sont expliquées plus en détail ci-dessous).

Le moteur HiAI comprend également un moteur de reconnaissance vocale automatique (ASR). Il n'est cependant pas ouvert en dehors de la Chine. Un moteur ASR convertit la voix humaine en texte et ses capacités incluent la reconnaissance vocale, la conversion vocale et la synthèse vocale (TTS).

Un moteur de compréhension du langage naturel (NLU) fait également partie des capacités du moteur HiAI, mais comme le moteur ASR, il n'est pas ouvert en dehors de la Chine. Il permet aux ordinateurs de comprendre la voix humaine, ce qui leur permet d'effectuer des communications ou des actions naturelles. Ses capacités incluent la segmentation des mots, la reconnaissance des entités de texte, l'analyse des tendances émotionnelles et la traduction automatique.

Les fonctionnalités du moteur HiAI sont :

  • Détection de scène: Il « catégorise rapidement » les images en reconnaissant les scènes dans le contenu de l'image. Huawei déclare que la reconnaissance de plusieurs types de scènes est actuellement prise en charge avec une grande précision.
  • Correction de documents et détection de documents: Il s'agit d'une fonction d'amélioration assistante qui permet de corriger l'angle du document. Il peut également reconnaître automatiquement les informations de localisation du document dans l'image.
  • Détection des visages et Comparaison faciale: Huawei déclare: « Dans la détection des visages, les informations sur l'emplacement, les points caractéristiques et les postures des le visage humain dans une image donnée est détecté et les coordonnées rectangulaires du visage de haute précision sont renvoyées.
  • Libellé de la catégorie d'image: Il identifie des informations telles que des objets, des scènes et des comportements dans une image sur la base de la méthode d'apprentissage profond.
  • Super résolution d'image: On dit qu'il agrandit intelligemment une image grâce à l'apprentissage profond. Il peut également supprimer les artefacts tout en conservant la résolution inchangée pour une image plus claire et plus nette.
  • Super résolution de l'image du personnage: Il peut agrandir une image comprenant des caractères de neuf fois. Il peut également « améliorer » la définition des caractères sur l’image.
  • Détection de codes: Selon Huawei, « la détection de code lit les codes à réponse rapide (QR) et les codes à barres pour obtenir les informations incluses dans les codes, fournissant ainsi des services associés par la suite. La capacité de détection de code est intégrée dans les applications."

Les développeurs peuvent désormais télécharger le DDK, le SDK et l'IDE du moteur HiAI via les liens sources.

Merci au membre XDA Évolutions pour le conseil !


Source: HuaweiSource 2: HuaweiSource 3: Huawei