Huawei lança o HiAI Engine com o Huawei P20

A Huawei lançou o mecanismo HiAI com o Huawei P20. O mecanismo HiAI abre recursos de aplicativos e integra “uma pluralidade de recursos de IA”. Suas características são: reconhecimento de cena, detecção e correção de documentos, detecção de código, detecção de rosto e muito mais.

Huawei lançou o Série Mate 10 em outubro com o sistema em chip HiSilicon Kirin 970. O Kirin 970 possui hardware dedicado para IA, na forma de uma Unidade de Processamento Neural (NPU). Mês passado, também mostramos como a Huawei estava desenvolvendo o HiAssistant (desenvolvido por HiAI), um concorrente do Google Assistant + Google Lens para o mercado chinês. Agora, a Huawei lançou o HiAI Engine junto com o Huawei P20.

HiAI é a plataforma de computação de IA da Huawei. Atualmente, o NPU dedicado nos telefones Kirin 970 é usado para recursos como reconhecimento de objetos e cenas em tempo real no aplicativo da câmera, bem como tradução offline acelerada no Microsoft Translator. No entanto, essas capacidades representam uma pequena parte do potencial geral do aprendizado de máquina e das redes neurais. É justo dizer que ainda é cedo para a IA em smartphones, mas as capacidades potenciais são promissoras.

De acordo com a Huawei, o HiAI Engine abre capacidades de aplicação, integra “uma pluralidade de capacidades e aplicações de IA [que fazem] os aplicativos mais inteligentes e poderosos." Os desenvolvedores agora podem baixar o DDK (Driver Development Kit), SDK e IDE para HiAI Motor.

Os recursos de aplicação do mecanismo HiAI incluem um mecanismo de visão computacional (CV). Um mecanismo de Visão Computacional refere-se às "capacidades pelas quais os computadores simulam o sistema visual humano para sentir o ambiente e determinar, reconhecer e compreender a composição do espaço", de acordo com Huawei. Os recursos do mecanismo CV incluem Super Resolução de Imagem, Reconhecimento Facial e Reconhecimento de Objetos (que são explicados com mais detalhes abaixo).

O mecanismo HiAI também inclui um mecanismo de reconhecimento automático de fala (ASR). No entanto, não está aberto fora da China. Um mecanismo ASR é o que converte a voz humana em texto e seus recursos incluem reconhecimento de fala, conversão de fala e conversão de texto em fala (TTS).

Um mecanismo de compreensão de linguagem natural (NLU) também faz parte dos recursos do mecanismo HiAI, mas, assim como o mecanismo ASR, não está aberto fora da China. Ele permite que os computadores entendam a voz humana, o que lhes permite realizar comunicações ou ações naturais. Seus recursos incluem segmentação de palavras, reconhecimento de entidades de texto, análise de tendências emotivas e tradução automática.

Os recursos do mecanismo HiAI são:

  • Detecção de cena: Ele "categoriza rapidamente" as imagens reconhecendo as cenas no conteúdo da imagem. A Huawei afirma que o reconhecimento de vários tipos de cenas é atualmente suportado com alta precisão.
  • Correção e detecção de documentos: É uma função assistente de aprimoramento que pode corrigir o ângulo do documento. Ele também pode reconhecer automaticamente as informações de localização do documento na imagem.
  • Detecção de rosto e Comparação Facial: A Huawei afirma: "Na detecção de rosto, informações sobre a localização, pontos característicos e posturas de o rosto humano em uma determinada imagem é detectado e coordenadas faciais retangulares de alta precisão são retornadas."
  • Etiqueta de categoria de imagem: Ele identifica informações como objetos, cenas e comportamento em uma imagem com base no método de aprendizagem profunda.
  • Super resolução de imagem: Diz-se que amplia uma imagem de forma inteligente com base no aprendizado profundo. Ele também pode suprimir artefatos enquanto mantém a resolução inalterada para obter uma imagem mais clara e nítida.
  • Super resolução de imagem de personagem: Pode ampliar uma imagem incluindo caracteres em nove vezes. Também pode "melhorar" a definição dos caracteres da imagem.
  • Detecção de código: De acordo com a Huawei, “a detecção de código lê códigos de resposta rápida (QR) e códigos de barras para obter informações incluídas nos códigos, fornecendo assim serviços relacionados posteriormente. A capacidade de detecção de código está integrada nos aplicativos."

Os desenvolvedores agora podem baixar o DDK, SDK e IDE do HiAI Engine através dos links de origem.

Obrigado ao membro XDA Evoluções pela dica!


Fonte: HuaweiFonte 2: HuaweiFonte 3: Huawei