Huawei rilascia il motore HiAI con Huawei P20

Huawei ha rilasciato il motore HiAI con Huawei P20. Il motore HiAI apre le capacità applicative e integra "una pluralità di capacità AI". Le sue caratteristiche sono: riconoscimento scene, rilevamento documenti e correzione documenti, rilevamento codici, rilevamento volti e altro ancora.

Huawei ha lanciato il Serie Mate 10 in ottobre con il system-on-chip HiSilicon Kirin 970. Il Kirin 970 ha in particolare hardware dedicato per l'intelligenza artificiale, sotto forma di Neural Processing Unit (NPU). Lo scorso mese, abbiamo anche mostrato come Huawei stia sviluppando HiAssistant (powered by HiAI), un concorrente di Google Assistant + Google Lens per il mercato cinese. Ora, Huawei ha rilasciato l'HiAI Engine insieme all'Huawei P20.

HiAI è la piattaforma informatica AI di Huawei. Attualmente, la NPU dedicata sui telefoni Kirin 970 viene utilizzata per funzionalità come il riconoscimento di oggetti e scene in tempo reale nell'app della fotocamera, nonché per traduzione offline accelerata in Microsoft Translator

. Tuttavia, queste capacità rappresentano una piccola parte del potenziale complessivo dell’apprendimento automatico e delle reti neurali. È giusto dire che siamo ancora agli inizi per l'intelligenza artificiale negli smartphone, ma le potenziali capacità sono promettenti.

Secondo Huawei, l'HiAI Engine apre le capacità applicative, integra "una pluralità di funzionalità e app AI [che rendono] le app più intelligenti e potenti." Gli sviluppatori possono ora scaricare DDK (Driver Development Kit), SDK e IDE per HiAI Motore.

Le capacità applicative del motore HiAI includono un motore di visione artificiale (CV). Un motore di visione artificiale si riferisce alle "capacità con cui i computer simulano il sistema visivo umano percepire l'ambiente circostante e determinare, riconoscere e comprendere la composizione dello spazio", secondo Huawei. Le funzionalità del motore CV includono la super risoluzione delle immagini, il riconoscimento facciale e il riconoscimento degli oggetti (spiegati più dettagliatamente di seguito).

Il motore HiAI include anche un motore di riconoscimento vocale automatico (ASR). Non è aperto fuori dalla Cina, però. Un motore ASR è ciò che converte la voce umana in testo e le sue funzionalità includono riconoscimento vocale, conversione vocale e sintesi vocale (TTS).

Anche un motore di comprensione del linguaggio naturale (NLU) fa parte delle funzionalità del motore HiAI, ma come il motore ASR, non è aperto al di fuori della Cina. Consente ai computer di comprendere la voce umana, il che consente loro di eseguire comunicazioni o azioni naturali. Le sue funzionalità includono la segmentazione delle parole, il riconoscimento delle entità testuali, l'analisi delle tendenze emotive e la traduzione automatica.

Le caratteristiche dell'HiAI Engine sono:

  • Rilevamento della scena: "Categoria rapidamente" le immagini riconoscendo le scene nel contenuto dell'immagine. Huawei afferma che il riconoscimento di più tipi di scene è attualmente supportato con elevata precisione.
  • Correzione e rilevamento dei documenti: È una funzione di miglioramento dell'assistente che può correggere l'angolazione del documento. Può anche riconoscere automaticamente le informazioni sulla posizione del documento nell'immagine.
  • Rilevamento volti e Confronto facciale: Huawei afferma: "Nel rilevamento dei volti, le informazioni sulla posizione, i punti caratteristici e le posture dei viene rilevato il volto umano in una determinata immagine e vengono restituite le coordinate rettangolari del viso ad alta precisione.
  • Etichetta della categoria immagine: Identifica informazioni come oggetti, scene e comportamenti in un'immagine sulla base del metodo di deep learning.
  • Super risoluzione dell'immagine: Si dice che ingrandisca in modo intelligente un'immagine basata sul deep learning. Può anche sopprimere gli artefatti mantenendo la risoluzione invariata per un'immagine più chiara e nitida.
  • Super risoluzione dell'immagine del personaggio: Può ingrandire un'immagine compresi i caratteri di nove volte. Può anche "migliorare" la definizione dei caratteri sull'immagine.
  • Rilevamento del codice: Secondo Huawei, "Il rilevamento del codice legge i codici a risposta rapida (QR) e i codici a barre per ottenere le informazioni incluse nei codici, fornendo successivamente i servizi correlati. La capacità di rilevamento del codice è integrata nelle applicazioni."

Gli sviluppatori possono ora scaricare DDK, SDK e IDE di HiAI Engine tramite i collegamenti sorgente.

Grazie al membro XDA Evoluzioni per la mancia!


Fonte: HuaweiFonte 2: HuaweiFonte 3: Huawei