Huawei hat die HiAI-Engine mit dem Huawei P20 veröffentlicht. Die HiAI-Engine eröffnet Anwendungsfunktionen und integriert „eine Vielzahl von KI-Funktionen“. Seine Eigenschaften sind: Szenenerkennung, Dokumentenerkennung und Dokumentenkorrektur, Codeerkennung, Gesichtserkennung und mehr.
Huawei hat das auf den Markt gebracht Mate 10-Serie im Oktober mit dem HiSilicon Kirin 970 System-on-Chip. Der Kirin 970 verfügt insbesondere über dedizierte Hardware für KI in Form einer Neural Processing Unit (NPU). Im vergangenen Monat, Wir zeigten auch, wie Huawei HiAssistant (powered by HiAI) entwickelte, einen Konkurrenten von Google Assistant + Google Lens für den chinesischen Markt. Jetzt hat Huawei zusammen mit dem Huawei P20 die HiAI Engine veröffentlicht.
HiAI ist die KI-Computing-Plattform von Huawei. Derzeit wird die dedizierte NPU auf den Kirin 970-Telefonen für Funktionen wie Echtzeit-Objekt- und Szenenerkennung in der Kamera-App sowie verwendet beschleunigte Offline-Übersetzung in Microsoft Translator
. Allerdings sind diese Fähigkeiten nur ein kleiner Teil des Gesamtpotenzials von maschinellem Lernen und neuronalen Netzen. Man kann durchaus sagen, dass KI in Smartphones noch in den Kinderschuhen steckt, aber die potenziellen Fähigkeiten sind vielversprechend.Laut Huawei eröffnet die HiAI Engine Anwendungsfunktionen und integriert „eine Vielzahl von KI-Funktionen und Apps, die die Apps intelligenter und leistungsfähiger.“ Entwickler können jetzt das DDK (Driver Development Kit), das SDK und die IDE für die HiAI herunterladen Motor.
Zu den Anwendungsmöglichkeiten der HiAI-Engine gehört eine Computer Vision (CV)-Engine. Eine Computer-Vision-Engine bezieht sich auf die „Fähigkeiten, mit denen Computer das menschliche visuelle System simulieren“. „Sie spüren die Umgebung und bestimmen, erkennen und verstehen die Zusammensetzung des Raums“, heißt es Huawei. Zu den Fähigkeiten der CV-Engine gehören Image Super Resolution, Gesichtserkennung und Objekterkennung (die weiter unten ausführlicher erläutert werden).
Die HiAI-Engine umfasst auch eine automatische Spracherkennungs-Engine (ASR). Außerhalb Chinas ist es jedoch nicht geöffnet. Eine ASR-Engine wandelt menschliche Stimme in Text um. Zu ihren Funktionen gehören Spracherkennung, Sprachkonvertierung und Text-to-Speech (TTS).
Eine NLU-Engine (Natural Language Understanding) gehört ebenfalls zu den Funktionen der HiAI-Engine, ist aber wie die ASR-Engine außerhalb Chinas nicht verfügbar. Es ermöglicht Computern, die menschliche Stimme zu verstehen und so Kommunikation oder natürliche Aktionen durchzuführen. Zu seinen Fähigkeiten gehören Wortsegmentierung, Erkennung von Textentitäten, Analyse emotionaler Tendenzen und maschinelle Übersetzung.
Die Funktionen der HiAI Engine sind:
- Szenenerkennung: Es „kategorisiert“ Bilder schnell, indem es die Szenen im Bildinhalt erkennt. Huawei gibt an, dass die Erkennung mehrerer Arten von Szenen derzeit mit hoher Genauigkeit unterstützt wird.
- Dokumentenkorrektur und Dokumentenerkennung: Dabei handelt es sich um eine Assistenten-Verbesserungsfunktion, die den Winkel des Dokuments korrigieren kann. Es kann auch automatisch die Standortinformationen des Dokuments im Bild erkennen.
- Gesichtserkennung und Gesichtsvergleich: Huawei erklärt: „Bei der Gesichtserkennung werden Informationen über den Standort, charakteristische Punkte und Körperhaltungen erfasst.“ Das menschliche Gesicht in einem bestimmten Bild wird erkannt und hochpräzise rechteckige Gesichtskoordinaten werden zurückgegeben.“
- Bildkategoriebezeichnung: Es identifiziert Informationen wie Objekte, Szenen und Verhalten in einem Bild auf Basis der Deep-Learning-Methode.
- Bild-Superauflösung: Es soll ein Bild basierend auf Deep Learning intelligent vergrößern. Außerdem können Artefakte unterdrückt werden, während die Auflösung unverändert bleibt, um ein klareres und schärferes Bild zu erhalten.
- Zeichenbild-Superauflösung: Es kann ein Bild einschließlich Zeichen um das Neunfache vergrößern. Es kann auch die Definition der Zeichen auf dem Bild „verbessern“.
- Codeerkennung: Laut Huawei „liest die Codeerkennung Quick-Response-Codes (QR) und Barcodes, um in den Codes enthaltene Informationen zu erhalten, und stellt so anschließend entsprechende Dienste bereit.“ Die Codeerkennungsfunktion ist in Anwendungen integriert.“
Entwickler können jetzt das DDK, SDK und die IDE der HiAI Engine über die Quelllinks herunterladen.
Vielen Dank an XDA-Mitglied Entwicklungen für den Tipp!
Quelle: HuaweiQuelle 2: HuaweiQuelle 3: Huawei