Huawei wypuszcza silnik HiAI w Huawei P20

Huawei wypuścił silnik HiAI w Huawei P20. Silnik HiAI otwiera możliwości aplikacji i integruje „wiele możliwości AI”. Jego cechy należą: rozpoznawanie sceny, wykrywanie i poprawianie dokumentów, wykrywanie kodu, wykrywanie twarzy i inne.

Huawei uruchomił Seria Mate 10 w październiku z systemem HiSilicon Kirin 970 na chipie. W szczególności Kirin 970 ma dedykowany sprzęt dla sztucznej inteligencji w postaci jednostki przetwarzania neuronowego (NPU). W zeszłym miesiącu, pokazaliśmy także, jak Huawei rozwijał HiAssistant (oparty na HiAI), konkurenta Google Assistant + Google Lens na rynek chiński. Teraz Huawei wypuścił silnik HiAI wraz z Huawei P20.

HiAI to platforma obliczeniowa AI firmy Huawei. Obecnie dedykowana jednostka NPU w telefonach Kirin 970 jest wykorzystywana do takich funkcji, jak rozpoznawanie obiektów i scen w czasie rzeczywistym w aplikacji aparatu, a także przyspieszone tłumaczenie offline w Microsoft Translator. Możliwości te stanowią jednak niewielką część ogólnego potencjału uczenia maszynowego i sieci neuronowych. Można śmiało powiedzieć, że to dopiero początek rozwoju sztucznej inteligencji w smartfonach, ale potencjalne możliwości są obiecujące.

Według Huawei silnik HiAI otwiera możliwości aplikacji, integruje „wiele możliwości i aplikacji AI [które sprawiają, że] aplikacje są bardziej inteligentne i wydajne.” Programiści mogą teraz pobrać DDK (Driver Development Kit), SDK i IDE dla HiAI Silnik.

Możliwości aplikacji silnika HiAI obejmują silnik widzenia komputerowego (CV). Silnik widzenia komputerowego odnosi się do „możliwości, za pomocą których komputery symulują ludzki układ wzrokowy wyczuwać otaczające środowisko oraz określać, rozpoznawać i rozumieć skład przestrzeni” – wg Huaweia. Możliwości silnika CV obejmują superrozdzielczość obrazu, rozpoznawanie twarzy i rozpoznawanie obiektów (które wyjaśniono bardziej szczegółowo poniżej).

Silnik HiAI zawiera również silnik automatycznego rozpoznawania mowy (ASR). Nie jest jednak otwarty poza Chinami. Silnik ASR przekształca ludzki głos na tekst, a jego możliwości obejmują rozpoznawanie mowy, konwersję mowy i zamianę tekstu na mowę (TTS).

Silnik rozumienia języka naturalnego (NLU) również stanowi część możliwości silnika HiAI, ale podobnie jak silnik ASR nie jest dostępny poza Chinami. Umożliwia komputerom rozumienie ludzkiego głosu, co pozwala im na wykonywanie komunikacji lub naturalnych czynności. Jego możliwości obejmują segmentację słów, rozpoznawanie jednostek tekstowych, analizę tendencji emocjonalnych i tłumaczenie maszynowe.

Cechy silnika HiAI to:

  • Wykrywanie scen: „szybko kategoryzuje” obrazy, rozpoznając sceny w treści obrazu. Huawei twierdzi, że rozpoznawanie wielu typów scen jest obecnie obsługiwane z dużą dokładnością.
  • Korekta dokumentu i wykrywanie dokumentu: Jest to funkcja wspomagająca, która może korygować kąt dokumentu. Może także automatycznie rozpoznać informacje o lokalizacji dokumentu na obrazie.
  • Wykrywanie twarzy i Porównanie twarzy: Huawei stwierdza: „W przypadku wykrywania twarzy informacje o lokalizacji, charakterystycznych punktach i postawie wykrywana jest ludzka twarz na danym obrazie i zwracane są bardzo precyzyjne współrzędne prostokątne twarzy.
  • Etykieta kategorii obrazu: Identyfikuje informacje takie jak obiekty, sceny i zachowania na obrazie w oparciu o metodę głębokiego uczenia się.
  • Super rozdzielczość obrazu: Mówi się, że inteligentnie powiększa obraz w oparciu o głębokie uczenie się. Może także tłumić artefakty, zachowując niezmienioną rozdzielczość, zapewniając wyraźniejszy i ostrzejszy obraz.
  • Super rozdzielczość obrazu postaci: Może powiększyć obraz zawierający znaki dziewięciokrotnie. Może także „poprawić” definicję znaków na obrazie.
  • Wykrywanie kodu: Według Huawei „wykrywanie kodów odczytuje kody szybkiej reakcji (QR) i kody kreskowe w celu uzyskania informacji zawartych w kodach, co pozwala później świadczyć powiązane usługi. Możliwość wykrywania kodu jest zintegrowana z aplikacjami.”

Programiści mogą teraz pobrać DDK, SDK i IDE silnika HiAI za pośrednictwem łączy źródłowych.

Dziękuję członkowi XDA Ewolucje za wskazówkę!


Źródło: HuaweiŹródło 2: HuaweiŹródło 3: Huawei