ファーウェイは、Huawei P20でHiAIエンジンをリリースしました。 HiAI エンジンはアプリケーション機能を開放し、「複数の AI 機能」を統合します。 その特徴 シーン認識、文書検出と文書修正、コード検出、顔検出などです。
ファーウェイが発売したのは、 Mate10シリーズ 10月にはHiSilicon Kirin 970システムオンチップを搭載。 Kirin 970 は特に、ニューラル プロセッシング ユニット (NPU) の形式で AI 専用のハードウェアを備えています。 先月、 また、ファーウェイが中国市場向けのGoogleアシスタント+Googleレンズの競合製品であるHiAssistant(HiAI搭載)をどのように開発しているかも示しました。. 今回、ファーウェイはファーウェイ P20 とともに HiAI エンジンをリリースしました。
HiAI は Huawei の AI コンピューティング プラットフォームです。 現在、Kirin 970 携帯電話の専用 NPU は、カメラ アプリでのリアルタイムのオブジェクトやシーンの認識などの機能に使用されています。 Microsoft Translator での高速オフライン翻訳. ただし、これらの機能は、機械学習とニューラル ネットワークの可能性全体のほんの一部にすぎません。 スマートフォンの AI はまだ初期段階にあると言っても過言ではありませんが、潜在的な機能は有望です。
ファーウェイによると、HiAIエンジンはアプリケーション機能を開放し、「複数のAI機能とアプリを統合する」という。 アプリはよりインテリジェントで強力です。」開発者は、HiAI 用の DDK (ドライバー開発キット)、SDK、および IDE をダウンロードできるようになりました。 エンジン。
HiAI エンジンのアプリケーション機能には、コンピューター ビジョン (CV) エンジンが含まれます。 コンピューター ビジョン エンジンとは、「コンピューターが人間の視覚システムをシミュレートして、 周囲環境を感知し、空間の構成を決定、認識、理解します」とのことです。 ファーウェイ。 CV エンジンの機能には、画像超解像度、顔認識、およびオブジェクト認識 (以下で詳しく説明します) が含まれます。
HiAI エンジンには、自動音声認識 (ASR) エンジンも含まれています。 ただし、中国国外ではオープンしていません。 ASR エンジンは人間の音声をテキストに変換するもので、その機能には音声認識、音声変換、テキスト読み上げ (TTS) が含まれます。
自然言語理解 (NLU) エンジンも HiAI エンジンの機能の一部ですが、ASR エンジンと同様、中国国外では公開されていません。 これにより、コンピューターは人間の音声を理解できるようになり、コミュニケーションや自然な動作が可能になります。 その機能には、単語の分割、テキスト エンティティの認識、感情傾向分析、機械翻訳が含まれます。
HiAI エンジンの特徴は次のとおりです。
- シーン検出:画像内容のシーンを認識して画像を「迅速に分類」します。 ファーウェイは、現在、複数種類のシーンの認識が高精度でサポートされていると述べています。
- 文書の修正と文書の検出: 原稿の角度を補正できるアシスタントエンハンス機能です。 画像内の原稿の位置情報を自動認識することも可能です。
- 顔検出と 顔の比較: ファーウェイは「顔検出では、顔の位置、特徴点、姿勢に関する情報が取得されます」と述べています。 指定された画像内の人間の顔を検出し、高精度の顔の直交座標を返します。」
- 画像カテゴリラベル: ディープラーニング手法に基づいて、画像内の物体、シーン、動作などの情報を識別します。
- 画像の超解像:ディープラーニングに基づいて画像をインテリジェントに拡大すると言われています。 また、解像度を変えずにアーティファクトを抑制し、より鮮明でシャープな画像を実現します。
- キャラクター画像の超解像:文字を含む画像を9倍に拡大できます。 画像上の文字の鮮明さを「強化」することもできます。
- コード検出: ファーウェイによると、「コード検出は、QR(Quick Response)コードやバーコードを読み取り、コードに含まれる情報を取得し、関連サービスを提供します。 コード検出機能はアプリケーションに統合されています。」
開発者は、ソース リンクから HiAI Engine の DDK、SDK、IDE をダウンロードできるようになりました。
XDAメンバーに感謝します エボリューティオス ヒントのために!
出典: ファーウェイ出典 2: ファーウェイ出典 3: ファーウェイ