화웨이는 화웨이 P20에 HiAI 엔진을 출시했다. HiAI 엔진은 애플리케이션 기능을 열고 "다양한 AI 기능"을 통합합니다. 그 특징 장면 인식, 문서 감지 및 문서 수정, 코드 감지, 얼굴 감지 등이 있습니다.
화웨이가 출시한 메이트 10 시리즈 10월에는 HiSilicon Kirin 970 시스템온칩이 출시되었습니다. Kirin 970은 특히 NPU(신경 처리 장치) 형태의 AI 전용 하드웨어를 갖추고 있습니다. 지난 달, 또한 Huawei가 중국 시장을 위한 Google Assistant + Google Lens 경쟁 제품인 HiAssistant(HiAI 기반)를 개발하는 방법도 보여주었습니다.. 이제 Huawei는 Huawei P20과 함께 HiAI 엔진을 출시했습니다.
HiAI는 화웨이의 AI 컴퓨팅 플랫폼이다. 현재 Kirin 970 휴대폰의 전용 NPU는 카메라 앱의 실시간 객체 및 장면 인식과 같은 기능에 사용됩니다. Microsoft Translator의 오프라인 번역 가속화. 그러나 이러한 기능은 기계 학습 및 신경망의 전체 잠재력 중 작은 부분입니다. 스마트폰의 AI는 아직 초기 단계라고 말하는 것이 타당하지만 잠재적인 역량은 유망합니다.
Huawei에 따르면 HiAI 엔진은 애플리케이션 기능을 열고 "다양한 AI 기능과 앱을 통합합니다. 앱이 더욱 지능적이고 강력해졌습니다." 이제 개발자는 HiAI용 DDK(드라이버 개발 키트), SDK 및 IDE를 다운로드할 수 있습니다. 엔진.
HiAI 엔진의 애플리케이션 기능에는 컴퓨터 비전(CV) 엔진이 포함됩니다. 컴퓨터 비전 엔진은 "컴퓨터가 인간의 시각 시스템을 시뮬레이션하여 주변 환경을 감지하고 공간의 구성을 결정하고 인식하고 이해합니다." 화웨이. CV 엔진의 기능에는 이미지 초고해상도, 얼굴 인식 및 객체 인식이 포함됩니다(아래에 자세히 설명되어 있음).
HiAI 엔진에는 자동 음성 인식(ASR) 엔진도 포함되어 있습니다. 하지만 중국 이외의 지역에는 공개되지 않습니다. ASR 엔진은 사람의 음성을 텍스트로 변환하는 엔진으로, 그 기능에는 음성 인식, 음성 변환, TTS(텍스트 음성 변환)가 포함됩니다.
NLU(자연어 이해) 엔진도 HiAI 엔진 기능의 일부이지만 ASR 엔진과 마찬가지로 중국 외부에는 공개되지 않습니다. 이를 통해 컴퓨터는 인간의 음성을 이해하고 의사소통이나 자연스러운 행동을 수행할 수 있습니다. 그 기능에는 단어 분할, 텍스트 개체 인식, 감정 경향 분석 및 기계 번역이 포함됩니다.
HiAI 엔진의 특징은 다음과 같습니다.
- 장면 감지: 이미지 내용 속 장면을 인식하여 이미지를 "신속하게 분류"합니다. Huawei는 현재 다양한 유형의 장면 인식이 높은 정확도로 지원된다고 밝혔습니다.
- 문서 수정 및 문서 감지: 문서의 각도를 보정할 수 있는 보조 강화 기능입니다. 또한, 이미지 속 문서의 위치 정보를 자동으로 인식할 수도 있습니다.
- 얼굴 인식 및 얼굴 비교: Huawei는 "얼굴 인식에서는 위치, 특징점, 자세에 대한 정보를 제공합니다. 주어진 이미지에서 사람의 얼굴이 감지되고 고정밀 얼굴 직사각형 좌표가 반환됩니다.
- 이미지 카테고리 라벨: 딥러닝 방식을 기반으로 이미지 속 객체, 장면, 행동 등의 정보를 식별합니다.
- 이미지 초해상도: 딥러닝을 기반으로 이미지를 지능적으로 확대해준다고 합니다. 또한 더 깨끗하고 선명한 이미지를 위해 해상도를 변경하지 않고 아티팩트를 억제할 수도 있습니다.
- 캐릭터 이미지 초해상도: 문자가 포함된 이미지를 9배까지 확대할 수 있습니다. 또한 이미지의 문자 정의를 "강화"할 수도 있습니다.
- 코드 감지: 화웨이에 따르면 "코드 감지는 QR(Quick Response) 코드와 바코드를 판독해 코드에 포함된 정보를 얻어 후속적으로 관련 서비스를 제공하는 기능이다. 코드 감지 기능은 애플리케이션에 통합되어 있습니다."
개발자는 이제 소스 링크를 통해 HiAI 엔진의 DDK, SDK 및 IDE를 다운로드할 수 있습니다.
XDA 회원님께 감사드립니다 진화론 팁을 위해!
출처: 화웨이출처 2: 화웨이출처 3: 화웨이