Huawei lanza el motor HiAI con el Huawei P20

Huawei ha lanzado el motor HiAI con el Huawei P20. El motor HiAI abre capacidades de aplicación e integra "una pluralidad de capacidades de IA". Sus caracteristicas son: reconocimiento de escenas, detección y corrección de documentos, detección de códigos, detección de rostros y más.

Huawei lanzó el Serie compañero 10 en octubre con el sistema en chip HiSilicon Kirin 970. En particular, el Kirin 970 tiene hardware dedicado para la IA, en forma de una Unidad de Procesamiento Neural (NPU). El mes pasado, También mostramos cómo Huawei estaba desarrollando HiAssistant (impulsado por HiAI), un competidor de Google Assistant + Google Lens para el mercado chino.. Ahora, Huawei ha lanzado HiAI Engine junto con el Huawei P20.

HiAI es la plataforma informática de IA de Huawei. Actualmente, la NPU dedicada en los teléfonos Kirin 970 se utiliza para funciones como el reconocimiento de escenas y objetos en tiempo real en la aplicación de la cámara, así como para traducción acelerada sin conexión en Microsoft Translator

. Sin embargo, estas capacidades son una pequeña parte del potencial general del aprendizaje automático y las redes neuronales. Es justo decir que aún es temprano para la IA en los teléfonos inteligentes, pero las capacidades potenciales son prometedoras.

Según Huawei, HiAI Engine abre capacidades de aplicaciones e integra "una pluralidad de capacidades y aplicaciones de IA [que hacen] las aplicaciones son más inteligentes y potentes". Los desarrolladores ahora pueden descargar el DDK (kit de desarrollo de controladores), el SDK y el IDE para HiAI. Motor.

Las capacidades de aplicación del motor HiAI incluyen un motor de visión por computadora (CV). Un motor de visión por computadora se refiere a las "capacidades mediante las cuales las computadoras simulan el sistema visual humano para sentir el entorno ambiental y determinar, reconocer y comprender la composición del espacio", según Huawei. Las capacidades del motor CV incluyen superresolución de imagen, reconocimiento facial y reconocimiento de objetos (que se explican con más detalle a continuación).

El motor HiAI también incluye un motor de reconocimiento automático de voz (ASR). Sin embargo, no está abierto fuera de China. Un motor ASR es lo que convierte la voz humana en texto y sus capacidades incluyen reconocimiento de voz, conversión de voz y texto a voz (TTS).

Un motor de comprensión del lenguaje natural (NLU) también forma parte de las capacidades del motor HiAI, pero al igual que el motor ASR, no está abierto fuera de China. Permite a las computadoras comprender la voz humana, lo que les permite realizar comunicaciones o acciones naturales. Sus capacidades incluyen segmentación de palabras, reconocimiento de entidades de texto, análisis de tendencias emotivas y traducción automática.

Las características del motor HiAI son:

  • Detección de escena: "Categoriza rápidamente" imágenes reconociendo las escenas en el contenido de la imagen. Huawei afirma que actualmente se admite el reconocimiento de múltiples tipos de escenas con alta precisión.
  • Corrección de documentos y detección de documentos: Es una función de mejora del asistente que puede corregir el ángulo del documento. También puede reconocer automáticamente la información de ubicación del documento en la imagen.
  • Detección de rostros y Comparación facial: Huawei afirma: "En la detección de rostros, se proporciona información sobre la ubicación, puntos característicos y posturas de Se detecta el rostro humano en una imagen determinada y se devuelven coordenadas rectangulares faciales de alta precisión".
  • Etiqueta de categoría de imagen: Identifica información como objetos, escenas y comportamientos en una imagen basándose en el método de aprendizaje profundo.
  • Imagen súper resolución: Se dice que amplía de forma inteligente una imagen basándose en el aprendizaje profundo. También puede suprimir artefactos manteniendo la resolución sin cambios para obtener una imagen más clara y nítida.
  • Imagen de personaje en súper resolución: Puede ampliar una imagen que incluye caracteres nueve veces. También puede "mejorar" la definición de los personajes de la imagen.
  • Detección de código: Según Huawei, "la detección de códigos lee códigos de respuesta rápida (QR) y códigos de barras para obtener la información incluida en los códigos, proporcionando así servicios relacionados posteriormente. La capacidad de detección de códigos está integrada en las aplicaciones".

Los desarrolladores ahora pueden descargar el DDK, SDK e IDE de HiAI Engine a través de los enlaces de origen.

Gracias al miembro de XDA evoluciones por la propina!


Fuente: HuaweiFuente 2: HuaweiFuente 3: Huawei