Huawei ได้เปิดตัวเครื่องยนต์ HiAI กับ Huawei P20 กลไก HiAI เปิดความสามารถของแอปพลิเคชันและผสานรวม "ความสามารถด้าน AI จำนวนหนึ่ง" คุณสมบัติของมัน ได้แก่ การจดจำฉาก การตรวจจับเอกสารและการแก้ไขเอกสาร การตรวจจับโค้ด การตรวจจับใบหน้า และอื่นๆ
หัวเว่ยเปิดตัว เมท10ซีรีส์ ในเดือนตุลาคมด้วยระบบบนชิป HiSilicon Kirin 970 Kirin 970 มีฮาร์ดแวร์เฉพาะสำหรับ AI โดยเฉพาะ ในรูปแบบของหน่วยประมวลผลประสาท (NPU) เดือนที่แล้ว, เรายังแสดงให้เห็นวิธีที่ Huawei พัฒนา HiAssistant (ขับเคลื่อนโดย HiAI) ซึ่งเป็นคู่แข่งของ Google Assistant + Google Lens สำหรับตลาดจีน. ตอนนี้ Huawei ได้เปิดตัว HiAI Engine ควบคู่ไปกับ Huawei P20
HiAI คือแพลตฟอร์มประมวลผล AI ของ Huawei ปัจจุบัน NPU เฉพาะบนโทรศัพท์ Kirin 970 ใช้สำหรับฟีเจอร์ต่างๆ เช่น วัตถุแบบเรียลไทม์และการจดจำฉากในแอปกล้อง รวมถึง เร่งการแปลแบบออฟไลน์ใน Microsoft Translator. อย่างไรก็ตาม ความสามารถเหล่านี้เป็นเพียงส่วนเล็กๆ ของศักยภาพโดยรวมของการเรียนรู้ของเครื่องและโครงข่ายประสาทเทียม เป็นเรื่องที่ยุติธรรมที่จะกล่าวว่ามันยังเป็นวันแรกสำหรับ AI ในสมาร์ทโฟน แต่ความสามารถที่เป็นไปได้มีแนวโน้มที่ดี
ตามข้อมูลของ Huawei HiAI Engine เปิดความสามารถของแอปพลิเคชัน ผสานรวม "ความสามารถ AI และแอปจำนวนมาก [ที่สร้าง] แอพที่ชาญฉลาดและทรงพลังยิ่งขึ้น” ขณะนี้นักพัฒนาสามารถดาวน์โหลด DDK (ชุดพัฒนาไดรเวอร์), SDK และ IDE สำหรับ HiAI เครื่องยนต์.
ความสามารถในการใช้งานของกลไก HiAI รวมถึงกลไก Computer Vision (CV) เอ็นจิ้น Computer Vision หมายถึง "ความสามารถที่คอมพิวเตอร์จำลองระบบการมองเห็นของมนุษย์" สัมผัสสภาพแวดล้อมโดยรอบ และกำหนด รับรู้ และเข้าใจองค์ประกอบของพื้นที่" ตาม หัวเว่ย. ความสามารถของกลไก CV ได้แก่ Image Super Resolution, การจดจำใบหน้า และการจดจำวัตถุ (ซึ่งจะอธิบายในรายละเอียดเพิ่มเติมด้านล่าง)
กลไก HiAI ยังมีกลไกการรู้จำเสียงพูดอัตโนมัติ (ASR) อีกด้วย แม้ว่าจะไม่เปิดนอกประเทศจีนก็ตาม กลไก ASR คือสิ่งที่แปลงเสียงของมนุษย์เป็นข้อความ และความสามารถของมัน ได้แก่ การรู้จำเสียง การแปลงคำพูด และการแปลงข้อความเป็นคำพูด (TTS)
กลไกการเข้าใจภาษาธรรมชาติ (NLU) ก็เป็นส่วนหนึ่งของความสามารถของกลไก HiAI ด้วยเช่นกัน แต่ก็เหมือนกับกลไก ASR ที่ไม่ได้เปิดนอกประเทศจีน ช่วยให้คอมพิวเตอร์เข้าใจเสียงของมนุษย์ ซึ่งช่วยให้สามารถทำการสื่อสารหรือการกระทำตามธรรมชาติได้ ความสามารถประกอบด้วยการแบ่งส่วนคำ การจดจำเอนทิตีข้อความ การวิเคราะห์แนวโน้มทางอารมณ์ และการแปลด้วยคอมพิวเตอร์
คุณสมบัติของเครื่องยนต์ HiAI คือ:
- การตรวจจับฉาก: มัน "จัดหมวดหมู่อย่างรวดเร็ว" รูปภาพโดยจดจำฉากต่างๆ ในเนื้อหาของภาพ หัวเว่ยระบุว่าปัจจุบันการจดจำฉากหลายประเภทได้รับการสนับสนุนด้วยความแม่นยำสูง
- การแก้ไขเอกสารและการตรวจจับเอกสาร: เป็นฟังก์ชันช่วยเพิ่มประสิทธิภาพซึ่งสามารถแก้ไขมุมของเอกสารได้ นอกจากนี้ยังสามารถจดจำข้อมูลตำแหน่งของเอกสารในภาพได้โดยอัตโนมัติ
- การตรวจจับใบหน้าและ การเปรียบเทียบใบหน้า: Huawei ระบุว่า: "ในการตรวจจับใบหน้า ข้อมูลเกี่ยวกับตำแหน่ง จุดลักษณะ และท่าทางของ ตรวจพบใบหน้ามนุษย์ในภาพที่กำหนด และส่งคืนพิกัดสี่เหลี่ยมใบหน้าที่มีความแม่นยำสูง"
- ป้ายกำกับหมวดหมู่รูปภาพ: โดยจะระบุข้อมูล เช่น วัตถุ ฉาก และพฤติกรรมในภาพโดยอาศัยวิธีการเรียนรู้เชิงลึก
- ภาพความละเอียดสูงสุด: ว่ากันว่าสามารถขยายภาพอย่างชาญฉลาดโดยอิงจากการเรียนรู้เชิงลึก นอกจากนี้ยังสามารถระงับสิ่งแปลกปลอมในขณะที่รักษาความละเอียดไว้ไม่เปลี่ยนแปลงเพื่อให้ได้ภาพที่คมชัดยิ่งขึ้น
- ภาพตัวละครที่มีความละเอียดสูงสุด: สามารถขยายรูปภาพรวมทั้งตัวอักษรได้เก้าเท่า นอกจากนี้ยังสามารถ "ปรับปรุง" คำจำกัดความของตัวอักษรบนภาพได้อีกด้วย
- การตรวจจับรหัส: ตามที่ Huawei กล่าว "การตรวจจับโค้ดจะอ่านโค้ดตอบกลับด่วน (QR) และบาร์โค้ดเพื่อรับข้อมูลที่รวมอยู่ในโค้ด และจะให้บริการที่เกี่ยวข้องในภายหลัง ความสามารถในการตรวจจับโค้ดถูกรวมเข้ากับแอปพลิเคชัน"
ขณะนี้นักพัฒนาสามารถดาวน์โหลด DDK, SDK และ IDE ของ HiAI Engine ผ่านทางลิงก์ต้นทาง
ขอขอบคุณสมาชิก XDA วิวัฒนาการ สำหรับทิป!
ที่มา: หัวเว่ยที่มา 2: หัวเว่ยที่มา 3: หัวเว่ย