Huawei משחררת את מנוע HiAI עם Huawei P20

Huawei שחררה את מנוע HiAI עם Huawei P20. מנוע ה-HiAI פותח יכולות אפליקציה ומשלב "מספר רב של יכולות בינה מלאכותית". התכונות שלו הם: זיהוי סצנה, זיהוי מסמכים ותיקון מסמכים, זיהוי קוד, זיהוי פנים ועוד.

Huawei השיקה את סדרת מייט 10 באוקטובר עם מערכת HiSilicon Kirin 970-על-שבב. ל-Kirin 970 יש במיוחד חומרה ייעודית עבור AI, בצורה של יחידת עיבוד עצבית (NPU). חודש שעבר, הראינו גם כיצד Huawei מפתחת את HiAssistant (מופעל על ידי HiAI), מתחרה של Google Assistant + Google Lens עבור השוק הסיני. כעת, Huawei שחררה את מנוע HiAI לצד ה-Huawei P20.

HiAI היא פלטפורמת מחשוב ה-AI של Huawei. נכון לעכשיו, ה-NPU הייעודי בטלפונים של Kirin 970 משמש לתכונות כמו זיהוי אובייקטים וסצנות בזמן אמת באפליקציית המצלמה, כמו גם תרגום לא מקוון מואץ ב-Microsoft Translator. עם זאת, יכולות אלו הן חלק קטן מהפוטנציאל הכולל של למידת מכונה ורשתות עצביות. זה הוגן לומר שזה עדיין הימים הראשונים עבור AI בסמארטפונים, אבל היכולות הפוטנציאליות מבטיחות.

לפי Huawei, מנוע ה-HiAI פותח יכולות יישומים, משלב "מספר רב של יכולות ואפליקציות בינה מלאכותית [היוצרות] האפליקציות אינטליגנטיות וחזקות יותר." מפתחים יכולים כעת להוריד את ה-DDK (ערכת פיתוח דרייברים), SDK ו-IDE עבור HiAI מנוע.

יכולות היישום של מנוע HiAI כוללות מנוע ראיה ממוחשבת (CV). מנוע Computer Vision מתייחס ל"יכולות שבאמצעותן מחשבים מדמים את מערכת הראייה האנושית לחוש את סביבת הסביבה, ולקבוע, להכיר ולהבין את הרכב החלל", על פי Huawei. היכולות של מנוע ה-CV כוללות תמונה סופר רזולוציה, זיהוי פנים וזיהוי אובייקטים (אשר מוסברות ביתר פירוט בהמשך).

מנוע ה-HiAI כולל גם מנוע זיהוי דיבור אוטומטי (ASR). עם זאת, הוא לא פתוח מחוץ לסין. מנוע ASR הוא מה שממיר את הקול האנושי לטקסט, והיכולות שלו כוללות זיהוי דיבור, המרת דיבור וטקסט לדיבור (TTS).

מנוע הבנת שפה טבעית (NLU) הוא גם חלק מהיכולות של מנוע ה-HiAI, אבל כמו מנוע ה-ASR, הוא לא פתוח מחוץ לסין. זה מאפשר למחשבים להבין את הקול האנושי, מה שמאפשר להם לבצע תקשורת או פעולות טבעיות. היכולות שלו כוללות פילוח מילים, זיהוי ישויות טקסט, ניתוח נטיות רגשיות ותרגום מכונה.

התכונות של מנוע HiAI הן:

  • זיהוי סצינות: זה "מסווג במהירות" תמונות על ידי זיהוי הסצנות בתוכן התמונה. Huawei מצהירה כי זיהוי של מספר סוגים של סצנות נתמך כעת בדיוק גבוה.
  • תיקון מסמכים וזיהוי מסמכים: זוהי פונקציית שיפור מסייעת שיכולה לתקן את זווית המסמך. זה גם יכול לזהות אוטומטית את פרטי המיקום של המסמך בתמונה.
  • זיהוי פנים ו השוואת פנים: Huawei מצהיר: "בזיהוי פנים, מידע על המיקום, הנקודות האופייניות והתנוחות של הפנים האנושיות בתמונה נתונה מזוהים, ומוחזרות קואורדינטות מלבניות פנים בעלות דיוק גבוה."
  • תווית קטגוריית תמונה: הוא מזהה מידע כמו חפצים, סצנות והתנהגות בתמונה על בסיס שיטת הלמידה העמוקה.
  • תמונה סופר רזולוציה: אומרים שמגדיל תמונה בצורה חכמה המבוססת על למידה עמוקה. זה גם יכול לדכא חפצים תוך שמירה על הרזולוציה ללא שינוי לתמונה ברורה וחדה יותר.
  • תמונה סופר רזולוציית תו: זה יכול להגדיל תמונה הכוללת תווים פי תשע. זה גם יכול "לשפר" את הגדרת התווים בתמונה.
  • זיהוי קוד: לדברי Huawei, "זיהוי קוד קורא קודי תגובה מהירה (QR) וברקודים כדי לקבל מידע הכלול בקודים, ובכך מספק שירותים קשורים לאחר מכן. יכולת זיהוי הקוד משולבת באפליקציות".

מפתחים יכולים כעת להוריד את DDK, SDK ו-IDE של HiAI Engine דרך קישורי המקור.

תודה לחבר XDA אבולוטיוס על הטיפ!


מקור: Huaweiמקור 2: Huaweiמקור 3: Huawei