Η Huawei κυκλοφόρησε τον κινητήρα HiAI με το Huawei P20. Ο κινητήρας HiAI ανοίγει τις δυνατότητες εφαρμογών και ενσωματώνει «πλήθος δυνατοτήτων AI». Τα χαρακτηριστικά του είναι: αναγνώριση σκηνής, ανίχνευση εγγράφων και διόρθωση εγγράφων, ανίχνευση κωδικών, ανίχνευση προσώπου και άλλα.
Η Huawei λάνσαρε το Σειρά Mate 10 τον Οκτώβριο με το HiSilicon Kirin 970 system-on-chip. Ο Kirin 970 διαθέτει ειδικότερα υλικό για τεχνητή νοημοσύνη, με τη μορφή Μονάδας Νευρωνικής Επεξεργασίας (NPU). Τον προηγούμενο μήνα, δείξαμε επίσης πώς η Huawei ανέπτυξε το HiAssistant (με την υποστήριξη της HiAI), έναν ανταγωνιστή Google Assistant + Google Lens για την κινεζική αγορά. Τώρα, η Huawei κυκλοφόρησε το HiAI Engine μαζί με το Huawei P20.
Το HiAI είναι η υπολογιστική πλατφόρμα AI της Huawei. Επί του παρόντος, η αποκλειστική NPU στα τηλέφωνα Kirin 970 χρησιμοποιείται για λειτουργίες όπως η αναγνώριση αντικειμένων και σκηνής σε πραγματικό χρόνο στην εφαρμογή κάμερας, καθώς και ταχεία μετάφραση εκτός σύνδεσης στο Microsoft Translator
. Ωστόσο, αυτές οι δυνατότητες αποτελούν ένα μικρό μέρος των συνολικών δυνατοτήτων της μηχανικής μάθησης και των νευρωνικών δικτύων. Είναι δίκαιο να πούμε ότι είναι νωρίς ακόμη για την τεχνητή νοημοσύνη στα smartphone, αλλά οι πιθανές δυνατότητες είναι πολλά υποσχόμενες.Σύμφωνα με την Huawei, το HiAI Engine ανοίγει τις δυνατότητες εφαρμογών, ενσωματώνει «μια πλειάδα δυνατοτήτων τεχνητής νοημοσύνης και εφαρμογών [που κάνουν] οι εφαρμογές πιο έξυπνες και ισχυρές." Οι προγραμματιστές μπορούν τώρα να κατεβάσουν το DDK (Driver Development Kit), το SDK και το IDE για το HiAI Κινητήρας.
Οι δυνατότητες εφαρμογής του κινητήρα HiAI περιλαμβάνουν έναν κινητήρα Computer vision (CV). Μια μηχανή Computer Vision αναφέρεται στις «δυνατότητες με τις οποίες οι υπολογιστές προσομοιώνουν το ανθρώπινο οπτικό σύστημα αισθανθείτε το περιβάλλον του περιβάλλοντος και προσδιορίστε, αναγνωρίστε και κατανοήστε τη σύνθεση του χώρου», σύμφωνα με Huawei. Οι δυνατότητες της μηχανής CV περιλαμβάνουν την Super Resolution, την Αναγνώριση Προσώπου και την Αναγνώριση Αντικειμένων (τα οποία εξηγούνται λεπτομερέστερα παρακάτω).
Ο κινητήρας HiAI περιλαμβάνει επίσης έναν κινητήρα αυτόματης αναγνώρισης ομιλίας (ASR). Ωστόσο, δεν είναι ανοιχτό εκτός Κίνας. Ένας κινητήρας ASR είναι αυτός που μετατρέπει την ανθρώπινη φωνή σε κείμενο και οι δυνατότητές του περιλαμβάνουν την αναγνώριση ομιλίας, τη μετατροπή ομιλίας και το κείμενο σε ομιλία (TTS).
Ένας κινητήρας κατανόησης φυσικής γλώσσας (NLU) αποτελεί επίσης μέρος των δυνατοτήτων του κινητήρα HiAI, αλλά όπως ο κινητήρας ASR, δεν είναι ανοιχτός εκτός Κίνας. Επιτρέπει στους υπολογιστές να κατανοούν την ανθρώπινη φωνή, κάτι που τους επιτρέπει να εκτελούν επικοινωνία ή φυσικές ενέργειες. Οι δυνατότητές του περιλαμβάνουν τμηματοποίηση λέξεων, αναγνώριση οντοτήτων κειμένου, ανάλυση συναισθηματικών τάσεων και αυτόματη μετάφραση.
Τα χαρακτηριστικά του HiAI Engine είναι:
- Ανίχνευση σκηνής: «Κατηγοριοποιεί γρήγορα» τις εικόνες αναγνωρίζοντας τις σκηνές στο περιεχόμενο της εικόνας. Η Huawei δηλώνει ότι η αναγνώριση πολλαπλών τύπων σκηνών υποστηρίζεται επί του παρόντος με υψηλή ακρίβεια.
- Διόρθωση εγγράφων και ανίχνευση εγγράφων: Είναι μια λειτουργία βοηθητικής βελτίωσης που μπορεί να διορθώσει τη γωνία του εγγράφου. Μπορεί επίσης να αναγνωρίσει αυτόματα τις πληροφορίες θέσης του εγγράφου στην εικόνα.
- Ανίχνευση προσώπου και Σύγκριση προσώπου: Η Huawei δηλώνει: «Στην ανίχνευση προσώπου, πληροφορίες σχετικά με την τοποθεσία, τα χαρακτηριστικά σημεία και τις στάσεις του ανιχνεύεται το ανθρώπινο πρόσωπο σε μια δεδομένη εικόνα και επιστρέφονται ορθογώνιες συντεταγμένες προσώπου υψηλής ακρίβειας».
- Ετικέτα κατηγορίας εικόνας: Προσδιορίζει πληροφορίες όπως αντικείμενα, σκηνές και συμπεριφορά σε μια εικόνα με βάση τη μέθοδο βαθιάς μάθησης.
- Σούπερ ανάλυση εικόνας: Λέγεται ότι μεγεθύνει έξυπνα μια εικόνα που βασίζεται στη βαθιά μάθηση. Μπορεί επίσης να καταστείλει τα τεχνουργήματα διατηρώντας την ανάλυση αμετάβλητη για μια πιο καθαρή και ευκρινέστερη εικόνα.
- Σούπερ ανάλυση εικόνας χαρακτήρων: Μπορεί να μεγεθύνει μια εικόνα που περιλαμβάνει χαρακτήρες κατά εννέα φορές. Μπορεί επίσης να «βελτιώσει» τον ορισμό των χαρακτήρων στην εικόνα.
- Ανίχνευση κώδικα: Σύμφωνα με την Huawei, «Η ανίχνευση κώδικα διαβάζει τους κώδικες γρήγορης απόκρισης (QR) και τους γραμμωτούς κώδικες για τη λήψη πληροφοριών που περιλαμβάνονται στους κωδικούς, παρέχοντας έτσι σχετικές υπηρεσίες στη συνέχεια. Η δυνατότητα ανίχνευσης κώδικα είναι ενσωματωμένη στις εφαρμογές».
Οι προγραμματιστές μπορούν τώρα να πραγματοποιήσουν λήψη των DDK, SDK και IDE του HiAI Engine μέσω των συνδέσμων πηγής.
Χάρη στο μέλος XDA Εβολούτιος για το φιλοδώρημα!
Πηγή: HuaweiΠηγή 2: HuaweiΠηγή 3: Huawei