Το Hexagon 685 DSP της Qualcomm είναι ένα ισχυρό κέντρο μηχανικής εκμάθησης

Ο Snapdragon 845 της Qualcomm περιέχει ένα ισχυρό τσιπ μηχανικής εκμάθησης. Ονομάζεται Hexagon 685 DSP και είναι ένα σημαντικό βήμα προς τα εμπρός στο υλικό AI.

Ο Snapdragon 845 - το νεότερο system-on-chip της οικογένειας Snapdragon της Qualcomm - είναι η δύναμη ενός επεξεργαστή. Διαθέτει ταχείς πυρήνες CPU, επεξεργαστή σήματος εικόνας Spectra τρίτης γενιάς (ISP) και αρχιτεκτονική που είναι 30 τοις εκατό πιο αποδοτική σε σχέση με την προηγούμενη γενιά. Αλλά αναμφισβήτητα το πιο εντυπωσιακό στοιχείο του είναι ένας συν-επεξεργαστής -- ο Hexagon 685 DSP -- που είναι ειδικά σχεδιασμένος για τεχνητή νοημοσύνη και μηχανική μάθηση.

Τι ακριβώς κάνει το Hexagon 685 DSP της Qualcomm;

Η αρχιτεκτονική Hexagon DSP στον Snapdragon 835. Πηγή: Qualcomm

"Τα διανυσματικά μαθηματικά είναι το θεμέλιο της βαθιάς μάθησης." - Travis Lanier, Senior Director of Product Management στην Qualcomm

Για να κατανοήσουμε τι κάνει το Hexagon DSP τόσο μοναδικό, βοηθάει να γνωρίζουμε ότι η τεχνητή νοημοσύνη καθοδηγείται από το είδος των μαθηματικών που είναι εξοικειωμένοι με τους ειδικούς μηχανικούς των κολεγίων. Η μηχανική μάθηση περιλαμβάνει υπολογισμούς με μεγάλα διανύσματα, κάτι που αποτελεί πρόκληση για τους επεξεργαστές smartphone, tablet και υπολογιστών. Είναι δύσκολο για τα τσιπ γενικής χρήσης να υπολογίζουν αλγόριθμους όπως η στοχαστική διαβάθμιση - τα είδη των αλγορίθμων που βρίσκονται στον πυρήνα των εφαρμογών που τροφοδοτούνται από AI - γρήγορα και αποτελεσματικά. Το Hexagon DSP της Qualcomm παρουσιάστηκε εν μέρει για να λύσει αυτό το πρόβλημα: Είναι εξαιρετικό στο χειρισμό δεδομένων εικόνας και αισθητήρα, ειδικά στη φωτογραφία.

Αλλά το Hexagon DSP είναι ικανό για πολλά περισσότερα από τη δημιουργία selfie. Τα περιεχόμενα HVX περιβάλλοντα (περισσότερα για αυτά αργότερα) του δίνουν το πλεονέκτημα τόσο των επεξεργαστών γενικής χρήσης όσο και των πυρήνων σταθερής λειτουργίας. το Hexagon 685 DSP είναι τρομερά αποτελεσματικό στον υπολογισμό των μαθηματικών πίσω από τη μηχανική εκμάθηση στη συσκευή, αλλά διατηρεί την ευελιξία των πιο προγραμματιζόμενων επεξεργαστών.

Τσιπ τεχνητής νοημοσύνης όπως το Hexagon 685 DSP, τα οποία μερικές φορές αναφέρονται ως «μονάδες νευρωνικής επεξεργασίας», Οι "νευρωνικοί κινητήρες" ή "πυρήνες μηχανικής εκμάθησης" είναι προσαρμοσμένοι ειδικά στους μαθηματικούς αλγόριθμους AI ανάγκες των. Έχουν πολύ πιο άκαμπτο σχεδιασμό από τους παραδοσιακούς CPU και περιέχουν ειδικές οδηγίες και ρυθμίσεις (στην περίπτωση του Hexagon 685 DSP, την προαναφερθείσα αρχιτεκτονική HVX) που επιταχύνουν ορισμένες βαθμωτές και διανυσματικές λειτουργίες, οι οποίες γίνονται αισθητές σε μεγάλη κλίμακα υλοποιήσεις.

Το Hexagon 685 DSP του Snapdragon 845 μπορεί να χειριστεί χιλιάδες bit διανυσματικών μονάδων ανά κύκλο επεξεργασίας, σε σύγκριση με τα εκατοντάδες bit ανά κύκλο του μέσου πυρήνα της CPU. Αυτό είναι από σχέδιο. Με τέσσερα παράλληλα βαθμωτά νήματα για λειτουργίες Very Long Instruction Word (VLIW) και πολλαπλά περιβάλλοντα HVX, το DSP είναι ικανό να ταχυδακτυλουργεί πολλαπλές μονάδες εκτέλεσης σε μία μόνο εντολή και να εκτυλίσσεται μέσω ακέραιων και σταθερών δεκαδικών επιχειρήσεις.

Αντί να προωθήσει την απόδοση στα ακατέργαστα MHz, η σχεδίαση του Hexagon 685 στοχεύει σε υψηλά επίπεδα εργασίας ανά κύκλο με μειωμένη ταχύτητα ρολογιού. Περιλαμβάνει τη λειτουργία πολλαπλών νημάτων υλικού που λειτουργεί καλά για το VLIW, καθώς το multi-threading κρύβει τις καθυστερήσεις σωλήνων που επιτρέπουν την καλύτερη χρήση των πακέτων VLIW. Το multi-threading του DSP σημαίνει ότι μπορεί να εξυπηρετεί πολλαπλές συνεδρίες εκφόρτωσης -- π.χ. ταυτόχρονες εφαρμογές για ήχο, κάμερα, όραση υπολογιστή και ούτω καθεξής -- και επιταχύνουν διάφορες εργασίες ταυτόχρονα, αποτρέποντας τις εφαρμογές από το να χρειάζεται να παλέψουν για χρόνος εκτέλεσης.

Πηγή: Qualcomm

Αλλά αυτά δεν είναι τα μόνα δυνατά σημεία του Hexagon DSP. Η αρχιτεκτονική του σετ εντολών (ISA) διαθέτει βελτιωμένη απόδοση σε σχέση με το παραδοσιακό VLIW χάρη στο βελτιωμένος κώδικας ελέγχου και χρησιμοποιεί έξυπνα κόλπα για την ανάκτηση της απόδοσης από την κατάσταση αδράνειας και αδράνειας κλωστές. Εφαρμόζει επίσης προγραμματισμό νημάτων μηδενικής καθυστέρησης, που σημαίνει ότι τα νήματα του DSP επεξεργάζονται νέες οδηγίες αμέσως μετά την ολοκλήρωση του προηγούμενου πακέτου δεδομένων.

Πηγή: Qualcomm

Τίποτα από αυτά δεν είναι καινούργιο, για να είμαι ξεκάθαρος. Η Qualcomm παρουσίασε το «πρώτης γενιάς» (ή το σωστό) Hexagon DSP -- το Hexagon 680 ή QDSP6 v6 -- μαζί με τον Snapdragon 820 το 2015, και το Hexagon 680 ακολουθήθηκε από το ολοένα και τόσο ελαφρώς βελτιωμένο Εξάγωνο 682. Αλλά η τελευταία γενιά είναι η πιο εξελιγμένη μέχρι τώρα και προσφέρει έως και τρεις φορές τη συνολική απόδοση από το DSP του Snapdragon 835.

Αυτό οφείλεται σε μεγάλο βαθμό στο HVX, το οποίο λειτούργησε πολύ καλά για την επεξεργασία εικόνας (σκεφτείτε επαυξημένη πραγματικότητα, όραση υπολογιστή, βίντεο και εικόνες). Οι καταχωρητές HVX του DSP μπορούν να ελέγχονται από οποιονδήποτε από τους βαθμωτούς καταχωρητές και οι μονάδες HVX και οι βαθμωτές μονάδες μπορούν να χρησιμοποιηθούν ταυτόχρονα, με αποτέλεσμα σημαντικά κέρδη απόδοσης και συγχρονισμό.

Εδώ είναι Εξήγηση της Qualcomm:

«Ας υποθέσουμε ότι επεξεργάζεστε στη CPU του κινητού σε λειτουργία κώδικα ελέγχου και μεταβαίνετε σε υπολογιστική λειτουργία στον συνεπεξεργαστή. Εάν χρειάζεστε κωδικό ελέγχου, πρέπει να σταματήσετε και να επιστρέψετε από τον συνεπεξεργαστή στην κύρια CPU. Με το Hexagon, τόσο ο επεξεργαστής κώδικα ελέγχου στο DSP όσο και ο επεξεργαστής υπολογιστικού κώδικα στο HVX μπορούν να λειτουργούν ταυτόχρονα για στενή σύζευξη του κώδικα ελέγχου και του υπολογιστικού κώδικα. Αυτό επιτρέπει στο DSP να λάβει το αποτέλεσμα ενός υπολογισμού HVX και να το χρησιμοποιήσει σε μια απόφαση κώδικα ελέγχου στον επόμενο κύκλο ρολογιού."

Το HVX προσφέρει ένα άλλο μεγάλο πλεονέκτημα στην επεξεργασία αισθητήρα εικόνας. Οι συσκευές Snapdragon με το Hexagon 685 DSP μπορούν να μεταδίδουν δεδομένα απευθείας από τον αισθητήρα απεικόνισης στην τοπική μνήμη του DSP (L2 Cache), παρακάμπτοντας τον ελεγκτή μνήμης DDR της συσκευής. Αυτό φυσικά μειώνει τον λανθάνοντα χρόνο, αλλά και βελτιώνει τη διάρκεια ζωής της μπαταρίας -- ο επεξεργαστής Snapdragon είναι σχεδιασμένος να λειτουργεί σε αδράνεια καθ' όλη τη διάρκεια της λειτουργίας.

Είναι ειδικά βελτιστοποιημένο για δίκτυα κινητής υποδιαστολής 16-bit και ελέγχεται από το λογισμικό μηχανικής εκμάθησης της Qualcomm: Snapdragon Neural Processing Engine.

"Το έχουμε πάρει πολύ σοβαρά υπόψη", δήλωσε εκπρόσωπος της Qualcomm. «Δουλεύουμε με συνεργάτες τα τελευταία τρία χρόνια για να χρησιμοποιήσουν [...] το πυρίτιο μας για τεχνητή νοημοσύνη και απεικόνιση».

Αυτοί οι συνεργάτες περιλαμβάνουν την Google, η οποία χρησιμοποίησε το τμήμα επεξεργασίας εικόνας του Hexagon DSP για να τροφοδοτήσει τον αλγόριθμο HDR+ του Pixel και του Pixel 2, για παράδειγμα. Ενώ η Google παρουσίασε επίσης το δικό της Pixel Core, αξίζει να σημειωθεί ότι οι συσκευές με δυνατότητα Hexagon 685 DSP είναι οι αυτά που βλέπουν τα καλύτερα αποτελέσματα με τη διάσημη θύρα κάμερας Google, εν μέρει λόγω (όπως έχουμε επιβεβαιώσει) του HVX χρησιμοποίηση. Το Facebook, ένας άλλος συνεργάτης, συνεργάστηκε στενά με την Qualcomm για να επιταχύνει τα φίλτρα και τα εφέ κάμερας του Messenger σε πραγματικό χρόνο.

Η Oppo βελτιστοποίησε την τεχνολογία ξεκλειδώματος προσώπου για το Hexagon 685 DSP και η Lenovo ανέπτυξε τη λειτουργία Landmark Detection γύρω από αυτό.

Ένας λόγος για τον πλούτο υποστήριξης της πλατφόρμας είναι η απλότητά της. Το εκτεταμένο Hexagon SDK της Qualcomm υποστηρίζει τη γλώσσα Halide για επεξεργασία εικόνας υψηλής απόδοσης και δεν χρειάζεται να ανησυχείτε για τα πλαίσια εκπαίδευσης μηχανικής εκμάθησης -- η εφαρμογή ενός μοντέλου είναι τόσο απλή όσο η πραγματοποίηση μιας κλήσης API, στα περισσότερα περιπτώσεις.

«Δεν [...] ανταγωνιζόμαστε με εταιρείες όπως η IBM και η Nvidia [στην τεχνητή νοημοσύνη], αλλά έχουμε τομείς στους οποίους μπορούν να αξιοποιήσουν οι προγραμματιστές -- και έχουν ήδη», δήλωσε η Qualcomm στους XDA Developers.

Εξάγωνο vs. ο ανταγωνισμός

Το Hexagon 685 DSP του Snapdragon 845 έρχεται καθώς ένας αυξανόμενος αριθμός κατασκευαστών πρωτότυπου εξοπλισμού (OEM) επιδιώκει τις δικές του λύσεις τεχνητής νοημοσύνης για κινητές συσκευές και συσκευές. της Huawei Kirin 970 -- το σύστημα-σε-τσιπ μέσα στο Σύντροφος 10 και Mate 10 Pro -- διαθέτει μια «μονάδα νευρωνικής επεξεργασίας» (NPU) που φέρεται να αναγνωρίζει περισσότερες από 2.000 εικόνες ανά δευτερόλεπτο με μόλις το 1/50 της κατανάλωσης ενέργειας μιας μέσης CPU smartphone. Και το Apple A11 Bionic system-on-chip στα iPhone 8, iPhone 8 Plus και iPhone X διαθέτει «Neural Engine» που εκτελεί μοντελοποίηση προσώπου σε πραγματικό χρόνο και έως και 600 δισεκατομμύρια λειτουργίες ανά δευτερόλεπτο.

Αλλά η Qualcomm λέει ότι ο αγνωστικισμός της πλατφόρμας του Hexagon του δίνει ένα πλεονέκτημα. Σε αντίθεση με την Apple και τη Huawei, που σε μεγάλο βαθμό αναγκάζουν τους προγραμματιστές να χρησιμοποιούν ιδιόκτητα API, η Qualcomm προσπάθησε να υποστηρίξει μερικά από τα πιο δημοφιλή πλαίσια ανοιχτού κώδικα από την αρχή. Για παράδειγμα, συνεργάστηκε με την Google για βελτιστοποίηση TensorFlow, η πλατφόρμα μηχανικής εκμάθησης της Google, για το Hexagon 685 DSP -- Η Qualcomm λέει ότι τρέχει έως και οκτώ φορές πιο γρήγορα και 25 φορές πιο αποδοτικά από ό, τι σε συσκευές που δεν είναι Hexagon.

Πηγή: Qualcomm

Στην αρχιτεκτονική DSP της Qualcomm, της Google GoogLeNet Inception Deep Neural Network -- ένας αλγόριθμος μηχανικής μάθησης που έχει σχεδιαστεί για την αξιολόγηση της ποιότητας των συστημάτων ανίχνευσης και ταξινόμησης αντικειμένων -- έδειξε κέρδη σε μια επίδειξη που δείχνει μία εφαρμογή αναγνώρισης εικόνας που λειτουργεί με TensorFlow σε δύο smartphone: το ένα που εκτελεί την εφαρμογή στη CPU και το άλλο που την εκτελεί στο Hexagon της Qualcomm DSP. Η εφαρμογή smartphone με επιτάχυνση DSP κατέγραψε περισσότερες εικόνες ανά δευτερόλεπτο, εντόπισε αντικείμενα πιο γρήγορα και είχε μεγαλύτερη εμπιστοσύνη στο συμπέρασμα για το τι ήταν το αντικείμενο από την εφαρμογή μόνο με CPU.

Η Google χρησιμοποιεί επίσης το Hexagon 685 DSP για να επιταχύνει το Project Tango, την πλατφόρμα επαυξημένης πραγματικότητας για smartphone. Το Phab 2 Pro της Lenovo, το ZenFone AR της Asus και άλλες συσκευές με τη μονάδα IR ανίχνευσης βάθους του Tango και τις κάμερες παρακολούθησης εικόνας εκμεταλλεύονται τις δυνατότητες της Qualcomm Ετερογενής Αρχιτεκτονική Επεξεργασίας, η οποία αναθέτει εργασίες επεξεργασίας μεταξύ του Hexagon 685 DSP του chipset Snapdragon, του διανομέα αισθητήρα και του σήματος εικόνας επεξεργαστή (ISP). Το αποτέλεσμα είναι μια επιβάρυνση «λιγότερο από 10 τοις εκατό» στην CPU του συστήματος-σε-τσιπ, σύμφωνα με την Qualcomm.

«Απ’ όσο γνωρίζουμε, είμαστε οι μόνοι άνθρωποι που κυκλοφορούν εκεί έξω που [κάνουμε] βελτιστοποίηση για απόδοση και ενεργειακή απόδοση», είπε ένας εκπρόσωπος της Qualcomm.

Φυσικά, οι ανταγωνιστές εργάζονται επίσης για να επεκτείνουν τη σφαίρα επιρροής τους και να προωθήσουν την υποστήριξη προγραμματιστών στις πλατφόρμες τους. Το νευρωνικό τσιπ του Kirin 970 κυκλοφόρησε με υποστήριξη για το TensorFlow και Καφέ (το ανοιχτό πλαίσιο API του Facebook) εκτός από τα Kirin API της Huawei, με TensorFlow Lite και Caffe2 ολοκλήρωσης αργότερα φέτος. Και η Huawei συνεργάστηκε με τη Microsoft για να βελτιστοποιήσει τον μεταφραστή της με τεχνητή νοημοσύνη για το Mate 10.

Αλλά η Qualcomm έχει ένα άλλο πλεονέκτημα: το Reach. Ο κατασκευαστής τσιπ κατείχε το 42 τοις εκατό της αγοράς chip για smartphone το πρώτο εξάμηνο του 2017, ακολουθούμενη από την Apple και την MediaTek με 18 τοις εκατό έκαστη, σύμφωνα με το Strategy Analytics. Αρκεί να πούμε ότι δεν κουνιέται ακόμα στις μπότες του.

Και η Qualcomm προβλέπει ότι θα αναπτυχθεί μόνο. Ο κατασκευαστής chip προβλέπει έσοδα 160 δισεκατομμυρίων δολαρίων έως το 2025 με τεχνολογίες λογισμικού τεχνητής νοημοσύνης όπως η όραση υπολογιστών και βλέπει την αγορά smartphone -- η οποία αναμένεται να φτάσει τα 8,6 δισεκατομμύρια μονάδες έως το 2021 -- ως τη μεγαλύτερη πλατφόρμα.

Με το Hexagon 685 DSP και άλλες «τριτογενείς» βελτιώσεις να κάνουν συνεχώς το δρόμο τους προς τα κάτω στη μεσαία κατηγορία υλικού, είναι επίσης πιο εύκολο για τα τσιπ της Qualcomm να προσφέρουν μηχανική εκμάθηση στη συσκευή σε όλα τα είδη συσκευών στο εγγύς μέλλον μελλοντικός. Προσφέρουν επίσης ένα εύχρηστο SDK για προγραμματιστές (δεν χρειάζεται να ασχολούνται με τη γλώσσα συναρμολόγησης DSP) για να επωφεληθούν από τα Hexagon 685 DSP και HVX στις εφαρμογές και τις υπηρεσίες τους.

«Υπάρχει ανάγκη για αυτές τις αποκλειστικές μονάδες επεξεργασίας για νευρωνική επεξεργασία, αλλά πρέπει επίσης να την επεκτείνετε, ώστε να μπορείτε να υποστηρίζετε πλαίσια [ανοιχτού κώδικα]», δήλωσε εκπρόσωπος της Qualcomm. «Αν δεν δημιουργήσετε αυτό το οικοσύστημα, δεν υπάρχει περίπτωση [...] οι προγραμματιστές να δημιουργήσουν σε αυτό».