Η ARM ανακοινώνει CPU Cortex-A78, GPU Mali-G78, NPU Ethos N78

Η ARM ανακοίνωσε την αρχιτεκτονική CPU Cortex-A78 καθώς και την GPU Mali-G78. Οι δύο είναι οι διάδοχοι της CPU Cortex-A77 και της GPU Mali-G77.

Στο πλαίσιο της TechDay 2020, η ARM έκανε τρεις σημαντικές ανακοινώσεις. Η κύρια ανακοίνωση είναι το πρόγραμμα Cortex-X Custom (CXC), που περιέχει το νέο Πυρήνας CPU Cortex-X1. Ο Cortex-X1 φέρνει υψηλότερη απόδοση από οποιονδήποτε CPU της σειράς Cortex-A, ενώ σπάει το περίβλημα του PPA της σειράς Cortex-A. Οι άλλες δύο ανακοινώσεις που έκανε η ARM ήταν πολύ πιο ρουτίνα. Η CPU Cortex-A78 και η CPU Mali-G78 είναι πλέον επίσημες και λειτουργούν ως διάδοχοι του Cortex-A77 CPU και το Mali-G77 CPU αντίστοιχα. Ας καλύψουμε αυτές τις ανακοινώσεις μία προς μία:

ARM Cortex-A78

Με το Cortex-A78, η κύρια εστίαση της ARM ήταν στις απαιτήσεις απόδοσης, όπως απαιτήσεις για μεγαλύτερη διάρκεια ζωής της μπαταρίας, νέους παράγοντες φορητής μορφής και συρρίκνωση των περιοχών SoC. Η σταθερή απόδοση είναι η λέξη-κλειδί εδώ για το Cortex-A78, ενώ το Cortex-X1 στοχεύει στα αστέρια με στόχο την επίτευξη της μέγιστης βραχυπρόθεσμης μέγιστης απόδοσης.

Η ARM λέει ότι ο Cortex-78 αντιπροσωπεύει το "πολύ καλύτερο" της προσπάθειάς του για απόδοση υψηλών προδιαγραφών με την καλύτερη απόδοση στην κατηγορία του. Ούτε αυτά είναι απλά κενά λόγια. Τα τελευταία δύο χρόνια, το Cortex-A76 και το Cortex-A77 έχουν δείξει την καλύτερη ενεργειακή απόδοση στην κατηγορία τους και τον καλύτερο PPA στην κατηγορία (απόδοση, ισχύς και επιφάνεια). Δεν είχαν τον απαιτούμενο σχεδιασμό για να ανταγωνιστούν τα τσιπ της σειράς A της Apple, αλλά λόγω χαμηλότερων παραγόμενη ενέργεια, η ενεργειακή τους απόδοση ήταν στη χειρότερη περίπτωση ίδια με την Apple και στην καλύτερη περίπτωση ακόμη μεγαλύτερη από Μήλο.

Οι βελτιώσεις απόδοσης του A78 καλύπτουν περιπτώσεις χρήσης παραγωγικότητας, επικοινωνίας, ασφάλειας και εργασιών που βασίζονται στην κάμερα, προηγμένων παιχνιδιών, εμπειριών XR και ML.

Σε διαρκή απόδοση, το Cortex-A78 φέρνει διψήφιες βελτιώσεις. Παρέχει 20% βελτίωση στη διαρκή απόδοση σε σχέση με τον προκάτοχό του, το Cortex-A77, στο ίδιο κινητό φάκελο θερμικής ισχύος. AnandTech μελέτησε τους αριθμούς και εξήγησε ότι το ποσοστό του 20% είναι ένας συνδυασμός 7% υψηλότερου IPC σε σχέση με το A77, ενώ το Τα υπόλοιπα κέρδη απόδοσης 13% πιστώνονται στη διαδικασία 5nm, στην οποία θα είναι όλα τα SoC επόμενης γενιάς κατασκευασμένο. Η ARM σημειώνει τη σημασία της σταθερής απόδοσης λέγοντας ότι οι κινητές συσκευές έχουν περιορισμένη χωρητικότητα καταναλώνουν ισχύ και η σταθερή απόδοση αποφεύγει τον περιορισμό της ισχύος για εφαρμογές που απαιτούν πολλά εξουσία. Αυτό, με τη σειρά του, βελτιώνει το UX αποφεύγοντας την καθυστέρηση ή τις πτώσεις καρέ.

Η ώθηση στην ενεργειακή απόδοση μεταφράζεται σε υψηλότερη ενεργειακή απόδοση, καθώς και τα δύο σχετίζονται, αλλά διαφορετικές έννοιες. Σύμφωνα με την ARM, σε σημεία υψηλής απόδοσης, όπως αυτά που είναι η κορύφωση για τις τρέχουσες κινητές συσκευές, το Cortex-A78 προσφέρει 50% εξοικονόμηση ενέργειας σε σχέση με τις συσκευές του 2019 στην ίδια παράσταση ως Cortex-A77. Αυτό είναι εντυπωσιακό και καθιστά το A78 τον πιο ενεργειακά αποδοτικό CPU ARM που έχει σχεδιάσει ποτέ η Cortex-A.

Η εστίαση της ARM στη διαρκή απόδοση θα ωφελήσει το επόμενο κύμα καινοτομίας για κινητά, όπως οι νέοι παράγοντες μορφής (αναδιπλούμενα τηλέφωνα) καθώς και η βελτιωμένη «ψηφιακή εμβάπτιση» μέσω του 5G. Ο έλεγχος πραγματικότητας είναι ότι αυτό δεν ισχύει για την τρέχουσα γενιά και δεν θα έχει μεγάλη σημασία ακόμη και στην επόμενη γενιά.

Μια περίπτωση χρήσης που θα βελτιωθεί από το Cortex-A78 είναι το AAA mobile gaming, όταν συνδυάζεται με τη νέα GPU Mali-G78 της ARM. Ο συνδυασμός των δύο στοχεύει να προσφέρει εμπειρίες gaming υψηλής πιστότητας στα κινητά. Η μεγαλύτερη απόδοσή τους, σε συνδυασμό με τη γρήγορη ταχύτητα και το υψηλό εύρος ζώνης του 5G, θα επιτρέψει το premium gaming στο κινητό. Η αποτελεσματικότητα του A78 έχει ένα πλεονέκτημα εδώ, καθώς θα παρέχει μεγαλύτερη διάρκεια ζωής της μπαταρίας για εκτεταμένο gaming. Η ARM λέει ότι συνεργάζεται επίσης με το οικοσύστημα για να βελτιώσει περαιτέρω την απόδοση και να δημιουργήσει πλουσιότερες εμπειρίες παιχνιδιού και δίνει ένα παράδειγμα της δουλειάς της με το Unity για να φέρει το Burst Compiler στο Android.

Η απόδοση μηχανικής μάθησης (ML) είναι μια άλλη προτεραιότητα για την ARM. Η CPU είναι ο επεξεργαστής πρώτης επιλογής για υπολογιστές ML σε κινητά, αν και αυτές τις μέρες τα SoC υψηλής τεχνολογίας διαθέτουν ξεχωριστές μονάδες νευρωνικής επεξεργασίας (NPU). Οι CPU της ARM υποστηρίζουν τις πιο δημοφιλείς εφαρμογές ML του πραγματικού κόσμου και θήκες χρήσης σε smartphone, όπως φίλτρα μέσων κοινωνικής δικτύωσης, υπαγόρευση, ασφάλεια και ασφάλεια. Το Cortex-A78 χρησιμοποιεί 8% λιγότερη ενέργεια κατά μέσο όρο για εργασίες που βασίζονται σε ML σε σύγκριση με το A77, γεγονός που οδηγεί σε επίσημες βελτιώσεις απόδοσης 10%.

ARM Cortex-A78 - Αρχιτεκτονική

Το ARM Cortex-A78 έχει την ίδια αρχιτεκτονική με την προηγούμενη γενιά (εξακολουθεί να είναι ένας πυρήνας ARM v8.2). Ωστόσο, η ARM πρόσθεσε μικροαρχιτεκτονικά χαρακτηριστικά που στοχεύουν στην αύξηση της απόδοσης με έναν εμβαδόν και αποδοτικό τρόπο. Το ARM εξοικονομεί περιοχή και ισχύ διατηρώντας παράλληλα τα απαιτούμενα επίπεδα απόδοσης. Και πάλι, η εστίαση της ARM στη σειρά Cortex-A παραμένει στην απόδοση περιοχής και ισχύος και όχι στην κορυφαία απόδοση, η οποία είναι τώρα μια δουλειά που καταλαμβάνεται από το πρόγραμμα Cortex-X.

Οι βελτιώσεις απόδοσης του Cortex-A78 ενεργοποιούνται μέσω πρόσθετων μικροαρχιτεκτονικών χαρακτηριστικών που βελτιστοποιούν το πλάτος και το βάθος. Το πλάτος αποκωδικοποίησης εντολών παραμένει στο πλάτος 4, το ίδιο με το A77 και το A76. (Το πλάτος αποκωδικοποίησης του Cortex-X1, από την άλλη πλευρά, είναι πλάτους 5, ενώ το A13 έχει πλάτος αποκωδικοποίησης 7 πλάτους.) Η ARM έχει προσθέσει μεγαλύτερη πρόβλεψη διακλαδώσεων για το εύρος ζώνης και την ακρίβεια, καθώς και περιπτώσεις σύντηξης εντολών. Αυτές οι αρχιτεκτονικές βελτιώσεις επιτρέπουν μια αύξηση 7% στην απόδοση ενός νήματος σε σχέση με το A77.

Η απόδοση έχει μεγιστοποιηθεί μέσω της μείωσης των δομών που έχουν χαμηλή απόδοση και εμβαδόν, όπως στις κρυφές μνήμες L1-I και L1-D. Η ARM έχει βελτιστοποιήσει τις υπάρχουσες δομές για να καταναλώνουν λιγότερη ενέργεια, όπως οι δομές πρόβλεψης επωνυμίας. Η ARM λέει ότι αυτό οδηγεί σε 4% λιγότερη ισχύ για απόδοση ανά mW και 5% λιγότερη περιοχή για απόδοση ανά mm2 σε σύγκριση με το A77.

Το A78 διατηρεί την εστίαση στη διαρκή απόδοση με την καλύτερη απόδοση στην κατηγορία του σε επίπεδο συμπλέγματος. Ένα σύμπλεγμα DynamIQ με 4x Cortex-A77 και 4x Cortex-A55 CPU μπορεί να αναβαθμιστεί σε 4x πυρήνες A78 και 4x πυρήνες A55. Αυτό παρέχει 20% συνεχείς βελτιώσεις απόδοσης σε 15% λιγότερη περιοχή. Οι εφαρμογές που απαιτούν πολλά νήματα υψηλής απόδοσης παράλληλα, όπως τα παιχνίδια υψηλής πιστότητας, θα ωφεληθούν λόγω της συνεχούς ώθησης απόδοσης.

Η ARM σημειώνει ότι η βελτιωμένη απόδοση περιοχής του συμπλέγματος A78 DynamIQ το καθιστά ιδανικό για πτυσσόμενα τηλέφωνα και πολλαπλές και μεγαλύτερες οθόνες. Μια άλλη εστίαση είναι να γίνουν τα smartphone έτοιμα για 5G μέσω βελτιώσεων απόδοσης και ενέργειας. Το 5G υποτίθεται ότι παρέχει "πολύ μεγαλύτερες ταχύτητες", "πολύ χαμηλότερη καθυστέρηση" και "πολύ ταχύτερη και πιο πανταχού παρούσα συνδεσιμότητα για κινητές συσκευές για εφαρμογές υψηλού εύρους ζώνης". Αυτό μπορεί να συμβαίνει σε λίγα χρόνια από τώρα, αλλά προς το παρόν, τα περισσότερα από αυτά τα οφέλη δεν είναι αισθητά για τους τελικούς καταναλωτές.

Συνολικά, το Cortex-A78 είναι ένα συμπαγές προϊόν. Τα κορυφαία SoC επόμενης γενιάς θα ενσωματώνουν πολλαπλούς πυρήνες A78 για να συμπληρώσουν τον μοναδικό πυρήνα Cortex-X1 που έχει υψηλότερες απαιτήσεις ισχύος και περιοχής και ορισμένα SoC με προσανατολισμό στην αξία θα επιλέξουν ακόμη και να παραλείψουν το Cortex-X1 εξ ολοκλήρου. Για την αγορά SoC μεσαίας κατηγορίας, το A78 θα είναι ο πυρήνας CPU της επιλογής για τα SoC του 2021 και η εστίασή του στη διαρκή απόδοση είναι ευπρόσδεκτη.


ARM Mali-G78

Η σειρά GPU της ARM στο Mali δεν ήταν τόσο επιτυχημένη όσο η σειρά CPU της Cortex, για να το θέσω ήπια. Οι GPU του Mali έχουν σταθερά καλύτερες επιδόσεις τόσο από πλευράς απόδοσης όσο και από άποψη απόδοσης ισχύος από τις προσαρμοσμένες GPU της Apple και τις προσαρμοσμένες GPU Adreno της Qualcomm, χρόνο με το χρόνο. Το περσινό λανσάρισμα της νέας αρχιτεκτονικής Valhall και της GPU Mali-G77 δεν έκαναν τίποτα για να το αλλάξει αυτό, δυστυχώς. Τα SoC που διαθέτουν το Mali-G77 περιλάμβαναν το Exynos 990 και το MediaTek Dimensity 1000L αντίστοιχα. Και οι δύο, δυστυχώς, φάνηκαν να έχουν αδύναμες υλοποιήσεις που σήμαινε ότι η απόδοση της GPU τους μπορούσε δεν ανταγωνίζεται την Adreno 650 GPU της Qualcomm, δεν πειράζει τις κορυφαίες GPU της Apple στην κατηγορία της στο Apple A12 και Α13. Το Μάλι έχει μείνει πίσω εδώ και χρόνια και οι βελτιώσεις του δεν ήταν αρκετές για να αλλάξουν το status quo στον χώρο της κινητής GPU.

Ωστόσο, το ARM δεν είναι τίποτα αν όχι αισιόδοξο. Σημειώνει ότι οι εταίροι της έχουν αποστείλει πάνω από ένα δισεκατομμύριο GPU του Mali ετησίως, καθιστώντας το Μάλι την υπ' αριθμόν ένα αποστολή GPU στον κόσμο. Αυτός ο αριθμός θα αυξηθεί, υποτίθεται, μόνο, καθώς πολλοί περισσότεροι διαφορετικοί τύποι συσκευών επιτρέπουν περιπτώσεις χρήσης εντατικής χρήσης γραφικών, όπως προηγμένα παιχνίδια για κινητά και XR (VR και AR). Σύμφωνα με την ARM, αυτό καθιστά το Μάλι την πιο ευρέως χρησιμοποιούμενη GPU για την ανάπτυξη κινητών σε όλο το οικοσύστημα.

Η ARM σημειώνει ότι το 2019, ανακοίνωσε την πρώτη GPU της βασισμένη στην αρχιτεκτονική Valhall - το Mali-G77. Το 2020, το G77 διαδέχεται το Mali-G78, το οποίο βασίζεται επίσης στην αρχιτεκτονική Valhall. Ενώ η ARM λέει ότι είναι η πιο αποδοτική GPU για premium φορητές συσκευές μέχρι σήμερα, οι αριθμοί δεν δημιουργούν αντίγραφα ασφαλείας παρά τα όσα λέει ειρωνικά η ARM ότι είναι γεγονός που υποστηρίζεται από τους αριθμούς. Το G78 φέρνει 25% βελτίωση στην απόδοση σε σχέση με το G77, το οποίο είναι τουλάχιστον πενιχρό. Το χάσμα στην κορυφαία απόδοση της GPU μεταξύ του G77 και της GPU του Apple A13 ήταν σημαντικό, πράγμα που σημαίνει ότι το G78 δεν θα μπορέσει να φτάσει το A13, χωρίς να πειράζει την επερχόμενη GPU του Apple A14. Η Qualcomm θα συνεχίσει επίσης να παραμένει ένα βήμα μπροστά λόγω των δικών της σταδιακών βελτιώσεων απόδοσης.

Τα γραφικά που αλλάζουν το παιχνίδι και το ολοήμερο παιχνίδι σε κινητά είναι ήδη δυνατά σε άλλες GPU, επομένως το μάρκετινγκ της ARM εδώ είναι λίγο κούφιο.

Το Mali-G78 έχει κατασκευαστεί με γνώμονα τους προγραμματιστές και τον τελικό χρήστη, σύμφωνα με την ARM. Επιτρέπει υψηλής ποιότητας εμπειρίες παιχνιδιών για κινητά με παιχνίδια κονσόλας που είναι πλέον διαθέσιμα σε κινητά. Το G78 προσφέρει μεγαλύτερη διάρκεια ζωής της μπαταρίας σε premium φορητές συσκευές. Φέρνει επίσης μια περαιτέρω ενίσχυση της απόδοσης ML για πιο σύνθετες λειτουργίες ML, βίντεο, κάμερας και ασφάλειας σε κινητές συσκευές.

Η ARM είναι αισιόδοξη για την προοπτική του παιχνιδιού για κινητά. Τα παιχνίδια για κινητά αντιπροσώπευαν περισσότερο από το 46% της παγκόσμιας αγοράς παιχνιδιών το 2019, φτάνοντας τα 68,2 δισεκατομμύρια δολάρια σε έσοδα. Επίσης, πρόκειται να συνεχίσει να αναπτύσσεται τα επόμενα χρόνια, καθώς θα ξεπεράσει τόσο τα παιχνίδια υπολογιστών όσο και κονσόλας. Περισσότεροι premium τίτλοι παιχνιδιών έρχονται στα κινητά και οι χρήστες αναμένουν παρόμοια εμπειρία σε κινητά σε σύγκριση με τις κονσόλες.

Για να γίνουν δυνατές αυτές οι εμπειρίες, το Mali-G78 συνοδεύεται από την απαραίτητη ενίσχυση απόδοσης. Έχει 15% βελτίωση στην πυκνότητα απόδοσης για περιεχόμενο gaming σε σύγκριση με το G77. Για την ίδια έκταση με την προηγούμενη γενιά, το G78 θα παρέχει περισσότερες επιδόσεις. Αυτή η ενίσχυση καθίσταται δυνατή από τέσσερα βασικά χαρακτηριστικά:

  • Υποστήριξη έως και 24 πυρήνων
  • Ασύγχρονο Ανώτατο Επίπεδο
  • Βελτιώσεις πλακιδίων
  • Βελτιωμένη παρακολούθηση εξάρτησης τμήματος

Ενώ ο μέγιστος αριθμός πυρήνων του G77 ήταν 16, η ARM αύξησε τον μέγιστο αριθμό πυρήνων στο G78 σε μέγιστο αριθμό 24 πυρήνων. Φυσικά, μόνο και μόνο επειδή υπάρχει ένα μέγιστο δεν σημαίνει ότι οι πωλητές τσιπ κινητών θα ενσωματώσουν στην πραγματικότητα 24 πυρήνες. Η ευρύτερη παραλλαγή πυρήνα του G77 που έχουμε δει μέχρι στιγμής είναι το Mali-G77MP11 στο Exynos 990, ενώ το Dimensity 1000 έχει Mali-G77MC9.

Η ARM πιστεύει ότι το Asynchronous Top Level είναι ένα χαρακτηριστικό που αλλάζει το παιχνίδι για την απόδοση της GPU. Αυτό λέγεται ότι συμπιέζει όσο το δυνατόν περισσότερη απόδοση από τα παιχνίδια για κινητά, διασφαλίζοντας τη μέγιστη απόδοση.

Οι βελτιώσεις πλακιδίων, από την άλλη πλευρά, προσθέτουν ένα επιπλέον επίπεδο ποιότητας στα παιχνίδια για κινητά. Τα παιχνίδια που προέρχονται από υπολογιστή και κονσόλα έχουν συχνά εξαιρετικά περίπλοκα πλεονεκτήματα και εξελιγμένες σκηνές, που προκαλούν κολλήματα στην απόδοση και εμπόδια. Οι βελτιώσεις πλακιδίων μειώνουν το φορτίο κορυφής στη GPU για αυτές τις περίπλοκες σκηνές και στοιχεία. Αυτό βελτιώνει την απόδοση για περίπλοκο περιεχόμενο παιχνιδιών που μοιάζει με κονσόλα.

Η ARM έχει επίσης βελτιώσει την παρακολούθηση εξάρτησης θραυσμάτων στο G78. Αυτό επηρεάζει ιδιαίτερα τα παιχνίδια για κινητά με πολύπλοκες σκηνές παιχνιδιών που περιλαμβάνουν καπνό, δέντρα και γρασίδι. Τα αποτελέσματα είναι ότι η ARM έχει βελτιώσει την απόδοση έως και 17% στα κορυφαία παιχνίδια για κινητά σε σύγκριση με το G77.

Το Mali-G78 έχει 10% καλύτερη ενεργειακή απόδοση από τον προκάτοχό του. Και πάλι, αυτό δεν θα είναι αρκετό για να καλύψουμε τη διαφορά είτε με την Qualcomm είτε με την Apple. Οι στόχοι της ARM εδώ φαίνονται ιδιαίτερα συντηρητικοί. Η λειτουργία Asynchronous Top Level παίζει σημαντικό ρόλο στην ενεργειακή απόδοση, καθώς επιτρέπει τη μείωση της ισχύος, επιτρέποντας έτσι τη δημιουργία περιεχομένου με βιώσιμο τρόπο. Επομένως, όταν μια συσκευή εξάγει περιεχόμενο με τον επιθυμητό ρυθμό καρέ, μπορεί να μειώσει τον χρόνο για εξοικονόμηση ενέργειας. Η αύξηση του ανώτατου επιπέδου για αυτήν την εργασία καταναλώνει λίγο περισσότερη ενέργεια, αλλά η εξοικονόμηση ενέργειας από τη μείωση της συχνότητας των πυρήνων σκίασης είναι πολύ μεγαλύτερη. Αυτό συμβαίνει επειδή οι πυρήνες shader χρησιμοποιούν το 90-95% του ενεργειακού προϋπολογισμού της GPU.

Καλύτερη ενεργειακή απόδοση στο G78 επιτυγχάνεται επίσης χάρη στο Fused multiply-add (FMA). Έχει επανασχεδιαστεί πλήρως από την αρχή, οδηγώντας σε μείωση ενέργειας κατά 30% στη μονάδα. Η μονάδα FMA είναι υπεύθυνη για τους περισσότερους από τους υπολογισμούς που γίνονται μέσα σε μια GPU, και γι' αυτό ήταν λογικό για την ARM να τη στοχεύσει για μειώσεις ενέργειας.

Η δυνατότητα παράλληλης επεξεργασίας δεδομένων μιας GPU την καθιστά κατάλληλη για την εκτέλεση φόρτων εργασίας ML, αν και η ARM αναγνωρίζει ότι η CPU και η GPU παραμένουν οι κύριοι επεξεργαστές για την ML. Καθώς οι περιπτώσεις χρήσης γίνονται πιο περίπλοκες, ορισμένοι φόρτοι εργασίας θα μεταφορτωθούν στη GPU. Οι κύριες θήκες χρήσης ML για τη GPU συνδέονται με λειτουργίες ασφαλείας στη συσκευή, διαφορετικές λειτουργίες κάμερας και βίντεο, καθώς και εφαρμογές με λειτουργίες AR.

Ο ρόλος του ML στη GPU επιτρέπει εμπειρίες όπως η παρακολούθηση προσώπου μέσα στο πλαίσιο φωτογραφίας ή βίντεο, παιχνίδια που χρησιμοποιούν λειτουργίες AR και πολλά άλλα. Για αυτές τις εργασίες που βασίζονται σε ML, το Mali-G78 διαθέτει μέση βελτίωση απόδοσης 15% για διάφορους φόρτους εργασίας ML σε σύγκριση με το G77. Το G77 έφερε 60% βελτίωση στην απόδοση ML σε σχέση με τις προηγούμενες γενιές, επομένως η βελτίωση από έτος σε έτος φέτος είναι πολύ μικρότερη. Το ασύγχρονο Ανώτατο Επίπεδο είναι ζωτικής σημασίας για την ενίσχυση της απόδοσης της ML, καθώς ο χρονισμός των πυρήνων σκίασης βοηθά με τις διάφορες περιπτώσεις χρήσης ML στη GPU.

Στη συνέχεια, υπάρχει η ανακοίνωση του Mali-G68. Αυτό δεν είναι παρά μια στενότερη παραλλαγή του Mali-G78, όπως το Mali-G57 ήταν μια πιο στενή παραλλαγή του Mali-G77. Η ARM λέει ότι αυτή είναι η πρώτη sub-premium GPU Mali για συσκευές του 2021. Διαθέτει όλα τα χαρακτηριστικά του G78, όπως βελτιώσεις πλακιδίων και τη νέα μονάδα FMA στον κινητήρα εκτέλεσης, αλλά υποστηρίζει έως και 6 πυρήνες αντί για 24. Σχεδόν premium απόδοση με χαμηλότερο κόστος είναι ο στόχος αυτής της GPU.

Η ARM ανέπτυξε αυτό το επίπεδο GPU sub-premium αφού άκουσε σχόλια από συνεργάτες που ήθελαν premium λειτουργίες σε όλο το χαρτοφυλάκιο συσκευών τους. Το G68 έχει χαμηλότερη επιφάνεια πυριτίου, όπως αναμενόταν, και φέρνει gaming υψηλής απόδοσης σε ένα ευρύτερο κοινό προγραμματιστών και καταναλωτών.

Τέλος, η ARM αναφέρει τις συνεργασίες προγραμματιστών της. Διευκολύνει τους προγραμματιστές να βελτιστοποιήσουν το περιεχόμενό τους ώστε να εκτελείται καλύτερα σε GPU του Mali (θεωρητικά). Ένα παράδειγμα είναι ο Σύμβουλος Απόδοσης. Το δεύτερο είναι η συνεργασία της ARM με την Unity για να φέρει το Burst Compiler. Λεπτομέρειες σχετικά με αυτό μπορείτε να διαβάσετε στο άρθρο πηγής.

Mali-G78 - Outlook

Οι προοπτικές για το Mali-G78 είναι δυσοίωνες. Φαίνεται ότι η ARM απλώς δεν ενδιαφέρεται να κάνει ουσιαστικές βελτιώσεις απόδοσης από έτος σε έτος στο ίδιο καλούπι που κατασκευάζει η Apple, στο ίδιο καλούπι που έκανε η Qualcomm στο παρελθόν. Ενώ ο ρυθμός βελτίωσης της Qualcomm έχει επίσης επιβραδυνθεί, η βασική της γραμμή βρίσκεται σε υψηλότερη θέση από την ARM. Φαίνεται κακό για το οικοσύστημα Android όταν οι αναθεωρητές αναφέρουν με αριθμητικά στοιχεία ότι η σταθερή απόδοση της GPU του A13 είναι υψηλότερη από την κορυφαία απόδοση του Snapdragon 865. Το δέλτα απόδοσης μεταξύ των GPU της Apple και του Android αυξάνεται και απλώς διευρύνεται.

Το G78, επομένως, δεν είναι μια μαγική λύση για να λύσετε τα προβλήματα της ARM στο Mali GPU και να τα φέρετε στην κορυφή των διαγραμμάτων απόδοσης. Θα εξακολουθεί να κατατάσσεται κάτω από τις GPU της Apple και της Qualcomm. Θα είναι η προεπιλεγμένη επιλογή για ορισμένα SoC ακριβώς επειδή είναι το stock IP GPU της ARM και οι προσαρμοσμένες λύσεις έχουν εμπόδια στην είσοδο και κοστίζουν περισσότερο καθώς Καλά.

Το επόμενο έτος, είναι αμφίβολο εάν το Samsung Systems LSI θα καταλήξει να χρησιμοποιεί το Mali-G78. Η Samsung υπήρξε πελάτης υψηλού προφίλ των GPU του Mali, αλλά πέρυσι, υπέγραψε μια συνεργασία με την AMD για να φέρει την αρχιτεκτονική GPU RDNA στα κινητά SoC της το 2021. Εάν αυτός ο οδικός χάρτης παραμείνει σε καλό δρόμο - και σε αυτό το σημείο δεν έχουμε λόγο να υποψιαζόμαστε ότι δεν είναι σε καλό δρόμο - τότε ο διάδοχος του Exynos 990 θα διαθέτει GPU AMD RDNA αντί για GPU Mali. Θα είναι, πράγματι, μια μεγάλη απώλεια σχεδιασμού για την ARM. Ακόμη και άλλοι προμηθευτές όπως η MediaTek έχουν περισσότερες επιλογές αυτές τις μέρες. Το νέο της Imagination Technologies Αρχιτεκτονική GPU σειράς Α έχει σχεδιαστικό στόχο για υψηλότερες επιδόσεις από το G78 και είναι πιθανό η MediaTek να απομακρυνθεί από το Μάλι στο μέλλον. Η Qualcomm, φυσικά, δεν έχει κανένα λόγο να εγκαταλείψει τις προσπάθειες Adreno GPU της, οι οποίες εξακολουθούν να παραμένουν το καλύτερο στην κατηγορία όσον αφορά την απόδοση και την αποτελεσματικότητα όταν μιλάμε αποκλειστικά για το Android αγορά smartphone.

Επομένως, είναι σαφές ότι η ARM θα χρειαστεί να αυξήσει το ρυθμό των ετήσιων βελτιώσεων στις GPU του Μάλι για να κάνει πραγματική διαφορά στην αγορά της κινητής GPU. Εάν δεν μπορεί να το κάνει αυτό, αντιμετωπίζει τον κίνδυνο να γίνει μια μεταγενέστερη σκέψη στον κορυφαίο χώρο της κινητής GPU.


ARM Ethos N78

Τέλος, η ARM ανακοίνωσε και τη μονάδα νευρωνικής επεξεργασίας Ethos N78 (NPU). Είναι ο διάδοχος του N77 NPU. Παρέχει μεγαλύτερες δυνατότητες ML στη συσκευή και έως και 25% μεγαλύτερη απόδοση απόδοσης. Η δυνατότητα διαμόρφωσης είναι επίσης ισχυρό, καθώς οι διαθέσιμες διαμορφώσεις κυμαίνονται από 1 TOP/s έως και 10 TOP/s. Για περισσότερες λεπτομέρειες, ελέγξτε έξω Η ανάρτηση στο blog της ARM. Αυτή η NPU θα έχει πιθανώς περιορισμένες νίκες σχεδιασμού, καθώς η Qualcomm, η Samsung, η HiSilicon και η MediaTek έχουν όλες τις δικές τους Μονάδες Νευρωνικής Επεξεργασίας/Μηχανές AI.


Πηγές: ARM (1, 2), AnandTech (1, 2)