Οι νέοι Cortex X4, A720 και A520 της Arm είναι πυρήνες μόνο 64 bit με μεγάλη έμφαση στην απόδοση

Ανακοινώθηκαν οι νέοι πυρήνες της Arm ως μέρος της Total Compute Solution για το 2023 και είναι αρκετά ενδιαφέροντες.

Γρήγοροι Σύνδεσμοι

  • Μόνο 64 bit: "Η αποστολή ολοκληρώθηκε"
  • Arm Cortex-X4: Ακόμα μεγαλύτερη απόδοση και καλύτερη απόδοση
  • Arm Cortex-A720: Εξισορρόπηση απόδοσης και κατανάλωσης ενέργειας
  • Arm Cortex A520: Διπλασιασμός της απόδοσης
  • DSU-120: Έως 14 πυρήνες υπολογιστικής καλής ποιότητας
  • Η αποτελεσματικότητα είναι ο νέος στόχος

Η Arm είναι η εταιρεία που σχεδιάζει σχεδόν όλους τους πυρήνες της CPU που καταλήγουν να χρησιμοποιούνται στο smartphone Android σας και κάθε χρόνο ανακοινώνει νέες επαναλήψεις που αργότερα θα βρουν το δρόμο τους σε chipsets όπως το ναυαρχίδα Snapdragon εκείνης της χρονιάς ή η επόμενη ναυαρχίδα MediaTek Διάσταση. Φέτος, κυκλοφορεί έναν κορυφαίο πυρήνα Cortex-X4, έναν πυρήνα απόδοσης Cortex-A720 και έναν πυρήνα απόδοσης Cortex-A520. Αυτοί οι πυρήνες αποτελούν τη βάση των νέων συμβατών σχεδίων Arm v9.2 της εταιρείας και της Λύσης Total Compute Solution της εταιρείας για το 2023, ή TCS23. Επιπλέον, βλέπουμε επίσης μια νέα κοινόχρηστη μονάδα DynamIQ και μια ενημερωμένη GPU Immortalis-G720. Μεγαλύτερη είναι η πλήρης μετάβαση προς τον υπολογισμό 64-bit, με κανέναν από αυτούς τους πυρήνες να υποστηρίζει 32-bit.

Και οι τρεις νέοι πυρήνες είναι μικροαρχιτεκτονικά διάδοχοι του περασμένου έτους και επικεντρώνονται κυρίως στην εισαγωγή IPC και κέρδη απόδοσης.

Μόνο 64 bit: "Η αποστολή ολοκληρώθηκε"

Μία από τις μεγαλύτερες αλλαγές στο φετινό Total Compute Solution από το Arm είναι η μετάβαση μόνο στα 64-bit. Ενώ το περσινό A510R1 υποστήριζε τη λειτουργία εκτέλεσης AArch32 32-bit, όπως και το A710 που κυκλοφόρησε με το TCS22 πέρυσι, φέτος, οι πυρήνες του Arm είναι μόνο AArch64. Το ρολόι χτυπά για εφαρμογές 32-bit στο Android, ιδιαίτερα από τότε Η ίδια η Google έχει επιβάλει την ενημέρωση όλων των εφαρμογών από το 2019 μεταφορτώνονται ως δυαδικά 64-bit.

Όπως το θέτει ο Arm, η μετάβαση των 64 bit θεωρείται "η αποστολή ολοκληρώθηκε". Ο λόγος για αυτό είναι ότι η κινεζική αγορά εφαρμογών είναι αυτό που εμπόδισε τον υπόλοιπο κλάδο στη μετάβαση, αλλά η συντριπτική πλειονότητα των εφαρμογών στα κινεζικά καταστήματα εφαρμογών είναι πλέον συμβατές με 64-bit, πολύ.

Ο λόγος για την καθυστέρηση ήταν η έλλειψη ομογενοποιημένου οικοσυστήματος εφαρμογών, που σημαίνει ότι διαφορετικά καταστήματα εφαρμογών απαιτούσαν διαφορετικά πρότυπα προγραμματιστών. Καθώς ο Arm έχει συνεργαστεί με διάφορα καταστήματα εφαρμογών στην Κίνα, ωστόσο, μαζί με τις επανειλημμένες προειδοποιήσεις ότι θα συμβεί μια αλλαγή, αυτά τα καταστήματα εφαρμογών ενθαρρύνουν και τους προγραμματιστές να αλλάξουν.

Φαίνεται ότι ήρθε η ώρα αυτή η μετάβαση να γίνει στο σύνολό της και θα μείνουν λίγοι ακόμη μήνες μέχρι να δούμε αυτούς τους πυρήνες Arm σε νέα chipset, ούτως ή άλλως.

Arm Cortex-X4: Ακόμα μεγαλύτερη απόδοση και καλύτερη απόδοση

Η σειρά πυρήνων X της Arm αποκλίνει από τη σειρά Α της πριν από αρκετά χρόνια, με τη φιλοσοφία να είναι ότι είναι ένας ισχυρός πυρήνας που επιτρέπεται να καταναλώνει λίγο περισσότερη ισχύ όταν τον χρειάζεται. Συνήθως, οι κατασκευαστές chipset θα περιλαμβάνουν μόνο ένα ή δύο από αυτά το μέγιστο, καθώς είναι πεινασμένοι για ενέργεια, ακόμη και παρά τις δυνατότητες που έχουν επίσης.

Όπως μπορείτε να δείτε από το παραπάνω γράφημα, ο Cortex-X4 είναι ο πιο ισχυρός πυρήνας Arm μέχρι τώρα, αλλά αυτές οι δυνατότητες υπολογισμού βαρύνουν την κατανάλωση ενέργειας. Το Cortex-X4 είναι παρόμοιο με το X3 του περασμένου έτους και, όπως το θέτει ο Arm, μπορεί ακόμη και να λειτουργήσει στις ίδιες συχνότητες με τον πυρήνα του περασμένου έτους και να καταναλώνει έως και 40% λιγότερη ισχύ. Είναι λιγότερο από 10% μεγαλύτερο σε φυσικό μέγεθος και ο πιο αποτελεσματικός πυρήνας Cortex-X που έχει κατασκευαστεί ποτέ.

Όσο για το πού προέρχονται αυτές οι βελτιώσεις IPC, υπάρχει μια σειρά από βελτιώσεις στο front-end και στο back-end στο X4. Σε αυτές τις βελτιώσεις στο μπροστινό μέρος, καταβλήθηκε μεγάλος όγκος εργασίας για την επανεγγραφή και τη βελτίωση των προβλέψεων κλάδου, καθώς οι εσφαλμένες προβλέψεις κλάδου είναι δαπανηρές, όσον αφορά την απόδοση. Ο Arm υπόσχεται επίσης ότι ένα μέγεθος κρυφής μνήμης L2 2 MB αποδίδει υψηλότερη απόδοση, όχι τόσο σε σημεία αναφοράς, αλλά σε πραγματικό κόσμο.

Ο νέος πυρήνας Cortex-X4 αυξάνει τον αριθμό των Αριθμητικών Λογικών Μονάδων (ALU) από 6 σε 8, προσθέτει έναν επιπλέον κλάδο μονάδα (συνολικά 3), προσθέτει μια επιπλέον μονάδα Multiply-Acumulatator και αγωγούς κινητής υποδιαστολής και τετραγωνική ρίζα επιχειρήσεις.

Όσον αφορά το πίσω μέρος, υπάρχουν επίσης αρκετές βελτιώσεις. Η δημιουργία διεύθυνσης αποθήκευσης φορτίου έχει αυξηθεί από τρεις εντολές σε τέσσερις ανά κύκλο, καθώς ο σωλήνας αποθήκευσης φορτίου λήφθηκε και χωρίστηκε. Υπάρχει επίσης ένα διπλασιασμένο μεταφραστικό buffer στο L1, μαζί με βελτιώσεις σε τραπεζικές συγκρούσεις.

Όλα αυτά συνδυάζονται για να φέρουν μια εντυπωσιακή αύξηση της απόδοσης στο Arm's Cortex-X4. Συνολικά, μπορείτε να περιμένετε κατά μέσο όρο 15% βελτίωση απόδοσης με το Cortex-X4. Στην καμπύλη ισχύος και απόδοσης που μοιράζεται η Arm, η X4 εκτείνεται μπροστά από την X3 τόσο σε απόδοση όσο και σε κατανάλωση ενέργειας. Με άλλα λόγια, αυτή η βελτίωση της απόδοσης κατά 15% έρχεται με μια αρκετά σημαντική κατανάλωση ενέργειας. Αξίζει να αναφέρουμε, όμως, ότι δεν είναι μια σύγκριση μήλων με μήλα. το Cortex-X3 κυκλοφόρησε με 1MB μνήμης cache L2 πέρυσι, πράγμα που σημαίνει ότι εάν ένας κατασκευαστής διατηρήσει το ίδιο μέγεθος προσωρινής μνήμης L2 φέτος, ενδέχεται να μην υπάρξει απαραίτητα αύξηση της απόδοσης κατά 15%.

Ένα πράγμα είναι σίγουρο, ωστόσο, και είναι ότι εάν τρέχετε την X4 με τη μέγιστη ταχύτητα, πιθανότατα θα είναι ένα σημαντικό γκαζόν. Μπορεί να δούμε μερικούς OEM φέτος να συνεχίζουν να κάνουν ό, τι έκαναν πέρυσι και να πετάξουν πολλά από τα φετινά chipset out of the box. Για παράδειγμα, το OnePlus και το Oppo το κάνουν αυτό και με αυτά τα κέρδη απόδοσης ισχύος όταν τρέχουν ταυτόχρονα σημεία απόδοσης όπως το X3, είναι πιθανό ότι θα υπάρξουν οφέλη για αυτές τις εταιρείες να συνεχίσουν να κάνουν Έτσι. Μπορεί να μην δούμε αυτή την αύξηση της απόδοσης κατά 15% σε γενικές γραμμές, αλλά μπορεί να δούμε περαιτέρω βελτιώσεις στην απόδοση για τα chipset του επόμενου έτους.

Arm Cortex-A720: Εξισορρόπηση απόδοσης και κατανάλωσης ενέργειας

Ενώ η σειρά πυρήνων X της Arm's συνήθως αφήνεται να λειτουργήσει λίγο άγρια, η σειρά πυρήνων A συνήθως στοχεύει στην εξισορρόπηση της κατανάλωσης ενέργειας με την απόδοση. Με το Cortex-A720, το Arm υπόσχεται έναν 20% πιο αποδοτικό πυρήνα, με αυξημένη απόδοση στην ίδια ισχύ με το A715 από πέρυσι.

Όσο για το από πού προέρχονται οι βελτιώσεις του φετινού A720, οι περισσότερες από αυτές βρίσκονται στο μπροστινό μέρος. Οι αγωγοί έχουν μειωθεί με έναν κύκλο να αφαιρεθεί από τον κινητήρα λανθασμένης πρόβλεψης διακλάδωσης, με αυτή την πτώση ενός κύκλου να λέγεται ότι αντιπροσωπεύει μια αύξηση 1% στα σημεία αναφοράς. Οι δείκτες αναφοράς συνήθως έχουν ως αποτέλεσμα τις λιγότερες εσφαλμένες προβλέψεις κλάδου, πράγμα που σημαίνει ότι αυτό πιθανότατα θα βελτιώσει τη συνολική απόδοση στον πραγματικό κόσμο κατά ένα πιο σημαντικό (αλλά σε μεγάλο βαθμό ανυπολόγιστο) ποσό.

Στον εκτός λειτουργίας πυρήνα, βλέπουμε μια σειρά από δομικές βελτιώσεις που συμβάλλουν στη βελτίωση της απόδοσης χωρίς να επηρεάζουν την περιοχή που καταλαμβάνει ο πυρήνας ή την απόδοσή του. Αρχικά, όπως και στο X4, οι διαιρέσεις κινητής υποδιαστολής και οι λειτουργίες τετραγωνικής ρίζας έχουν πλέον δρομολογηθεί. Υπάρχουν επίσης ταχύτερες μεταφορές από αριθμούς κινητής υποδιαστολής, NEON και SVE2 σε ακέραιους αριθμούς και άλλες συνολικές βελτιώσεις για την επιτάχυνση της επεξεργασίας.

Ο Arm μοιράστηκε το παραπάνω γράφημα για να δείξει πώς το A720 συγκρίνεται με το A715 του περασμένου έτους σε απόδοση και απόδοση, όπου χρησιμοποιείται μια διαδικασία ISO και η συχνότητα ISO στο SPECint_base2006. Τα μεγέθη της κρυφής μνήμης παραμένουν τα ίδια, επομένως είναι πολύ μια σύγκριση μήλων με μήλα.

Όσον αφορά την κατανάλωση ενέργειας, το A720 παραμένει πολύ ευθυγραμμισμένο με το περσινό μοντέλο, αν και έχει λίγο περισσότερες επιδόσεις στα ίδια επίπεδα ισχύος. Με το A720, όπως και με το X4, ο Arm φαίνεται να εστιάζει περισσότερο στο να τονίσει πώς γίνεται καλύτερος απόδοση από τους περιορισμούς ισχύος του περασμένου έτους αντί να αυξάνει συνεχώς την ισχύ που έχουν αυτοί οι πυρήνες ικανός να.

Arm Cortex A520: Διπλασιασμός της απόδοσης

Φυσικά, όταν πρόκειται για τους πυρήνες του Arm, δεν είναι μόνο θέμα απόδοσης. Με τη σειρά X να δίνει τα πάντα σε ακατέργαστη υπολογιστική ισχύ και το A7xx να εξισορροπεί τις υπολογιστικές ανάγκες και την άντληση ισχύος, η σειρά A5xx εστιάζει αποκλειστικά στην αποτελεσματική επεξεργασία. Είναι η χαμηλότερη ισχύς ανά περιοχή πυρήνα Arm v9.2 και βασίζεται στην ίδια αρχιτεκτονική συγχωνευμένου πυρήνα που είδαμε να παρουσιάζεται με το A510.

Αυτό που σημαίνει αυτή η αρχιτεκτονική του συγχωνευμένου πυρήνα είναι ότι ορισμένοι πόροι μπορούν να μοιραστούν μεταξύ δύο πυρήνων, όπου δύο πυρήνες μπορούν να ομαδοποιούνται σε ένα «σύμπλεγμα». Η κρυφή μνήμη L2, η προσωρινή μνήμη μετάφρασης L2 και οι διανυσματικές διαδρομές δεδομένων μοιράζονται σε αυτό συγκρότημα. Για να είμαστε σαφείς, αυτό δεν σημαίνει έχει να ομαδοποιηθεί σε δύο πυρήνες και μπορεί να συναρμολογηθεί ένα σύμπλεγμα ενός πυρήνα για μέγιστη απόδοση. Στην πραγματικότητα, μια από τις διατάξεις πυρήνα TCS2023 του Arm που μας έδειξαν περιλάμβανε έναν μόνο πυρήνα X4, πέντε πυρήνες A720 και τρεις πυρήνες A520, πράγμα που σημαίνει ότι τουλάχιστον ένας πυρήνας A520 είναι σε απομόνωση.

Το A520 είναι μια σχεδίαση πρώτης απόδοσης και, όπως και οι άλλοι πυρήνες, η Arm επικεντρώθηκε σε μεγάλο βαθμό στη βελτίωση αυτής της απόδοσης στα ίδια σημεία ισχύος με την τελευταία γενιά. Αυτό περιλαμβάνει τη βελτίωση των προβλέψεων διακλάδωσης, ενώ παράλληλα αφαιρεί ή μειώνει ορισμένες δυνατότητες απόδοσης. Αυτή η απόδοση ανακτήθηκε μέσω μεγαλύτερης αποτελεσματικότητας ως αποτέλεσμα. Είναι ενδιαφέρον επίσης ότι η Arm αφαίρεσε την τρίτη ALU που υπήρχε στο A510, εξοικονομώντας ισχύ στην έκδοση λογικής και στην προώθηση αποτελεσμάτων.

Στα αποτελέσματα του πραγματικού κόσμου, φαίνεται ότι το A520 δεν είναι τόσο μεγάλο σε σχέση με τους προκατόχους του όσο το A720 και το X4. Πολλές από τις δυνατότητές του σε διαστήματα χαμηλότερης ισχύος συμπίπτουν με το A510 από το παραπάνω γράφημα και μόνο στα ανώτερα κλιμάκια απόδοσης βλέπουμε κέρδη απόδοσης. Η απόκλιση στην απόδοση και την ισχύ μεταξύ των δύο πυρήνων είναι πολλά υποσχόμενη, αλλά δεν είναι σαφές εάν θα δούμε πραγματικά οφέλη από τον πραγματικό κόσμο όταν συγκρίνουμε το A520 με το A510. Τελικά, είναι δύσκολο να μετρηθούν σωστά οι διαφορές απόδοσης και αποδοτικότητας μεταξύ των δύο στον πραγματικό κόσμο.

DSU-120: Έως 14 πυρήνες υπολογιστικής καλής ποιότητας

Η Κοινόχρηστη Μονάδα DynamIQ, ή DSU, είναι μια μονάδα που ενσωματώνει έναν ή περισσότερους πυρήνες με σύστημα μνήμης L3, λογική ελέγχου και εξωτερικές διεπαφές προκειμένου να σχηματίσει ένα σύμπλεγμα πολλαπλών πυρήνων. Είναι ουσιαστικά το ύφασμα του Arm που επιτρέπει σε όλους αυτούς τους πυρήνες να επικοινωνούν μεταξύ τους και να μοιράζονται πόρους, και ως Έτσι, είναι ένα αρκετά σημαντικό κομμάτι του παζλ για κάθε κατασκευαστή chipset που θέλει να δημιουργήσει ένα τσιπ με τα σχέδια πυρήνα του Arm.

Με βάση το DSU-110, το Arm έχει κάνει ορισμένες βελτιώσεις στο DSU-120 που θα χρησιμεύσουν για να ωφελήσουν ολόκληρο το τσιπ στο οποίο περιλαμβάνεται. Για αρχή, υπάρχουν τώρα έως και 14 πυρήνες ανά σύμπλεγμα (από 12) και υποστήριξη για έως και 32 MB προσωρινής μνήμης L3. Βελτιώνει επίσης σημαντικά την απόδοση σε διάφορους βασικούς τομείς, συμπεριλαμβανομένων των περιπτώσεων απώλειας της προσωρινής μνήμης, ενώ παράλληλα μειώνει τη διαρροή ρεύματος.

Κατά κάποιο τρόπο, το DSU του Arm είναι η ραχοκοκαλιά του TCS23, καθώς αποτελεί τη βάση του τρόπου με τον οποίο κάθε ένας από αυτούς τους πυρήνες αλληλεπιδρά μεταξύ τους και μοιράζεται δεδομένα. Οποιεσδήποτε βελτιώσεις εδώ θα ωφελήσουν ολόκληρο το σύμπλεγμα, αλλά φαίνεται ότι οι περισσότερες αλλαγές σχετίζονται με την κατανάλωση ενέργειας και την απόδοση.

Η αποτελεσματικότητα είναι ο νέος στόχος

Η βιομηχανία φαίνεται ότι αλλάζει για λίγο, αλλά η κύρια πρώτη εντύπωση που έχω από αυτούς τους πυρήνες είναι ότι η αποτελεσματικότητα είναι πλέον το όνομα του παιχνιδιού. Ενώ μας είπαν πόσο πιο γρήγορος είναι ο πυρήνας X4 και πώς είναι ο ταχύτερος πυρήνας της εταιρείας ποτέ, έσπευσαν πολύ γρήγορα να σημειώσουν τις βελτιώσεις απόδοσης της λειτουργίας του στην κορυφαία απόδοση του περασμένου έτους αντι αυτου.

Σε γενικές γραμμές, κάθε κέρδος απόδοσης υποστηριζόταν από το πόσο πιο αποδοτικό ήταν και αυτό το εξάρτημα, και λίγο πολύ, όλες οι αλλαγές του DSU αφορούσαν την απόδοση και τη διαρροή ισχύος. Η απόδοση είναι σημαντική, αλλά πραγματικά φαίνεται ότι ο κλάδος στο σύνολό του προσπαθεί να κάνει την επικαιρότητα Τα υπολογιστικά επίπεδα είναι πιο αποτελεσματικά αντί να επιδιώκονται μαζικές επιδόσεις από έτος σε έτος.

Αναμένουμε ότι αυτοί οι πυρήνες θα διαμορφώσουν τη βάση του MediaTek Dimensity 9400 και του Qualcomm Snapdragon 8 Gen 3, αλλά σε ποιον σχηματισμό μένει να φανεί. Όπως αναφέρθηκε προηγουμένως, η Arm μίλησε για τη χρήση διάταξης πυρήνων 1+5+3 στις δικές της εσωτερικές δοκιμές, αλλά αυτό δεν σημαίνει ότι είναι αυτό που θέλουν να κάνουν οι ίδιοι συνεργάτες όπως η MediaTek και η Qualcomm.