ARM mengumumkan CPU Cortex-A78, GPU Mali-G78, NPU Ethos N78

ARM telah mengumumkan arsitektur CPU Cortex-A78 serta GPU Mali-G78. Keduanya merupakan penerus CPU Cortex-A77 dan GPU Mali-G77.

Sebagai bagian dari TechDay 2020, ARM telah membuat tiga pengumuman besar. Pengumuman utama utama adalah program Cortex-X Custom (CXC), yang berisi yang baru Inti CPU Korteks-X1. Cortex-X1 menghadirkan kinerja puncak yang lebih tinggi dibandingkan CPU seri Cortex-A mana pun, sekaligus melampaui batasan PPA seri Cortex-A. Dua pengumuman lain yang dibuat ARM lebih bersifat rutin. CPU Cortex-A78 dan CPU Mali-G78 kini resmi, dan keduanya bertindak sebagai penerus dari Korteks-A77 CPU dan Mali-G77 CPU masing-masing. Mari kita bahas pengumuman ini satu per satu:

LENGAN Korteks-A78

Dengan Cortex-A78, fokus utama ARM adalah pada tuntutan efisiensi, seperti tuntutan masa pakai baterai yang lebih lama, faktor bentuk seluler baru, dan menyusutnya area SoC. Performa berkelanjutan adalah kata kunci di sini untuk Cortex-A78, sedangkan Cortex-X1 menjadi bintang dengan tujuannya mencapai performa puncak maksimal dalam jangka pendek.

ARM mengatakan Cortex-78 mewakili dorongan "terbaik" untuk kinerja kelas atas dengan efisiensi terbaik di kelasnya. Ini juga bukan sekadar kata-kata kosong. Selama beberapa tahun terakhir, Cortex-A76 dan Cortex-A77 telah menunjukkan efisiensi energi terbaik di kelasnya dan PPA (kinerja, daya, dan area) terbaik di kelasnya. Mereka tidak memiliki desain yang diperlukan untuk bersaing dengan chip seri A Apple, tetapi karena lebih rendah daya yang dihasilkan, efisiensi energinya paling buruk sama dengan Apple dan bahkan lebih tinggi darinya Apel.

Peningkatan kinerja A78 mencakup kasus penggunaan produktivitas, komunikasi, keamanan dan tugas berbasis kamera, gaming tingkat lanjut, pengalaman berbasis XR, dan ML.

Dalam performa berkelanjutan, Cortex-A78 menghadirkan peningkatan dua digit. Ini memberikan peningkatan 20% dalam kinerja berkelanjutan dibandingkan pendahulunya, Cortex-A77, dalam selubung daya termal seluler yang sama. AnandTech membahas angka-angka tersebut dan menjelaskan bahwa angka 20% tersebut merupakan kombinasi dari IPC 7% lebih tinggi dibandingkan A77, sedangkan sisa 13% peningkatan kinerja dikreditkan ke proses 5nm, yang akan digunakan oleh semua SoC generasi berikutnya dibuat. ARM mencatat pentingnya kinerja berkelanjutan dengan mengatakan bahwa perangkat seluler memiliki kapasitas terbatas menghilangkan daya, dan kinerja yang berkelanjutan menghindari pembatasan daya untuk aplikasi yang menuntut banyak hal kekuatan. Hal ini, pada gilirannya, meningkatkan UX dengan menghindari lag atau penurunan frame.

Dorongan terhadap efisiensi daya menghasilkan efisiensi energi yang lebih tinggi, karena keduanya berkaitan namun memiliki konsep yang berbeda. Menurut ARM, pada titik performa tinggi, seperti yang merupakan puncak perangkat seluler saat ini, Cortex-A78 menawarkan penghematan energi 50% dibandingkan perangkat tahun 2019. pada kinerja yang sama sebagai Cortex-A77. Hal ini mengesankan dan menjadikan A78 CPU ARM Cortex-A paling hemat energi yang pernah dirancang.

Fokus ARM pada kinerja berkelanjutan akan menguntungkan gelombang inovasi seluler berikutnya seperti faktor bentuk baru (ponsel yang dapat dilipat) serta peningkatan “digital imersi” melalui 5G. Kenyataannya, hal ini tidak terjadi pada generasi sekarang, dan tidak akan terlalu menjadi masalah bahkan pada generasi berikutnya.

Salah satu kasus penggunaan yang akan ditingkatkan oleh Cortex-A78 adalah game seluler AAA, bila dikombinasikan dengan GPU Mali-G78 baru milik ARM. Kombinasi keduanya bertujuan untuk menghadirkan pengalaman bermain game dengan fidelitas tinggi ke perangkat seluler. Performanya yang lebih baik, jika dipadukan dengan kecepatan tinggi 5G dan bandwidth tinggi, memungkinkan gaming premium di perangkat seluler. Efisiensi A78 memiliki keunggulan di sini, karena akan memberikan masa pakai baterai lebih lama untuk bermain game lebih lama. ARM mengatakan pihaknya juga bekerja sama dengan ekosistem untuk lebih meningkatkan kinerja dan membangun pengalaman bermain game yang lebih kaya, dan memberikan contoh kerja samanya dengan Unity untuk menghadirkan Burst Compiler ke Android.

Performa pembelajaran mesin (ML) adalah prioritas lain untuk ARM. CPU adalah prosesor pilihan pertama untuk komputasi ML di seluler, meskipun saat ini SoC kelas atas hadir dengan unit pemrosesan saraf (NPU) terpisah. CPU ARM mendukung aplikasi ML dunia nyata yang paling populer dan kasus penggunaan di ponsel cerdas, seperti filter media sosial, dikte, keamanan, dan keamanan. Cortex-A78 rata-rata menggunakan daya 8% lebih sedikit untuk tugas-tugas berbasis ML dibandingkan dengan A77, yang menghasilkan peningkatan efisiensi resmi sebesar 10%.

ARM Cortex-A78 - Arsitektur

ARM Cortex-A78 memiliki arsitektur yang sama dengan generasi sebelumnya (masih core ARM v8.2). Namun, ARM menambahkan fitur mikroarsitektur yang bertujuan untuk mendorong kinerja lebih tinggi dalam bidang dan cara yang hemat daya. ARM menghemat area dan daya sekaligus mempertahankan tingkat kinerja yang dibutuhkan. Sekali lagi, fokus ARM pada seri Cortex-A tetap pada efisiensi area dan daya daripada kinerja puncak, yang sekarang menjadi pekerjaan yang dilakukan oleh program Cortex-X.

Peningkatan kinerja Cortex-A78 dimungkinkan melalui fitur mikroarsitektur tambahan yang mengoptimalkan lebar dan kedalaman. Lebar dekode instruksi tetap pada lebar 4, sama seperti A77 dan A76. (Sebaliknya, lebar dekode Cortex-X1 adalah lebar 5, sedangkan A13 memiliki lebar dekode 7 lebar.) ARM telah menambahkan prediksi cabang yang lebih besar untuk bandwidth dan akurasi serta kasus fusi instruksi. Peningkatan arsitektur ini memungkinkan peningkatan kinerja single-thread sebesar 7% dibandingkan A77.

Efisiensi telah dimaksimalkan melalui pengurangan struktur yang memiliki kinerja dan area rendah, seperti pada cache L1-I dan L1-D. ARM telah mengoptimalkan struktur yang ada untuk mengonsumsi lebih sedikit daya, seperti struktur prediksi merek. ARM mengatakan hal ini menghasilkan 4% lebih sedikit daya untuk kinerja per mW dan 5% lebih sedikit area untuk kinerja per mm2 dibandingkan dengan A77.

A78 tetap fokus pada kinerja berkelanjutan dengan efisiensi terbaik di kelasnya di tingkat cluster. Cluster DynamIQ yang terdiri dari 4x CPU Cortex-A77 dan 4x Cortex-A55 dapat ditingkatkan menjadi 4x core A78 dan 4x core A55. Hal ini memberikan peningkatan kinerja berkelanjutan sebesar 20% di area yang 15% lebih sedikit. Aplikasi yang memerlukan beberapa thread berperforma tinggi secara paralel, seperti game dengan fidelitas tinggi, akan mendapatkan keuntungan karena peningkatan kinerja yang berkelanjutan.

ARM mencatat peningkatan efisiensi area dari cluster A78 DynamIQ membuatnya ideal untuk ponsel yang dapat dilipat dan layar yang lebih banyak dan lebih besar. Fokus lainnya adalah menyiapkan ponsel cerdas 5G melalui peningkatan kinerja dan energi. 5G seharusnya memberikan "kecepatan yang jauh lebih cepat", "latensi yang jauh lebih rendah", dan "konektivitas yang jauh lebih cepat dan lebih banyak digunakan di mana-mana untuk perangkat seluler untuk aplikasi bandwidth tinggi". Hal ini mungkin akan terjadi dalam beberapa tahun ke depan, namun saat ini, sebagian besar manfaat tersebut belum terlihat oleh konsumen akhir.

Secara keseluruhan, Cortex-A78 adalah produk yang solid. SoC andalan generasi berikutnya akan menggabungkan beberapa inti A78 untuk melengkapi inti tunggal Cortex-X1 itu memiliki persyaratan daya dan area yang lebih tinggi, dan beberapa SoC yang berorientasi pada nilai bahkan akan memilih untuk tidak menggunakan Cortex-X1 sepenuhnya. Untuk pasar SoC kelas menengah, A78 akan menjadi inti CPU pilihan untuk SoC tahun 2021, dan fokusnya pada kinerja berkelanjutan sangat disambut baik.


LENGAN Mali-G78

Seri GPU ARM Mali belum sesukses CPU seri Cortex-nya. GPU Mali secara konsisten mengungguli baik dalam hal kinerja dan efisiensi daya oleh GPU kustom Apple dan GPU Adreno kustom Qualcomm, dari tahun ke tahun. Sayangnya, peluncuran arsitektur Valhall baru dan GPU Mali-G77 tahun lalu tidak mengubah hal itu. SoC yang menampilkan Mali-G77 termasuk Exynos 990 dan itu Dimensi MediaTek 1000L masing-masing. Sayangnya, keduanya tampaknya memiliki implementasi yang lemah sehingga kinerja GPU-nya bisa buruk tidak bersaing dengan GPU Adreno 650 Qualcomm, apalagi GPU terdepan di kelasnya dari Apple di Apple A12 dan A13. Mali telah tertinggal selama bertahun-tahun, dan peningkatannya belum cukup untuk mengubah status quo di bidang GPU seluler.

Meskipun demikian, ARM tidak berarti apa-apa jika tidak optimis. Ia mencatat bahwa mitranya telah mengirimkan lebih dari satu miliar GPU Mali setiap tahunnya, menjadikan Mali sebagai GPU pengiriman nomor satu di dunia. Jumlah ini diperkirakan akan terus meningkat karena semakin banyak jenis perangkat yang memungkinkan penggunaan grafis intensif seperti game seluler tingkat lanjut dan XR (VR dan AR). Menurut ARM, hal ini menjadikan Mali sebagai GPU yang paling banyak digunakan untuk pengembangan seluler di seluruh ekosistem.

ARM mencatat bahwa pada tahun 2019, mereka mengumumkan GPU pertamanya berdasarkan arsitektur Valhall – Mali-G77. Pada tahun 2020, G77 digantikan oleh Mali-G78, yang juga didasarkan pada arsitektur Valhall. Meskipun ARM mengatakan ini adalah GPU dengan performa paling tinggi untuk perangkat seluler premium hingga saat ini, angka-angka tersebut tidak mendukungnya meskipun ironisnya apa yang dikatakan ARM tentang hal itu adalah fakta yang didukung oleh angka-angka tersebut. G78 menghadirkan peningkatan kinerja sebesar 25% dibandingkan G77, yang mana hal ini bisa dikatakan sangat sedikit. Kesenjangan kinerja GPU puncak antara G77 dan GPU Apple A13 sangat signifikan, yang berarti G78 tidak akan mampu mengejar A13, apalagi GPU Apple A14 yang akan datang. Qualcomm juga akan terus selangkah lebih maju berkat peningkatan kinerja bertahap yang dilakukannya.

Grafik yang mengubah permainan dan bermain game sepanjang hari di perangkat seluler sudah dapat dilakukan di GPU lain, jadi pemasaran ARM di sini terasa sedikit hampa.

Mali-G78 dibuat dengan mempertimbangkan pengembang dan pengguna akhir, menurut ARM. Hal ini memungkinkan pengalaman bermain game seluler berkualitas tinggi dengan game konsol yang kini tersedia di perangkat seluler. G78 menghadirkan masa pakai baterai lebih lama untuk perangkat seluler premium. Ini juga membawa peningkatan kinerja ML lebih lanjut untuk fitur ML game, video, kamera, dan keamanan yang lebih kompleks di perangkat seluler.

ARM optimis mengenai prospek game seluler. Game seluler menyumbang lebih dari 46% pasar game global pada tahun 2019, mencapai pendapatan $68,2 miliar. Game ini juga diperkirakan akan terus berkembang dalam beberapa tahun ke depan karena akan melampaui game PC dan konsol. Semakin banyak judul game premium yang hadir di perangkat seluler dan pengguna mengharapkan pengalaman serupa di perangkat seluler dibandingkan dengan konsol.

Untuk mewujudkan pengalaman ini, Mali-G78 hadir dengan peningkatan kinerja yang diperlukan. Ini memiliki peningkatan kepadatan kinerja sebesar 15% untuk konten game dibandingkan dengan G77. Untuk luas area yang sama dengan generasi sebelumnya, G78 akan memberikan performa lebih. Peningkatan ini dimungkinkan oleh empat fitur utama:

  • Dukungan hingga 24 core
  • Tingkat Atas Asinkron
  • Perbaikan ubin
  • Pelacakan ketergantungan fragmen yang ditingkatkan

Meskipun jumlah inti maksimum G77 adalah 16 inti, ARM telah meningkatkan jumlah inti maksimum pada G78 menjadi maksimum 24 inti. Tentu saja, hanya karena jumlahnya maksimal bukan berarti vendor chip seluler akan memasukkan 24 core. Varian inti terluas dari G77 yang kami lihat sejauh ini adalah Mali-G77MP11 pada Exynos 990, sedangkan Dimensity 1000 memiliki Mali-G77MC9.

ARM percaya Asynchronous Top Level menjadi fitur yang mengubah permainan untuk kinerja GPU. Hal ini dikatakan akan memaksimalkan performa game seluler, memastikan performa maksimal.

Sebaliknya, peningkatan Tiler menambah lapisan kualitas ekstra pada game seluler. Game yang dibawa dari PC dan konsol sering kali memiliki aset yang sangat rumit dan adegan yang canggih, yang menyebabkan kendala dan hambatan dalam performa. Peningkatan ubin mengurangi beban vertex pada GPU untuk adegan dan aset kompleks ini. Hal ini meningkatkan kinerja untuk konten game mirip konsol yang rumit.

ARM juga telah meningkatkan pelacakan ketergantungan fragmen pada G78. Hal ini khususnya memengaruhi game seluler dengan adegan game kompleks yang melibatkan asap, pepohonan, dan rumput. Hasilnya adalah ARM mengalami peningkatan kinerja hingga 17% pada game seluler teratas dibandingkan dengan G77.

Mali-G78 memiliki efisiensi energi 10% lebih baik dibandingkan pendahulunya. Sekali lagi, itu tidak akan cukup untuk mengejar Qualcomm atau Apple. Tujuan ARM di sini nampaknya sangat konservatif. Fitur Asynchronous Top Level memainkan peran penting dalam efisiensi energi, karena memungkinkan pengurangan daya, sehingga memungkinkan konten dihasilkan secara berkelanjutan. Oleh karena itu, saat perangkat mengeluarkan konten pada kecepatan frame yang diinginkan, perangkat dapat menurunkan kecepatan clock untuk menghemat energi. Meningkatkan Level Atas untuk tugas ini menggunakan lebih banyak energi, tetapi penghematan energi dari pengurangan frekuensi inti shader jauh lebih tinggi. Itu karena inti shader menggunakan 90-95% anggaran energi GPU.

Efisiensi energi yang lebih baik di G78 juga dicapai berkat Fused Multi-Add (FMA). Ini telah didesain ulang sepenuhnya dari awal, menghasilkan pengurangan energi sebesar 30% pada unit. Unit FMA bertanggung jawab atas sebagian besar penghitungan yang terjadi di dalam GPU, dan itulah mengapa masuk akal jika ARM menargetkannya untuk pengurangan energi.

Kemampuan pemrosesan data paralel GPU membuatnya cocok untuk menjalankan beban kerja ML, meskipun ARM mengakui bahwa CPU dan GPU tetap menjadi prosesor utama untuk ML. Saat kasus penggunaan menjadi lebih kompleks, beberapa beban kerja akan dipindahkan ke GPU. Kasus penggunaan ML utama untuk GPU terkait dengan fitur keamanan pada perangkat, mode kamera dan video yang berbeda, serta aplikasi dengan fitur AR.

Peran ML pada GPU memungkinkan pengalaman seperti pelacakan wajah dalam bingkai foto atau video, game yang menggunakan fitur AR, dan banyak lagi. Untuk tugas berbasis ML ini, Mali-G78 memiliki peningkatan kinerja rata-rata sebesar 15% untuk berbagai beban kerja ML dibandingkan dengan G77. G77 membawa peningkatan kinerja ML sebesar 60% dibandingkan generasi sebelumnya, sehingga peningkatan dari tahun ke tahun pada tahun ini jauh lebih kecil. Tingkat Atas Asinkron sangat penting dalam meningkatkan kinerja ML karena mencatat waktu inti shader membantu berbagai kasus penggunaan ML pada GPU.

Lalu ada pengumuman Mali-G68. Ini hanyalah varian yang lebih sempit dari Mali-G78, sama seperti Mali-G57 yang merupakan varian lebih sempit dari Mali-G77. ARM mengatakan ini adalah GPU Mali sub-premium pertama untuk perangkat tahun 2021. Ia memiliki semua fitur G78 seperti peningkatan ubin dan unit FMA baru di mesin eksekusi tetapi mendukung hingga 6 inti, bukan 24. Performa mendekati premium dengan biaya lebih rendah adalah tujuan dari GPU ini.

ARM mengembangkan tingkat GPU sub-premium ini setelah mendengarkan masukan dari mitra yang menginginkan fitur premium di seluruh portofolio perangkat mereka. G68 memiliki area silikon yang lebih rendah, seperti yang diharapkan, dan menghadirkan game berperforma tinggi ke khalayak pengembang dan konsumen yang lebih luas.

Terakhir, ARM menyebutkan kemitraan pengembangnya. Ini memudahkan pengembang untuk mengoptimalkan konten mereka agar berjalan lebih baik di GPU Mali (secara teori). Salah satu contohnya adalah Penasihat Kinerja. Kedua adalah kolaborasi ARM dengan Unity menghadirkan Burst Compiler. Detail mengenai hal ini dapat dibaca pada artikel sumber.

Mali-G78 - Pandangan

Prospek Mali-G78 suram. Sepertinya ARM tidak tertarik untuk melakukan peningkatan kinerja yang substansial dari tahun ke tahun dengan model yang sama yang dibuat Apple, dengan model yang sama yang dibuat Qualcomm di masa lalu. Meskipun tingkat peningkatan Qualcomm juga melambat, baseline-nya berada pada tingkat yang lebih tinggi dibandingkan ARM. Tampaknya buruk bagi ekosistem Android ketika pengulas menyatakan dengan bukti numerik bahwa kinerja berkelanjutan GPU A13 lebih tinggi daripada kinerja puncak Snapdragon 865. Delta kinerja antara GPU Apple dan Android semakin meningkat, dan semakin melebar.

Oleh karena itu, G78 bukanlah solusi ajaib untuk mengatasi masalah GPU Mali ARM dan membawanya ke puncak grafik kinerja. Peringkatnya masih di bawah GPU Apple dan Qualcomm. Ini akan menjadi pilihan default untuk beberapa SoC hanya karena itu adalah IP GPU stok ARM, dan solusi khusus memiliki hambatan untuk masuk dan biayanya lebih mahal Sehat.

Tahun depan, diragukan apakah Samsung Systems LSI benar-benar akan menggunakan Mali-G78. Samsung telah menjadi pelanggan terkemuka GPU Mali, tetapi tahun lalu, itu menandatangani kemitraan dengan AMD untuk menghadirkan arsitektur GPU RDNA ke SoC selulernya pada tahun 2021. Jika peta jalan tersebut tetap berada di jalurnya - dan pada titik ini kami tidak memiliki alasan untuk mencurigainya tidak berada di jalur yang benar - maka penerus Exynos 990 akan menampilkan GPU AMD RDNA, bukan GPU Mali. Ini memang akan menjadi kerugian desain yang besar bagi ARM. Bahkan vendor lain seperti MediaTek memiliki lebih banyak pilihan saat ini. Teknologi Imajinasi yang baru Arsitektur GPU seri A memiliki target desain untuk performa yang lebih tinggi dibandingkan G78, dan ada kemungkinan MediaTek akan beralih dari Mali di masa mendatang. Qualcomm, tentu saja, tidak punya alasan untuk meninggalkan upaya GPU Adreno-nya, yang masih ada terbaik di kelasnya dalam hal kinerja dan efisiensi jika berbicara secara eksklusif tentang Android pasar ponsel pintar.

Oleh karena itu, jelas bahwa ARM perlu meningkatkan laju peningkatan tahunan pada GPU Mali untuk membuat perbedaan nyata di pasar GPU seluler. Jika tidak dapat melakukan hal ini, ia berisiko dikesampingkan dalam ruang GPU seluler andalan premium.


LENGAN Etos N78

Terakhir, ARM juga mengumumkan unit pemrosesan saraf (NPU) Ethos N78. Ini adalah penerus NPU N77. Ini memberikan kemampuan ML pada perangkat yang lebih baik dan efisiensi kinerja hingga 25% lebih baik. Konfigurasi juga merupakan kekuatan karena konfigurasi yang tersedia berkisar dari 1 TOP/s hingga 10 TOP/s. Untuk lebih jelasnya, lihat Entri blog ARM. NPU ini mungkin memiliki keunggulan desain yang terbatas karena Qualcomm, Samsung, HiSilicon, dan MediaTek semuanya memiliki Unit Pemrosesan Neural/Mesin AI sendiri.


Sumber: LENGAN (1, 2), AnandTech (1, 2)