ARM, Cortex-A78 CPU mimarisinin yanı sıra Mali-G78 GPU'yu da duyurdu. İkisi Cortex-A77 CPU ve Mali-G77 GPU'nun halefleridir.
ARM, TechDay 2020 kapsamında üç önemli duyuru yaptı. Başlıca duyuru, yeni özellikleri içeren Cortex-X Custom programıdır (CXC). Cortex-X1 CPU çekirdeği. Cortex-X1, herhangi bir Cortex-A serisi CPU'dan daha yüksek performans sunarken Cortex-A serisinin PPA sınırlarını da aşıyor. ARM'ın yaptığı diğer iki duyuru çok daha rutindi. Cortex-A78 CPU ve Mali-G78 CPU artık resmidir ve Cortex-A77 CPU ve Mali-G77 Sırasıyla CPU. Bu duyuruları tek tek ele alalım:
ARM Cortex-A78
Cortex-A78 ile ARM'nin ana odak noktası, daha uzun pil ömrü, yeni mobil form faktörleri ve küçülen SoC alanları gibi verimlilik talepleriydi. Cortex-A78 için sürdürülebilir performans buradaki anahtar kelimedir; Cortex-X1 ise kısa vadede maksimum performansa ulaşma hedefiyle yıldızları hedef alır.
ARM, Cortex-78'in sınıfının en iyisi verimlilikle üst düzey performans açısından sürücüsünün "en iyisini" temsil ettiğini söylüyor. Bunlar sadece boş sözler de değil. Son birkaç yıldır Cortex-A76 ve Cortex-A77, sınıfının en iyisi enerji verimliliği ve sınıfının en iyisi PPA'yı (performans, güç ve alan) gösterdi. Apple'ın A serisi çipleriyle rekabet edebilecek tasarıma sahip değillerdi, ancak daha düşük performansları nedeniyle üretilen enerjiye göre enerji verimliliği en kötü ihtimalle Apple ile aynı, en iyi ihtimalle Apple'dan bile daha yüksekti. Elma.
A78'in performans iyileştirmeleri üretkenlik, iletişim, güvenlik ve kamera tabanlı görevler, gelişmiş oyun, XR ve ML tabanlı deneyimlerin kullanım örneklerini kapsıyor.
Sürdürülebilir performansta Cortex-A78 çift haneli iyileştirmeler getiriyor. Aynı mobil termal güç zarfında önceki model Cortex-A77'ye göre sürdürülebilir performansta %20'lik bir iyileşme sağlıyor. AnandTech rakamları gözden geçirdi ve %20 rakamının A77'ye göre %7 daha yüksek IPC'nin birleşimi olduğunu açıkladı. Geriye kalan %13'lük performans artışı, yeni nesil SoC'lerin tamamının üzerinde çalışılacağı 5nm sürecine aktarılıyor. uydurulmuş. ARM, mobil cihazların sınırlı bir kapasiteye sahip olduğunu söyleyerek sürdürülebilir performansın önemine dikkat çekiyor. gücü dağıtır ve sürdürülebilir performans, çok fazla güç gerektiren uygulamalarda gücün azaltılmasını önler güç. Bu da gecikme veya kare düşüşlerini önleyerek kullanıcı deneyimini iyileştirir.
Güç verimliliğinin artırılması, daha yüksek enerji verimliliği anlamına gelir; çünkü ikisi birbiriyle ilişkili ancak farklı kavramlardır. ARM'a göre Cortex-A78, mevcut mobil cihazların zirve noktaları gibi yüksek performans noktalarında 2019 cihazlarına göre %50 enerji tasarrufu sunuyor aynı performansta Cortex-A77 olarak. Bu etkileyici ve A78'i şimdiye kadar tasarladığı en enerji tasarruflu Cortex-A CPU ARM yapıyor.
ARM'in sürdürülebilir performansa odaklanması, yeni form faktörleri (katlanabilir telefonlar) ve 5G aracılığıyla geliştirilmiş "dijital etkileşim" gibi mobil inovasyonun bir sonraki dalgasına fayda sağlayacak. Gerçek şu ki, şimdiki nesil için durum böyle değil ve gelecek nesil için de pek bir önemi olmayacak.
Cortex-A78'in geliştireceği bir kullanım durumu, ARM'in kendi yeni Mali-G78 GPU'su ile birleştirildiğinde AAA mobil oyundur. Bu ikisinin birleşimi, yüksek kaliteli oyun deneyimlerini mobile taşımayı amaçlıyor. Daha yüksek performansları, 5G'nin yüksek hızı ve yüksek bant genişliği ile birleştiğinde, mobil cihazlarda birinci sınıf oyun oynamaya olanak tanıyacak. A78'in verimliliğinin burada bir faydası var; çünkü uzun süreli oyun için daha uzun pil ömrü sağlayacak. ARM, performansı daha da artırmak ve daha zengin oyun deneyimleri oluşturmak için ekosistemle birlikte çalıştığını söylüyor ve Burst Compiler'ı Android'e getirmek için Unity ile yaptığı çalışmalara bir örnek veriyor.
Makine öğrenimi (ML) performansı ARM için bir başka önceliktir. CPU, mobil cihazlarda makine öğrenimi hesaplaması için ilk tercih edilen işlemcidir, ancak günümüzde üst düzey SoC'ler ayrı sinir işleme birimleri (NPU'lar) ile birlikte gelmektedir. ARM'in CPU'ları, gerçek dünyadaki en popüler makine öğrenimi uygulamalarını ve akıllı telefonlardaki sosyal medya filtreleri, dikte, güvenlik ve güvenlik gibi kullanım örneklerini destekler. Cortex-A78, ML tabanlı görevler için A77'ye kıyasla ortalama %8 daha az güç kullanıyor ve bu da resmi verimlilikte %10 artış sağlıyor.
ARM Cortex-A78 - Mimari
ARM Cortex-A78 önceki nesille aynı mimariye sahiptir (hala bir ARM v8.2 çekirdeğidir). Ancak ARM, bir alanda performansı daha yüksek ve güç açısından verimli bir şekilde artırmayı amaçlayan mikro mimari özellikler ekledi. ARM, gerekli performans seviyelerini korurken alan ve güç tasarrufu sağlıyor. Yine ARM'in Cortex-A serisine odaklanması, artık Cortex-X programının üstlendiği bir iş olan en yüksek performanstan ziyade alan ve güç verimliliği üzerinde kalıyor.
Cortex-A78'in performans iyileştirmeleri, genişliği ve derinliği optimize eden ek mikro mimari özellikler aracılığıyla sağlanır. Talimat kod çözme genişliği, A77 ve A76 ile aynı şekilde 4 genişlikte kalır. (Öte yandan Cortex-X1'in kod çözme genişliği 5 genişlikteyken A13'ün kod çözme genişliği 7 genişliktir.) ARM, talimat birleştirme durumlarının yanı sıra bant genişliği ve doğruluk için daha büyük dallanma tahmini ekledi. Bu mimari iyileştirmeler, A77'ye göre tek iş parçacığı performansında %7'lik bir artış sağlıyor.
L1-I ve L1-D önbellekleri gibi düşük performansa ve alana sahip yapılar azaltılarak verimlilik en üst düzeye çıkarıldı. ARM, marka tahmin yapıları gibi mevcut yapıları daha az güç tüketecek şekilde optimize etti. ARM, bunun A77'ye kıyasla mW başına performans için %4 daha az güç ve mm2 başına %5 daha az performans alanı sağladığını söylüyor.
A78, küme düzeyinde sınıfının en iyisi verimlilikle sürdürülebilir performansa odaklanmayı sürdürüyor. 4x Cortex-A77 ve 4x Cortex-A55 CPU'lardan oluşan bir DynamIQ kümesi, 4x A78 çekirdeğine ve 4x A55 çekirdeğine yükseltilebilir. Bu, %15 daha az alanda %20 sürekli performans artışı sağlar. Yüksek kaliteli oyun gibi paralel olarak birden fazla yüksek performanslı iş parçacığı gerektiren uygulamalar, sürekli performans artışı nedeniyle fayda sağlayacaktır.
ARM, A78 DynamIQ kümesinin gelişmiş alan verimliliğinin, onu katlanabilir telefonlar ve çoklu ve daha büyük ekranlar için ideal hale getirdiğini belirtiyor. Bir diğer odak noktası ise performans ve enerji iyileştirmeleri yoluyla akıllı telefonları 5G'ye hazır hale getirmek. 5G'nin "çok daha yüksek hızlar", "çok daha düşük gecikme süresi" ve "yüksek bant genişliğine sahip uygulamalar için mobil cihazlar için çok daha hızlı ve daha yaygın bağlantı" sağladığı iddia ediliyor. Birkaç yıl sonra durum böyle olabilir, ancak şu anda bu faydaların çoğu son tüketiciler tarafından fark edilemiyor.
Genel olarak Cortex-A78 sağlam bir üründür. Yeni nesil amiral gemisi SoC'ler, tek Cortex-X1 çekirdeğini tamamlamak için birden fazla A78 çekirdeği içerecek. daha yüksek güç ve alan gereksinimlerine sahiptir ve bazı değer odaklı SoC'ler Cortex-X1'i atlamayı bile tercih edecektir. Baştan sona. Orta sınıf SoC pazarı için A78, 2021 SoC'ler için tercih edilen CPU çekirdeği olacak ve sürdürülebilir performansa odaklanması memnuniyetle karşılanıyor.
ARM Mali-G78
En hafif tabirle ARM'ın Mali serisi GPU'ları, Cortex serisi CPU'ları kadar başarılı olamadı. Mali GPU'lar, Apple'ın özel GPU'ları ve Qualcomm'un özel Adreno GPU'ları tarafından her yıl hem performans hem de güç verimliliği açısından sürekli olarak geride kalıyor. Geçen yıl yeni Valhall mimarisinin ve Mali-G77 GPU'nun piyasaya sürülmesi ne yazık ki bunu değiştirecek hiçbir şey yapmadı. Mali-G77'yi içeren SoC'ler şunları içeriyordu: Exynos 990 ve MediaTek Boyutu 1000L sırasıyla. Ne yazık ki her ikisinin de zayıf uygulamaları vardı ve bu da GPU performanslarının düşebileceği anlamına geliyordu. Qualcomm'un Adreno 650 GPU'su ile rekabet edemez, Apple'ın Apple A12'deki sınıfının lideri GPU'larını bir kenara bırakın ve A13. Mali yıllardır geride kaldı ve iyileştirmeleri mobil GPU alanındaki statükoyu değiştirmeye yetmedi.
Yine de ARM iyimser olmasa bile hiçbir şey ifade etmiyor. Ortaklarının yılda bir milyardan fazla Mali GPU sevk ettiğini ve bu durumun Mali'yi dünyada bir numaralı GPU sevkıyatı haline getirdiğini belirtiyor. Bu sayının, ileri düzey mobil oyun ve XR (VR ve AR) gibi grafik yoğunluklu kullanım durumlarını mümkün kılan çok sayıda farklı cihaz türüyle daha da artacağı tahmin ediliyor. ARM'a göre bu, Mali'yi ekosistem genelinde mobil geliştirme için en yaygın kullanılan GPU haline getiriyor.
ARM, 2019'da Valhall mimarisine dayanan ilk GPU'su Mali-G77'yi duyurduğunu belirtiyor. 2020 yılında G77'nin yerini yine Valhall mimarisine dayanan Mali-G78 alacak. ARM, premium mobil cihazlar için bugüne kadarki en performanslı GPU olduğunu söylese de, ARM'in ironik bir şekilde bunun rakamlarla desteklenen bir gerçek olduğunu söylemesine rağmen rakamlar bunu desteklemiyor. G78, G77'ye göre performansta %25'lik bir iyileşme sağlıyor; bu, en hafif tabirle yetersiz bir rakam. G77 ile Apple A13'ün GPU'su arasındaki en yüksek GPU performansı arasındaki fark önemliydi; bu, yaklaşmakta olan Apple A14'ün GPU'su bir yana, G78'in A13'ü yakalayamayacağı anlamına geliyor. Qualcomm ayrıca kendi artan performans iyileştirmeleri nedeniyle bir adım önde olmaya devam edecek.
Oyunun kurallarını değiştiren grafikler ve mobil cihazlarda tüm gün oyun oynamak diğer GPU'larda zaten mümkün, bu nedenle ARM'in buradaki pazarlaması biraz içi boş görünüyor.
ARM'a göre Mali-G78, geliştiriciler ve son kullanıcı düşünülerek tasarlandı. Artık mobil cihazlarda mevcut olan konsol oyunlarıyla yüksek kaliteli mobil oyun deneyimleri sağlıyor. G78, birinci sınıf mobil cihazlara daha uzun pil ömrü getiriyor. Ayrıca mobil cihazlarda daha karmaşık oyun, video, kamera ve güvenlik makine öğrenimi özellikleri için makine öğrenimi performansında ek bir artış sağlar.
ARM, mobil oyun geleceği konusunda iyimser. Mobil oyunlar, 2019 yılında küresel oyun pazarının %46'sından fazlasını oluşturarak 68,2 milyar dolar gelire ulaştı. Ayrıca hem PC hem de konsol oyunlarını geride bırakacağı için önümüzdeki birkaç yıl içinde büyümeye devam etmesi bekleniyor. Mobil cihazlara daha fazla premium oyun geliyor ve kullanıcılar, konsollara kıyasla mobil cihazlarda da benzer bir deneyim bekliyor.
Bu deneyimleri mümkün kılmak için Mali-G78 gerekli performans artışıyla birlikte geliyor. G77'ye kıyasla oyun içeriğinde %15'lik bir performans yoğunluğu artışına sahiptir. Önceki nesille aynı miktarda alan için G78 daha fazla performans sağlayacak. Bu destek dört temel özellik sayesinde mümkün oluyor:
- 24 çekirdeğe kadar destek
- Asenkron Üst Düzey
- Kiremit iyileştirmeleri
- Geliştirilmiş parça bağımlılığı takibi
G77'nin maksimum çekirdek sayısı 16 iken ARM, G78'deki maksimum çekirdek sayısını maksimum 24 çekirdeğe çıkardı. Elbette, maksimum bir sayının olması, mobil çip satıcılarının aslında 24 çekirdek kullanacağı anlamına gelmiyor. G77'nin şu ana kadar gördüğümüz en geniş çekirdekli çeşidi Exynos 990'daki Mali-G77MP11 iken Dimensity 1000'de Mali-G77MC9 bulunuyor.
ARM, Asenkron Üst Düzeyin GPU performansı açısından oyunun kurallarını değiştiren bir özellik olduğuna inanıyor. Bunun, mobil oyunlardan mümkün olduğunca fazla performans elde ederek maksimum performansı garantilediği söyleniyor.
Tiler iyileştirmeleri ise mobil oyunlara ekstra bir kalite katmanı ekliyor. PC'den ve konsoldan getirilen oyunlar genellikle son derece karmaşık varlıklara ve karmaşık sahnelere sahiptir ve bu da performansta takılma noktalarına ve darboğazlara neden olur. Tiler iyileştirmeleri, bu karmaşık sahneler ve varlıklar için GPU üzerindeki köşe yükünü azaltır. Bu, karmaşık konsol benzeri oyun içeriğinin performansını artırır.
ARM ayrıca G78'deki parça bağımlılığı takibini de geliştirdi. Bu durum özellikle duman, ağaç ve çimen içeren karmaşık oyun sahnelerinin yer aldığı mobil oyunları etkilemektedir. Sonuçlar, ARM'nin G77 ile karşılaştırıldığında en iyi mobil oyunlarda %17'ye varan performans artışı kaydettiğini gösteriyor.
Mali-G78, önceki modele göre %10 daha iyi enerji verimliliğine sahiptir. Bu da ne Qualcomm'u ne de Apple'ı yakalamaya yetmeyecek. ARM'in buradaki hedefleri özellikle muhafazakar görünüyor. Asenkron Üst Seviye özelliği, güçte azalma sağlayarak içeriğin sürdürülebilir bir şekilde üretilmesini sağladığı için enerji verimliliğinde önemli bir rol oynuyor. Bu nedenle, bir cihaz istenen kare hızında içerik çıkışı yaparken, enerji tasarrufu sağlamak için saati yavaşlatabilir. Bu görev için Üst Düzeyin artırılması biraz daha fazla enerji gerektirir ancak gölgelendirici çekirdeklerinin frekansının azaltılmasından elde edilen enerji tasarrufu çok daha yüksektir. Bunun nedeni gölgelendirici çekirdeklerinin GPU'nun enerji bütçesinin %90-95'ini kullanmasıdır.
Fused multiple-add (FMA) sayesinde G78'de daha iyi enerji verimliliği de elde ediliyor. Sıfırdan tamamen yeniden tasarlandı ve ünitenin enerjisinde %30'luk bir azalma sağlandı. FMA birimi, GPU içinde gerçekleşen hesaplamaların çoğundan sorumludur ve bu nedenle ARM'nin enerji azaltımları için onu hedeflemesi mantıklıydı.
GPU'nun paralel veri işleme yeteneği, onu ML iş yüklerini çalıştırmak için uygun hale getirir; ancak ARM, CPU ve GPU'nun ML için birincil işlemciler olarak kaldığını kabul eder. Kullanım durumları karmaşıklaştıkça bazı iş yükleri GPU'ya aktarılacaktır. GPU'nun ana makine öğrenimi kullanım durumları, cihazdaki güvenlik özellikleri, farklı kamera ve video modlarının yanı sıra AR özellikli uygulamalarla bağlantılıdır.
ML'nin GPU üzerindeki rolü, fotoğraf veya video çerçevesinde yüz izleme, AR özelliklerini kullanan oyunlar ve daha fazlası gibi deneyimlere olanak tanır. Bu ML tabanlı görevler için Mali-G78, G77 ile karşılaştırıldığında çeşitli ML iş yüklerinde ortalama %15'lik bir performans artışı sunar. G77, önceki nesillere göre makine öğrenimi performansında %60'lık bir iyileşme sağladı; dolayısıyla bu yıl yıldan yıla kaydedilen iyileşme çok daha küçük. Gölgelendirici çekirdeklerinin saat hızının belirlenmesi, GPU'daki çeşitli ML kullanım durumlarına yardımcı olduğundan, Eşzamansız Üst Düzey, ML performansının artırılması açısından hayati öneme sahiptir.
Ardından Mali-G68'in duyurusu geldi. Bu, Mali-G78'in daha dar bir varyantından başka bir şey değildir, tıpkı Mali-G57'nin Mali-G77'nin daha dar bir varyantı olması gibi. ARM, bunun 2021 cihazları için ilk alt premium Mali GPU olduğunu söylüyor. Tiler geliştirmeleri ve yürütme motorundaki yeni FMA ünitesi gibi G78'in tüm özelliklerine sahiptir ancak 24 yerine 6 çekirdeğe kadar destekler. Bu GPU'nun amacı daha düşük maliyetle premiuma yakın performanstır.
ARM, bu alt premium GPU katmanını, cihaz portföylerinde premium özellikler isteyen iş ortaklarından gelen geri bildirimleri dinledikten sonra geliştirdi. G68, beklendiği gibi daha düşük bir silikon alanına sahip ve yüksek performanslı oyunları daha geniş bir geliştirici ve tüketici kitlesine ulaştırıyor.
ARM son olarak geliştirici ortaklıklarından bahsediyor. Geliştiricilerin içeriklerini Mali GPU'larda (teorik olarak) daha iyi çalışacak şekilde optimize etmelerini kolaylaştırır. Bunun bir örneği Performans Danışmanıdır. İkincisi, ARM'in Burst Compiler'ı getirmek için Unity ile yaptığı işbirliğidir. Bununla ilgili ayrıntıları kaynak makalede okuyabilirsiniz.
Mali-G78 - Görünüm
Mali-G78'in görünümü kasvetli. Görünüşe göre ARM, Apple'ın yaptığı kalıpta, Qualcomm'un geçmişte yaptığı kalıpta yıldan yıla önemli performans iyileştirmeleri yapmakla ilgilenmiyor. Qualcomm'un gelişme hızı da yavaşlamış olsa da temel seviyesi ARM'den daha yüksek bir yerde. İncelemeciler sayısal kanıtlarla A13'ün GPU'sunun sürdürülebilir performansının Snapdragon 865'in en yüksek performansından daha yüksek olduğunu belirttiğinde, Android ekosistemi için kötü görünüyor. Apple ve Android GPU'lar arasındaki performans farkı büyüyor ve daha da genişliyor.
Bu nedenle G78, ARM'in Mali GPU sorunlarını çözecek ve onları performans listelerinin en üstüne çıkaracak sihirli bir çözüm değil. Hala Apple ve Qualcomm'un GPU'larının altında yer alacak. Bazı SoC'ler için varsayılan seçim olacaktır sırf ARM'in stok GPU IP'si olduğu ve özel çözümlerin giriş engelleri olduğu ve maliyeti daha yüksek olduğu için Peki.
Gelecek yıl, Samsung Systems LSI'nin gerçekten Mali-G78'i kullanıp kullanmayacağı şüpheli. Samsung, Mali GPU'ların yüksek profilli bir müşterisiydi ancak geçen yıl, RDNA GPU mimarisini getirmek için AMD ile ortaklık imzaladı 2021'de mobil SoC'lerine. Eğer bu yol haritası yolunda giderse (ki bu noktada bunun yolunda olmadığından şüphelenmek için hiçbir nedenimiz yok), o zaman Exynos 990'ın halefi Mali GPU yerine AMD RDNA GPU'ya sahip olacak. Gerçekten ARM için büyük bir tasarım kaybı olacak. MediaTek gibi diğer satıcıların bile bugünlerde daha fazla seçeneği var. Hayal Teknolojileri'nin yeni A serisi GPU mimarisi G78'den daha yüksek performansa yönelik bir tasarım hedefine sahip ve gelecekte MediaTek'in Mali'den ayrılması mümkün. Qualcomm'un elbette Adreno GPU çabalarından vazgeçmesi için hiçbir neden yok. Yalnızca Android hakkında konuşurken performans ve verimlilik açısından sınıfının en iyisi akıllı telefon pazarı.
Bu nedenle, ARM'nin mobil GPU pazarında gerçek bir fark yaratmak için Mali GPU'larındaki yıllık iyileştirme oranını artırması gerektiği açıktır. Bunu başaramazsa premium amiral gemisi mobil GPU alanında sonradan akla gelme riskiyle karşı karşıya kalır.
ARM Ethos N78
Son olarak ARM, Ethos N78 sinirsel işlem birimini (NPU) de duyurdu. N77 NPU'nun halefidir. Cihaz üzerinde daha fazla makine öğrenimi kapasitesi ve %25'e kadar daha fazla performans verimliliği sunar. Mevcut konfigürasyonlar 1 TOP/s'den 10 TOP/s'ye kadar değiştiği için yapılandırılabilirlik de güçlü bir özelliktir. Daha fazla ayrıntı için şuraya bakın: ARM'ın blog yazısı. Qualcomm, Samsung, HiSilicon ve MediaTek'in hepsinin kendi Sinir İşleme Birimleri/Yapay Zeka Motorları olması nedeniyle bu NPU'nun tasarım kazanımları muhtemelen sınırlı olacaktır.
Kaynaklar: ARM (1, 2), AnandTech (1, 2)