Samsung Austin Ar-Ge Merkezi, yayınlanmamış Exynos M6 CPU mikro mimarisinin ayrıntılarını ortaya koyuyor

click fraud protection

Samsung Austin Araştırma ve Geliştirme Merkezi (SARC), iptal edilen Exynos M6 özel CPU çekirdeğinin mikro mimarisini detaylandıran bir makale yayınladı.

Samsung'un Austin Araştırma ve Geliştirme Merkezi'ndeki (SARC) özel CPU çekirdek projesinin sona erdi Ekim 2019'da. Exynos M1'in yer aldığı Exynos 8890'ın 2016 yılında piyasaya sürülmesiyle bu kadar tantanayla tanıtılan bir proje için üzücü bir son oldu. SARC neden projeyi rafa kaldırdı? Exynos M5 özel çekirdeği, Exynos 990 SoC, öngörülebilir gelecek için Samsung tarafından tasarlanan son tamamen özel çekirdektir ve geriye dönüp baktığımızda, Samsung'un yeterince rekabetçi olmadığından neden özel çekirdeklerden vazgeçtiğini anlamak kolaydır. Artık Exynos M5 çekirdeğinin olduğu biliniyor %100 güç verimliliği açığı var ARM'ın Cortex-A77'sine karşı bu çok şey söylüyor. Ancak bu şekilde sonuçlanmak zorunda değildi. Exynos M1 ve Exynos M2 tasarımları bir miktar umut vaat ediyordu ve özel CPU çekirdek projesi o zamanlar mobil CPU alanındaki rekabet açısından önemli görülüyordu. Exynos M3, büyük IPC artışına rağmen büyük bir gerileme yaşadı ve

Exynos M4 ve Exynos M5, ARM'in stok CPU IP'sine ayak uyduramadı. Bir sonraki özel çekirdek olan iptal edilen Exynos M6'daki mikro mimari değişiklikler nelerdi?

Şu ana kadar bu sorunun cevabı bilinmiyordu. Ancak şimdi SARC CPU geliştirme ekibi "Samsung Exynos CPU Mimarisinin Evrimi" başlıklı bir makale sundu (bunu şu adresten öğrendik: AnandTech) bir IEEE konferansı olan Uluslararası Bilgisayar Mimarisi Sempozyumu'nda (ISCA). Önceki Exynos M serisi CPU'ların yanı sıra iptal edilen Exynos M6'nın mimarisi hakkında birçok ayrıntıyı ortaya koyuyor.

SARC'ın CPU geliştirme ekibi tarafından sunulan belge, ekibin sekiz yıllık varlığı boyunca gösterdiği çabaları ayrıntılarıyla anlatıyor ve ayrıca Exynos M1'den özel ARM çekirdeklerine ilişkin önemli ayrıntıları ortaya koyuyor (Mongoose) mevcut nesil Exynos M5'e (Lion) ve hatta iptal edilmeden önce Exynos 990'ın 2021 SoC'sinde yer alması beklenen yayınlanmamış Exynos M6 CPU'ya kadar varis.

Samsung'un SARC CPU ekibi, daha sonra Samsung Sistemlerinde yer alan özel CPU çekirdekleri geliştirmek üzere 2011 yılında kuruldu. LSI'ın Exynos SoC'leri. Özel bir çekirdek kullanan ilk Exynos SoC, 2016'nın Samsung Galaxy modelinde yer alan Exynos 8890'dı. S7. Özel çekirdekler, Exynos destekli Samsung Galaxy S20 modellerinde yer alan Exynos M5 çekirdekli Exynos 990'a kadar Exynos SoC'lerin bir parçası olarak kaldı. (Yaklaşan Exynos 992Galaxy Note 20'de yer alması muhtemel olan cihazın ARM'leri içermesi bekleniyor. Cortex-A78 Exynos M5 değil.) Ancak SARC, Exynos M6 mimarisini CPU ekibinden önce tamamlamıştı. Ekim 2019'da dağıldığı haberini aldı ve dağılmanın 2019'da yürürlüğe girmesiyle Aralık.

ISCA belgesinde, Samsung'un Exynos M1'den Exynos M6'ya kadar özel CPU çekirdekleri arasındaki mikro mimari farklılıklara ilişkin bir genel bakış tablosu yer alıyor. Tasarımın iyi bilinen özelliklerinden bazıları şirket tarafından HotChips 2016 etkinliğinde yapılan ilk M1 CPU mimarisi derinlemesine incelemesinde açıklanmıştı. HotChips 2018'de Samsung, Exynos M3'ü derinlemesine inceledi. M6'nın yanı sıra Exynos M4 ve Exynos M5 çekirdeklerinin mimarisi de detaylandırıldı.

Kaynak: SARC

AnandTech Samsung'un yıllar içindeki tasarımlarının en önemli özelliğinin, Exynos M1 Mongoose çekirdeğiyle başlatılan aynı RTL planına dayanması olduğunu belirtiyor. Samsung, yıllar geçtikçe çekirdeklerin işlevsel bloklarında iyileştirmeler yapmaya devam etti. Exynos M3, 4 geniş tasarımdan 6 geniş orta çekirdeğe geçerek çekirdeği çeşitli açılardan önemli ölçüde genişlettiği için ilk yinelemelerden bir değişikliği temsil ediyordu. (Öte yandan Apple A11, A12 ve A13, 7 genişlikte kod çözme genişliğine sahipken Cortex-A76, A77 ve A78, 4 genişlikte genişliğe sahiptir. Cortex-X1, kod çözme genişliğini 5 genişliğe çıkarır.)

Raporda ayrıca Exynos M5 ve M6 ile ilgili daha önce kamuya açıklanmayan bazı açıklamalara da yer veriliyor. Samsung, Exynos M5 için çekirdeklerin önbellek hiyerarşisinde daha büyük değişiklikler yaparak özel L2 önbelleklerini yeni bir önbellekle değiştirdi. Daha büyük paylaşılan önbellek ve L3 yapısında 3 bankalı tasarımdan 2 bankalı tasarıma doğru daha az veri içeren bir değişiklik açıklanıyor. gecikme.

İptal edilen M6 çekirdeği, mikro mimari açısından daha büyük bir sıçrama olurdu. SARC, L1 talimatını ve veri önbelleklerini 64KB'den 128KB'ye iki katına çıkarmak gibi büyük iyileştirmeler yapmıştı. AnandTech Bunun, Apple A12'den başlayarak şimdiye kadar yalnızca Apple'ın A serisi çekirdekleri tarafından uygulanan bir tasarım tercihi olduğunu belirtiyor.

L2'nin bant genişliği kapasitesi iki katına çıkarılarak 64B/döngüye çıkarıldı; L3'ün ise 3 MB'tan 4 MB'a bir artış görmesi bekleniyordu. Exynos M6, 8 genişlikte bir kod çözme çekirdeği olurdu. Tarafından belirtildiği gibi AnandTechBu, kod çözme açısından şu anda bilinen en geniş ticari mikro mimari olurdu. Ancak çekirdek çok daha geniş olmasına rağmen tamsayı yürütme birimlerinde çok fazla değişiklik görülmedi. Karmaşık bir işlem hattı ikinci bir tamsayı bölme özelliği eklerken, yükleme/depolama işlem hatları bir yük birimi, bir depolama birimi ve bir yükleme/depolama birimi ile M5 ile aynı kaldı. Kayan nokta/SIMD işlem hatları, FMAC yeteneklerine sahip ek bir dördüncü üniteye sahip olacaktı. L1 DTLB, 48 sayfadan 128 sayfaya çıkarıldı ve ana TLB, 4K sayfadan 8K sayfaya (32MB kapsam) iki katına çıkarıldı.

Exynos M6, M3'ten bu yana ilk kez çekirdeğin sıra dışı penceresini artırarak önceki modellere göre önemli bir değişikliği temsil ediyordu. Daha büyük tamsayı ve kayan noktalı fiziksel kayıt dosyaları olacaktı ve ROB (Yeniden Sipariş Arabelleği) 228'den 256'ya artacaktı. AnandTech özel Exynos çekirdeklerindeki önemli bir zayıflığın M5'te hala mevcut olduğunu ve M6'da da mevcut olacağını belirtiyor. ARM'nin 11 döngülü yanlış tahmin cezasına sahip CPU çekirdeklerinden daha yüksek olan, 16 döngülük pahalı bir yanlış tahmin cezasıyla sonuçlanacak olan şey, daha derin boru hattı aşamaları olacaktır. SARC makalesi, CPU çekirdeğinin Ölçeklendirilmiş Hashed Perceptron tabanlı tasarımını sergileyerek dal tahmin tasarımında daha da derinlere iniyor. Bu tasarım, yıllar ve uygulamalar boyunca sürekli olarak gelişecek, dallanma doğruluğunu iyileştirecek ve kilo talimatı başına yanlış tahminleri (MPKI) sürekli olarak azaltacaktı. SARC, dal tahmincisinin ön uçta kapladığı depolama yapılarının miktarını gösteren bir tablo sunar. Çekirdeğin önceden getirme teknolojileri de makalede detaylandırıldı ve µOP önbelleğinin tanıtılması da kapsandı. M5'te ekibin çekirdeği güvenlik açıklarına karşı güçlendirme çabalarının yanı sıra Spectre.

Özel Exynos çekirdeklerindeki bellek gecikmesini iyileştirme çabaları da makalede SARC tarafından ayrıntılı olarak açıklandı. Exynos M4'te SARC ekibi, etkili L1 döngü gecikmesini sonraki yüklerde dört döngüden üç döngüye düşüren bir yük-yük kademeli mekanizması içeriyordu. M4 çekirdeği ayrıca, CPU çekirdeklerinden doğrudan bellek denetleyicilerine giden yeni bir arayüze sahip bir yol bypass'ı da tanıttı; bu, ara bağlantı üzerinden trafiği önledi. Buna göre AnandTechBu, yayının Exynos 9820 ile ölçebildiği daha büyük gecikme iyileştirmelerinden bazılarını açıkladı. Exynos M5, hem ara bağlantıya hem de önbellek etiketlerine aynı anda istek gönderen spekülatif bir önbellek arama atlaması başlattı. Bu muhtemelen bellek isteği devam ederken önbellek kaybı durumunda gecikmeden tasarruf sağlayacaktır. Ortalama yük gecikmesi de nesiller boyunca M1'de 14,9 döngüden M6'da 8,3 döngüye kadar sürekli olarak iyileştirildi.

Yukarıdaki mikro mimari özellikler oldukça teknik olsa da, CPU meraklıları MHz başına anlamına gelen Saat Başına Talimatlar (IPC) terimine aşina olacaktır. tek iş parçacıklı CPU performansındaki performans (tek iş parçacıklı CPU performansını belirleyen birincil ana faktördür, diğer faktör ise işlemcinin saat hızıdır) çekirdek). Tamsayı IPC ve kayan noktalı IPC'nin her ikisi de IPC'nin belirleyicileridir. SARC ekibi, M1'den M6'ya kadar yıllık ortalama %20 iyileştirme elde etmeyi başardı. Özellikle M3, diğer faktörler nedeniyle hayal kırıklığına uğrasa da IPC'de büyük bir yüzdelik iyileşmeyi temsil ediyordu. Exynos M5, IPC'de %15-17'lik bir iyileşmeyi temsil ederken, yayınlanmamış Exynos M6'nın IPC iyileştirmesi M1 için ortalama 2,71'e karşı 1,06 olduğu açıklandı, bu da önceki modele göre %20'lik bir iyileşmeyi temsil ediyor M5.

Gazetenin sunucusu Brian Grayson, soru-cevap bölümünde programın iptaliyle ilgili soruları yanıtladı. Ekibin her nesilde performans ve verimlilik iyileştirmeleriyle her zaman hedefine ve programına uygun hareket ettiğini söyledi. (Bu, ilk etapta hedeflerin yeterince yüksek olmadığı anlamına mı geliyor?). Takımın en büyük zorluğu ise geleceğe yönelik son derece dikkatli olmaktı. ekibin sıfırdan başlayacak veya bir metni tamamen yeniden yazacak kaynaklara sahip olmaması nedeniyle tasarım değişiklikleri engellemek. Geriye dönüp baktığımızda, ekibin geçmişte bazı tasarım yönleriyle farklı seçimler yapmış olması gerekirdi. Tam tersine, ARM'de farklı yerlerde çalışan ve birbirleriyle rekabet eden birden fazla CPU ekibi var. Bu, aşağıdaki gibi "temelden yeniden tasarımlara" olanak tanır Cortex-A76. Cortex-A77 ve Cortex-A78, A76'nın doğrudan halefleridir.

SARC ekibinin, varsayımsal Exynos M7 gibi gelecek çekirdekler için iyileştirmelere yönelik fikirleri vardı. Ancak özel çekirdek programını iptal etmeye karar verenin Samsung'da çok üst düzey bir kişi olduğu iddia edildi. Gibi AnandTech özel çekirdeklerin güç verimliliği, performans ve alan kullanımı (PPA) açısından ARM'in herhangi bir nesildeki CPU'larıyla karşılaştırıldığında rekabetçi olmadığını belirtiyor. Geçtiğimiz ay ARM, yeni özellikleri içeren Cortex-X Custom programını duyurdu. Cortex-X12021 mobil cihazlara yönelik yeni nesil bir çekirdek. Cortex-A PPA sınırlarını kırmak ve bunun yerine mutlak performansa yönelmek yönünde bir tasarım felsefesine sahiptir. Bu nedenle Exynos M6 onunla rekabet etmekte zorlanırdı. Öyle olsa bile Samsung, Cortex-X1'i uyarlamayacak ve Exynos 992'de yalnızca Cortex-A78 + Cortex-A55 kombinasyonunu kullanacak gibi görünüyor; ancak gelecek yılın Galaxy S amiral gemisine de uyarlanabilir.

SARC ekibi şu anda Samsung Systems LSI için özel ara bağlantılar ve bellek denetleyicileri tasarlamaya devam ediyor. Aynı zamanda özel GPU mimarileri üzerinde de çalışıyordu ancak Samsung Systems LSI AMD ile anlaşma imzaladı 2021'den itibaren gelecekteki Exynos GPU'larda AMD'nin yeni nesil (Yeni grafik mimarisi) RDNA GPU mimarisini kullanmak.

Genel olarak, özel CPU çekirdeği projesi, mobil çip satıcıları için neyin yanlış gidebileceği konusunda aydınlatıcı bir ders oldu. SARC CPU ekibinin, mobil CPU alanında tartışmasız lider olan Apple ile rekabet etme konusunda büyük hedefleri vardı. Maalesef Apple bırakın ARM ile rekabet edemedi. Sorunlar çözülebilirdi ama her geçen yıl SARC'ın çabaları bir veya iki adım geride kaldı ve Samsung Galaxy S9'un Exynos 9810 varyantları gibi ürünlerin nakliyesine olumsuz yansıdı. Artık tüm büyük Android mobil çip satıcıları, 2021'den itibaren ARM'in stok CPU IP'sini kullanacak ve bu listede Qualcomm, Samsung, MediaTek ve HiSilicon yer alıyor. Mücadele, sıfırdan tasarlanan özel ARM çekirdekleriyle değil, Cortex-X1 gibi çekirdeklerle Apple'a verilecek.


Kaynak: Samsung Exynos CPU Mimarisinin Gelişimi | Aracılığıyla: AnandTech