Самсунг Остин Р&Д центар открива детаље своје необјављене микроархитектуре Екинос М6 ЦПУ-а

click fraud protection

Самсунг Аустин Ресеарцх & Девелопмент Центер (САРЦ) објавио је рад који детаљно описује микроархитектуру отказаног Екинос М6 прилагођеног ЦПУ језгра.

Знамо да је пројекат прилагођеног ЦПУ језгра у Самсунговом истраживачком и развојном центру у Аустину (САРЦ) дошао крај у октобру 2019. За пројекат који је промовисан са таквом помпом лансирањем Екинос М1 са Екинос 8890 2016. године, то је био тужан крај. Зашто је САРЦ преклопио пројекат? Прилагођено језгро Екинос М5, представљено у Екинос 990 СоЦ је последње потпуно прилагођено језгро које је дизајнирао Самсунг у догледној будућности, а гледајући уназад, лако је видети зашто је Самсунг одустао од прилагођених језгара, јер једноставно нису били довољно конкурентни. Сада је познато да је језгро Екинос М5 има 100% дефицит енергетске ефикасности против АРМ-овог Цортек-А77, који много говори. Ипак, није морало да испадне тако. Дизајни Екинос М1 и Екинос М2 су обећавали, а прилагођени пројекат језгра ЦПУ-а се у то време сматрао важним због конкуренције у мобилном ЦПУ простору. Екинос М3 је био велики пад упркос великом повећању ИПЦ-а и

Екинос М4 и Екинос М5 није успео да одржи корак са АРМ-овим стандардним ЦПУ ИП-ом. Које су биле микроархитектонске промене у следећем прилагођеном језгру, отказаном Екинос М6?

Одговор на то питање до сада је био непознат. Сада је, међутим, развојни тим САРЦ ЦПУ-а представио рад под насловом „Еволуција Самсунг Екинос ЦПУ архитектуре“ (коју смо упознали преко АнандТецх) на Међународном симпозијуму за рачунарску архитектуру (ИСЦА), који је ИЕЕЕ конференција. Открива много детаља о претходним процесорима Екинос М серије, као и архитектуру отказаног Екинос М6.

Документ који је представио САРЦ-ов тим за развој процесора детаљно описује напоре тима током његовог осмогодишњег постојања, а такође открива кључне детаље прилагођених АРМ језгара у распону од Екинос М1 (Монгоосе) до тренутне генерације Екинос М5 (Лион), па чак и необјављеног Екинос М6 ЦПУ-а, за који се очекивало да ће се, пре отказивања, појавити у Екинос 990 СоЦ-у из 2021. наследник.

Самсунгов САРЦ ЦПУ тим је основан 2011. године да развије прилагођена ЦПУ језгра, која су тада представљена у Самсунг системима ЛСИ-јеви Екинос СоЦ-ови. Први Екинос СоЦ који је користио прилагођено језгро био је Екинос 8890, који је представљен у Самсунг Галаки-ју 2016. С7. Прилагођена језгра су остала део Екинос СоЦ-а све до Екинос 990 са Екинос М5 језграма, која су се налазила у варијантама Самсунг Галаки С20 који покреће Екинос. (Надолазеће Екинос 992, који ће се вероватно појавити у Галаки Ноте 20, очекује се да ће имати АРМ Цортек-А78 а не Екинос М5.) Међутим, САРЦ је завршио архитектуру Екинос М6 пре него што је ЦПУ тим добио вест да је распуштен у октобру 2019, а распуштање је ступило на снагу у децембар.

ИСЦА рад садржи прегледну табелу микроархитектонских разлика између Самсунгових прилагођених ЦПУ језгара од Екинос М1 до Екинос М6. Неке од добро познатих карактеристика дизајна компанија је открила у свом почетном дубоком уласку у архитектуру М1 ЦПУ-а на догађају ХотЦхипс 2016. На ХотЦхипс 2018, Самсунг је дао дубок поглед на Екинос М3. Архитектура Екинос М4 и Екинос М5 језгара је такође детаљно описана, као и М6.

Извор: САРЦ

АнандТецх напомиње да је једна кључна карактеристика Самсунговог дизајна током година била то што је заснован на истом РТЛ-у нацрту који је започет са језгром Екинос М1 Монгоосе. Самсунг је наставио да унапређује функционалне блокове језгара током година. Екинос М3 је представљао промену у односу на прве итерације јер је значајно проширио језгро у неколико аспеката, прелазећи од дизајна ширине 4 до средњег језгра ширине 6. (Аппле А11, А12 и А13, с друге стране, имају ширину декодирања од 7 ширине, док Цортек-А76, А77 и А78 имају ширину од 4 ширине. Цортек-Кс1 повећава ширину декодирања на 5 ширине.)

Извештај такође даје нека открића која раније нису била јавна у вези са Екинос М5 и М6. За Екинос М5, Самсунг је направио веће промене у хијерархији кеша језгара, заменивши приватне Л2 кеш меморије новим већи заједнички кеш као и откривање промене у Л3 структури са дизајна са 3 банке на дизајн са 2 банке са мање латентност.

Отказано М6 језгро би био већи скок у смислу микроархитектуре. САРЦ је направио велика побољшања као што је удвостручење Л1 инструкција и кеш меморије података са 64КБ на 128КБ - АнандТецх напомиње да је ово избор дизајна који су до сада имплементирала само језгра Аппле А серије, почевши од Аппле А12.

Л2 је удвостручен у својим могућностима пропусног опсега на 64Б/циклус, док би Л3 имао повећање са 3МБ на 4МБ. Екинос М6 би био језгро за декодирање ширине 8. Како је приметио АнандТецх, ово би била најшира комерцијална микроархитектура тренутно позната у смислу декодирања. Међутим, иако је језгро било много шире, целобројне извршне јединице нису виделе много промена. Један сложени цевовод је додао другу могућност дељења целог броја, док су цевоводи за пуњење/складиштење остали исти као код М5 са једном јединицом за пуњење, једном јединицом за складиштење и једном јединицом за пуњење/складиштење. Цевоводи са помичним зарезом/СИМД би видели додатну четврту јединицу са ФМАЦ могућностима. Л1 ДТЛБ је повећан са 48 страница на 128 страница, а главни ТЛБ је удвостручен са 4К страница на 8К страница (32МБ покривеност).

Екинос М6 би представљао још једну значајну промену у односу на своје претходнике тако што би повећао прозор ван реда језгра од првог пута од М3. Постојале би веће датотеке физичког регистра са целим бројем и покретним зарезом, а РОБ (Бафер за преуређивање) би се повећао са 228 на 256. АнандТецх напомиње да је једна важна слабост прилагођених Екинос језгара и даље присутна на М5 и да би била присутна и на М6. Његове дубље фазе цевовода би резултирале скупом казном за погрешно предвиђање од 16 циклуса, која је била већа од АРМ-ових ЦПУ језгара које имају казну за погрешно предвиђање од 11 циклуса. САРЦ документ иде у још већу дубину у дизајн предиктора грана, приказујући дизајн базиран на Сцалед Хасхед Перцептрон језгри ЦПУ-а. Овај дизајн би се континуирано побољшавао током година и имплементација, побољшавајући тачност гране и континуирано смањујући погрешна предвиђања по килограму инструкција (МПКИ). САРЦ представља табелу која показује количину складишних структура коју предиктор гранања заузима унутар фронт-енд-а. Технологије претходног преузимања језгра такође су детаљно описане у раду, покривајући увођење µОП кеша. у М5, као и напоре тима да ојача језгро против безбедносних рањивости као нпр. Авет.

САРЦ је такође детаљно описао настојања да се побољша кашњење меморије у прилагођеним Екинос језграма. У Екинос М4, САРЦ тим је укључио каскадни механизам оптерећења и оптерећења који је смањио ефективно кашњење циклуса Л1 са четири циклуса на три при наредним учитавањима. М4 језгро је такође увело обилазницу путање са новим интерфејсом од ЦПУ језгара директно до меморијских контролера, чиме је избегнут саобраћај кроз интерконекцију. Према АнандТецх, ово је објаснило нека од већих побољшања кашњења која је публикација могла да измери са Екинос 9820. Екинос М5 је увео спекулативно заобилажење тражења кеша, који је истовремено издао захтев и за интерконекцију и за кеш ознаке. Ово би можда уштедело на кашњењу у случају пропуста кеша док је захтев за меморијом у току. Просечна латенција оптерећења је такође континуирано побољшавана током генерација са 14,9 циклуса на М1 до 8,3 циклуса на М6.

Иако су горе наведене микроархитектонске карактеристике прилично техничке, ЦПУ ентузијасти ће бити упознати са термином Инструкције по такту (ИПЦ), што значи по МХз перформансе у перформансама једнонитног процесора (то је примарни главни фактор који одређује перформансе једнонитног процесора, док је други фактор брзина такта процесора језгро). Целобројни ИПЦ и ИПЦ са помичним зарезом су обе детерминанте ИПЦ. Тим САРЦ-а је успео да постигне просечно 20% годишњих побољшања од М1 до М6. М3 је, посебно, представљао велики процентуални напредак у ИПЦ-у, иако су га други фактори изневерили. Екинос М5 је представљао побољшање од 15-17% у ИПЦ-у, док је побољшање ИПЦ-а за необјављени Екинос М6 откривено је да има просек од 2,71 наспрам 1,06 за М1, што представља побољшање од 20% у односу на М5.

Брајан Грејсон, презентер листа, је одговорио на питања о отказивању програма током сесије питања и одговора. Рекао је да је тим увек био на мети и по распореду са побољшањима перформанси и ефикасности са сваком генерацијом. (Да ли то значи да циљеви уопште нису били довољно високи?). Највећа потешкоћа за тим је, с друге стране, била у томе да буде изузетно опрезан према будућности промене дизајна пошто тим није имао ресурсе да почне од нуле или да потпуно препише а блокирати. Гледајући уназад, тим би донео различите изборе у прошлости са неким од праваца дизајна. За разлику од тога, АРМ има више ЦПУ тимова који раде на различитим локацијама који се међусобно такмиче. Ово омогућава "приземни редизајн" као што је Цортек-А76. Тхе Цортек-А77 а Цортек-А78 су директни наследници А76.

САРЦ тим је имао идеје за побољшања за надолазећа језгра као што је хипотетички Екинос М7. Међутим, наводно је особа на високом нивоу у Самсунгу одлучила да откаже прилагођени основни програм. Као АнандТецх напомене, прилагођена језгра нису била конкурентна у погледу енергетске ефикасности, перформанси и коришћења подручја (ППА) у поређењу са АРМ-овим ЦПУ-има било које одређене генерације. Прошлог месеца, АРМ је најавио Цортек-Кс Цустом програм са новим Цортек-Кс1, језгро нове генерације намењено мобилним уређајима за 2021. годину. Има филозофију дизајна да разбије Цортек-А ППА омотач и уместо тога постигне апсолутне перформансе. Екинос М6 би, стога, имао тешка времена да се такмичи са њим. Чак и тако, чини се да Самсунг неће прилагодити Цортек-Кс1 и да ће ићи само са Цортек-А78 + Цортек-А55 цомбо у Екинос 992 – међутим, можда ће бити усвојен у Галаки С водећем моделу следеће године.

САРЦ тим још увек дизајнира прилагођене интерконекције и меморијске контролере за Самсунг Системс ЛСИ. Такође је радио на прилагођеним ГПУ архитектурама, али Самсунг Системс ЛСИ потписао уговор са АМД-ом да користи АМД-ову архитектуру РДНА ГПУ следеће генерације (архитектура следеће графике) у будућим Екинос ГПУ-има, почевши од 2021.

Све у свему, пројекат прилагођеног ЦПУ језгра био је просветљујућа лекција за продавце мобилних чипова о томе шта може поћи по злу. Тим САРЦ ЦПУ-а је имао велике амбиције да се такмичи са Аппле-ом, који је неприкосновени лидер у мобилном ЦПУ простору. Нажалост, није успео да се такмичи са АРМ-ом, без обзира на Аппле. Проблеми су могли бити решени, али из године у годину напори САРЦ-а су били корак или два иза, и то се негативно одразило на производе за испоруку као што су Екинос 9810 варијанте Самсунг Галаки С9. Сада ће сви главни произвођачи Андроид мобилних чипова користити АРМ-ов основни ЦПУ ИП од 2021. године, а ова листа укључује Куалцомм, Самсунг, МедиаТек и ХиСилицон. Борба ће бити однета до Аппле-а са језграма као што је Цортек-Кс1, а не прилагођеним АРМ језграма дизајнираним од нуле.


Извор: Еволуција Самсунг Екинос ЦПУ архитектуре | преко: АнандТецх