Новата мобилна платформа Qualcomm Snapdragon 855 носи страхотни подобрения по отношение на производителността, игрите и AI и ние разбиваме как са го направили.
На срещата на Qualcomm Snapdragon Summit 2018 компанията обявиха най-новия си първокласен флагмански чипсет: платформата Snapdragon 855. Този нов продукт ще бъде в основата на повечето от плодотворните флагмани на 2019 г., носейки със себе си обещанието за невероятни скорости на данни чрез модема Snapdragon X50. Отвъд това обаче, Snapdragon 855 носи куп подобрения на всеки блок система върху чип, с някои изчислителни единици отбелязват най-големите годишни подобрения в производителността и енергийната ефективност напоследък история.
Вече описахме подробно Spectra 380 ISP-CV, например, което допълнително подобрява фотографията със смартфон, като същевременно дава на потребителите здравословно пестене на батерията. Въпреки че все повече обръщаме внимание на периферните компоненти като Hexagon DSP, основните блокове, на които ентусиастите плащат най-много вниманието към – а именно, CPU и GPU – също отбелязаха повече от скромни печалби с архитектурни подобрения и преминаването към нов процес възел. В тази статия ще обобщим накратко какво е новото и какво се знае за CPU, GPU и DSP на Snapdragon 855 и как подобренията и новите функции могат да повлияят
Вашият потребителско изживяване през 2019 г.Базиран на A76 Kryo 485 CPU и преминаването към 7nm
Snapdragon 855 преминава към най-новия 7nm FinFET производствен процес на TSMC. Обикновено виждаме ревизия на възел на всяка година или две, с намаления или оптимизации в средата на цикъла (като преминаването от „Ранно с ниска мощност“ (LPE) към "Low-Power Plus" (LPP) в Samsung-LSI възли), така че вероятно сте чували за тези показатели в някои или други новини статия. Но какво означава? В този контекст той описва размера на характеристиките на транзистора на процесора, които от своя страна ни подсказват какъв вид подобрения на плътността на транзистора можем да очакваме с всяко ново поколение. С повече транзистори на единица площ, резултатната производителност на процесора може да бъде увеличена. Тази функция също е важна, тъй като по-малките процесни възли позволяват проектите на процесори да бъдат реализирани в по-малък мащаб, което интуитивно свива пространството между елементите на процесора, като на свой ред скъсява разстоянието, което електроните трябва да изминат, за да изминат изчисление. Това води до подобрения в производителността, а по-малките процеси също имат по-нисък капацитет, което означава, че транзисторите могат да се включват и изключват с по-ниска латентност и с по-ниска енергия. За справка, TSMC твърди, че преминаването към техния 7nm процес постига производителност и енергийна ефективност от порядъка на съответно 20% и 40%., въпреки че това е в сравнение със собствения 10nm FinFET процес на TSMC.
За последните няколко водещи чипсета на Snapdragon видяхме как Qualcomm работи със Samsung и внедрява техния 14nm и 10nm LPP/LPE процес. Преминаването към 7nm на TSMC за Snapdragon 855 обаче не е неочаквано, като се има предвид, че 7nm процесът на Samsung имаше току-що влезе в масово производство през октомври, въпреки че по това време беше съобщено, че върху него ще бъде изграден 5G чипсет Qualcomm. Освен това дизайнът 7LPP на Samsung е произведен чрез подобрена литографска техника, известна като екстремна ултравиолетова литография (EUVL), осигурявайки 40% намаление на площта при еднаква сложност на дизайна, с 20% по-високи скорости или 50% по-малко консумация на енергия в сравнение с 10nm FinFET предшественици. Всеки нов скок към по-малки процесни възли се празнува точно защото са толкова трудни за постигане. Например, тъй като транзисторите стават по-малки, те могат да покажат по-голямо „изтичане“ или ток, протичащ през транзистори, които са „изключени“, увеличавайки статичната консумация на енергия в неактивни състояния. И докато по-малките чипове с по-голям брой транзистори могат да позволят да се извлече максимума от дадена силициева пластина, добивът обикновено е по-нисък поради гореспоменатото изтичане, плюс трудност при получаване на процесори с „по-високо групиране“, които работят при тяхната (висока) референтна стойност честоти. Това са просто някои от многото препятствия в развитието, които разбира се се изглаждат до момента, в който нов процесен възел удари масово производство, но в Накратко, има много R&D, както и производствени предизвикателства, които добавят към разходите за въвеждане на нов размер на процеса пазар.
Най-новата архитектура ARM A76, лицензирана за Kryo 485, е друг голям принос за значителните годишни подобрения, които виждаме с Qualcomm Snapdragon 855. Ядрото A76 е чисто нов, празен дизайн от офисите на ARM в Остин, включващ нова микроархитектура, изградена от нулата, за да осигури това, което ARM нарича „производителност от клас лаптоп с мобилна ефективност." Това все още е полуперсонализиран дизайн и Qualcomm са направили подобрения като оптимизирано предварително извличане на данни за по-добра ефективност и по-голямо изпълнение извън реда прозорец. Този нов дизайн предлага някои огромни подобрения на производителността в сравнение с A75, на който са базирани златните ядра на Snapdragon 845: той обещава 35% подобрение на производителността и 40% по-добра енергийна ефективност. Когато сравнявате A75 по 10nm процес спрямо A76 по 7nm процес при същата мощностна обвивка от 750mW/ядро, предимството в производителността нараства до 40% в полза на новото ядро, а спестяванията на енергия също могат да се покачат до 50%. Нещо повече, други подобрения в Asymmetric Single Instruction Multiple Data (ASIMD) конвейери и инструкции за точков продукт съвкупност до ~3,9 пъти подобрения в изпълнението на задачи за машинно обучение, като извод в конволюционни невронни мрежи. Всичко това се равнява на водеща в индустрията производителност на област и чудесно допълнение към новия 7nm процес, с 2.84GHz „основно ядро“ на Qualcomm, което се доближава до 3GHz референтни тактови скорости ARM беше използвал при детайлизиране на новото ядро. Всичко на всичко, Qualcomm обещава огромно подобрение на производителността на процесора с 45%. над 845, най-голямото увеличение на годишна база досега.
Говорейки за „основното ядро“ на Snapdragon 855, също не е изненадващо да видим Qualcomm да се намеси с тази нова настройка на клъстера, предвид подобренията в сравнение с големия. LITTLE активиран от ARM DynamIQ технологични платформи. По същество DynamIQ позволява по-голяма гъвкавост и мащабируемост в дизайна на многоядрения процесор, позволявайки многоядрени дизайни в даден клъстер, както и фино контрол на напрежението за всяко ядро. (РЕДАКТИРАНЕ: Във Въпроси и отговори Qualcomm потвърди, че ядрото Prime споделя своя енергиен домейн с клъстера за производителност, ограничавайки описаната тук помощна програма). A76 е особено подходящ за такова самотно премиум ядро със собствен часовник, като се има предвид, че избутва границите, когато става дума за еднопоточна производителност с 25% повече целочислени инструкции за такт от A75 и 35% по-висока ASIMD и производителност с плаваща запетая, като същевременно предлага 90% по-висока честотна лента на паметта. Накратко, A76 представлява по-голямо издигане на поколенията в сравнение с предишните поколения, което без съмнение допринесе и за Qualcomm по-голямо от обичайното увеличение на производителността на годишна база за Snapdragon 855 (за справка Qualcomm цитира 25 до 30% увеличение за 845 спрямо 835 Серия Това може да е достатъчно, за да постави резултатната производителност на Qualcomm Snapdragon 855 пред ядрото Mongoose 3 (M3) на Samsung LSI, намерено в Exynos 9810, въпреки че този конкретен дизайн страда от енергийна ефективност по начин, който чиповете на Qualcomm нямат, и че Snapdragon 855 най-вероятно няма да или.
Какво означава това за крайния потребител? Разбира се, трябва да очакваме увеличени бенчмарк ядра – ARM проектира 28% по-високи резултати на Geekbench за мобилни устройства и 35% подобрена производителност на Javascript. Отвъд бенчмарковете, които може да имат малко отношение към изживяването на крайния потребител, A76 продължава фокуса на A75 върху устойчиво представяне, което означава, че потребителите трябва да очакват по-малко дроселиране по време на продължителни сесии на игра. Преминаването към 7nm, комбинирано с новия дизайн на ядрото, определено ще доведе до забележима батерия подобрения в живота на крайните потребители и това е може би най-привлекателната характеристика на този набор от надстройки. Новото ядро „Prime“ също е интересно, като се има предвид, че едно самотно ядро, фокусирано върху най-добрата еднонишкова производителност, може се оказват полезни в приложения и процеси, които не са настроени да се възползват правилно многопоточност. Разбира се, 7nm производственият процес допълнително засяга и други блокове на Snapdragon 855, носейки същите икономии на енергия към други изчислителни единици, които също участват в ежедневното потребителско изживяване, като обработка на изображения за смартфон фотография.
„Snapdragon Elite Gaming Experience“ и графичен процесор Adreno 640
Този път Qualcomm Snapdragon 855 се фокусира силно върху игрите, което не е изненадващ обрат на събитията предвид популярността на заглавията като Fortnite и PlayerUnknown’s Battlegrounds, както и нарастващата популярност на мобилните електронни спортове (да, това е нещо) в Азия. Според данни, показани от Qualcomm от Доклад за световния пазар на игри Newzoo 2017, мобилните игри се развиват с очаквани общи приходи за 2018 г. от $70,3 милиарда, съставляващи 51% от всички приходи от игри, благодарение на ръст от 25,5% на годишна база.
Графичният процесор Adreno 640 носи здравословна 20% увеличение на графичната производителност, което допълнително увеличава преднината на Qualcomm пред конкуренцията в тази конкретна област. За справка обаче, Snapdragon 845 донесе 30% подобрение спрямо Snapdragon 835, който също предложи 30% подобрение спрямо Snapdragon 821. Все пак това трябва да поддържа Qualcomm напред в графичната производителност и най-важното в производителността на ват, ако успеят да се подобрят и на този фронт. Отвъд тази цифра, Qualcomm е потаен както винаги, когато става въпрос за Adreno: чухме за интегрирания микроконтролер за управление на захранването и как 640 има най-ниските режийни драйвери, въпреки че компанията спомена включване на 50% повече аритметични логически единици (ALUs), което допълнително ще ускори работата на AI.
Едно нещо, за което Qualcomm прекараха много време в разговори на брифинги, е желанието им да внесат „физически базирано рендиране“ (PBR) в повече мобилни игри. PBR е модел на засенчване, който позволява реалистично изобразяване на графики, точно моделиране на светлинния поток в съответствие с материала, представен в текстурите или теселацията на повърхността. Това позволява на обектите в играта правилно да имитират визуалните свойства на материалите от реалния свят, включително правилното изобразяване на микро-повърхности като ожулвания и огледални отблясъци. Най-забележимите подобрения обаче идват в това как позволява по-точно изобразяване на отразяващата способност и блясъка на всички повърхности, дори тези от плоски и непрозрачни (симулирани) материали.
Qualcomm и разработчиците зад популярния Unity Engine работят върху това да направят PBR по-достъпен, но компанията работи и с други разработчици на двигатели и игри за оптимизиране на мобилни игри за Snapdragon устройства. Игровите двигатели като Unity, Unreal, Messiah и NeoX вече са оптимизирани за устройства Snapdragon, например, а Snapdragon 855 поддържа най-новите графични API, като новия Вулкан 1.1. Студиа като NetMarble, които стоят зад Lineage II: Revolutions, също са работили с Qualcomm в миналото, за да покажат най-добре силните страни на платформата Snapdragon. Освен това, с Snapdragon 675, видяхме разговори за персонализиран алгоритъм, който постигна до 90% по-малко джанки в сравнение със същата платформа без оптимизациите и същите промени стигнаха до Snapdragon 855. Все още не е ясно какво включват тези оптимизации и не очакваме да бъдат приложими всяка игра, но определено ще означава по-добро представяне поне в по-големите заглавия Android.
На всичкото отгоре, докато Snapdragon 835 и 845 позволяваха възпроизвеждане и заснемане (съответно) на 10-битово, истинско HDR видео, Qualcomm Snapdragon 855 ще бъде първият мобилен чипсет, който позволява истински HDR игри. Това ще наложи дисплеи с истински HDR, които за щастие са все по-често срещани сред водещите смартфони. Поради това потребителите могат да очакват по-богати цветове с повече тонална дълбочина, по-висок динамичен диапазон (както се подразбира от името) и подобрен контраст. Това не е непременно задължителна функция, но със сигурност е хубаво да имаш предвид сегашните HDR игри настройките изискват скъпи готови за HDR телевизори и монитори, както и способни компютри и специфични игри конзоли. С Qualcomm Snapdragon 855 HDR в игрите вероятно ще бъде по-достъпен и удобен (разбира се, без контролите на сензорния екран).
Нов Hexagon 690 DSP за натоварвания на AI
Въпреки че компанията не го нарича изрично „блок за невронна обработка“ в своите маркетингови материали, работните натоварвания на AI също ще се възползват от новия и подобрен Hexagon 690 DSP. Qualcomm тихо представи тези копроцесори преди много поколения (с правилното представяне на QDSP6 v6 заедно с 820), но едва наскоро започнаха да ги представят като едни от по-добрите SoC блокове за AI. Първоначално проектирана за ускоряване на работните натоварвания с изображения, архитектурата на DSP – по-специално с включването на Hexagon Vector eXtensions (HVX) – стана чудесно подходяща за ML задачи. DSP е по-програмируем от хардуера с фиксирана функция, като същевременно запазва част от производителността и ползи за ефективност, които характеризират специфичните за приложението процесорни блокове, значително ускоряващи скаларно и векторно операции. Това се оказа отлично за непрекъснато променящите се алгоритми за обработка на изображения, които могат да бъдат прехвърлени към DSP, но също така естествено се поддават на натоварвания на AI. Hexagon DSP е a благодат за машинно обучение на крайни устройства благодарение на отличната си многонишковост на хардуерно ниво и паралелни изчисления, способни да обработват хиляди битове векторни единици на цикъл на обработка, в сравнение със стотици битове на цикъл на средно процесорно ядро и обслужване на множество разтоварвания сесии.
Hexagon DSP е особено подходящ за задачи с изображения, тъй като може да предава данни директно от сензора за изображения към локалната памет на DSP (L2 Cache), заобикаляйки контролера на DDR паметта на устройството. Google, например, използваха обработката на изображения на Hexagon DSP, за да захранват HDR+ алгоритмите на Pixel и Pixel 2, преди да представят свои собствени Pixel Visual Core. Това също са готови за Hexagon устройства, които виждат най-добри резултати от популярните портове на Google Camera, които можете да изследвате тук. Използван е в работни натоварвания с виртуална и разширена реалност, известни с захранването на вече несъществуващ Проект Танго на Lenovo Phab 2 Pro и ASUS ZenFone AR. Въпреки това повечето OEM производители, внедряващи водещи устройства Snapdragon, използват Hexagon DSP за обработка на изображения по един или друг начин, което можете да проверите с помощта на инструменти като Snapdragon Profiler.
И така, какво е новото с новия DSP? Hexagon 690 удвои броя на векторните ускорители (HVX) от два на четири, за да работят в тандем с четирите скаларни нишки, които също имат подобрена производителност с 20%. На всичкото отгоре Hexagon 690 носи първия тензорен ускорител за мобилни устройства с Шестоъгълен тензорен ускорител (HTA). Това е значително допълнение: служи като хардуерно ускорение за скъпо матрично умножение и също така интегрира функции за нелинейност (като сигмоида и ReLU) на хардуерно ниво, като допълнително ускорява умозаключение. Тези промени в DSP трябва да се превърнат в по-добра работа на гласовия асистент, от откриване на горещи думи до анализиране на команди на устройството, предлагащи например подобрено анулиране на ехото и потискане на шума. Qualcomm подчертава, че те предоставят цялостна хетерогенна изчислителна платформа, която позволява натоварването на AI да се използва или CPU, GPU или DSP, или произволна комбинация от трите блока -- по думите на Гари Бротман от Qualcomm, това това е "повече от едно ядро, това е повече от хардуер, това е цялостна система". Тяхното 4-то поколение "Qualcomm AI Engine" също надхвърля хардуера, тъй като откриваме поддръжка за SDK за невронна обработка на Snapdragon и Hexagon NN за достъп гореспоменатите блокове, както и Android NN API и популярни ML рамки като Caffe/Caffe 2, TensorFlow/Lite и ONNX (отворена невронна мрежа Обмен). Като цяло Snapdragon 855 може да предложи три пъти сурова производителност на AI на своя предшественик (и два пъти в сравнение с Huawei), надхвърляйки 7 трилиона операции в секунда (ТОП). Имайте предвид обаче, че Qualcomm продължава да се фокусира върху хетерогенно изчислително решение, вместо да се фокусира върху един специален блок.
За да научите повече за Hexagon DSP, разгледайте миналогодишното парче подробно как помага при натоварвания на AI.
В обобщение, изчислителният пакет на Snapdragon 855 носи някои от по-въздействащите подобрения от година на година, които сме виждали през последните години. Spectra 380 ISP-CV, които разгледахме в отделна статия, също носи огромни подобрения на производителността и енергийната ефективност, позволявайки отлични нови функции като 4K 60FPS HDR видеозапис с портретен режим или смяна на фон (доста гъвкав!).
Както е обяснено в тази статия, тези подобрения и нови функции трябва осезаемо да се усетят в цялото потребителско изживяване. Очакваме с нетърпение Qualcomm Snapdragon 855 и скоро ще можем да го тестваме задълбочено, така че следете XDA-Developers за последните новини и анализи за Snapdragon 855!