Jak Qualcomm zlepšil výkon, hry a AI na Snapdragonu 855

click fraud protection

Nová mobilní platforma Qualcomm Snapdragon 855 přináší skvělá vylepšení, pokud jde o výkon, hraní her a AI, a my rozebíráme, jak to udělali.

Na Qualcomm’s Snapdragon Summit 2018 společnost oznámila svou nejnovější vlajkovou čipovou sadu prémiové úrovně: platformu Snapdragon 855. Tento nový produkt bude jádrem většiny plodných vlajkových lodí roku 2019 a přinese s sebou příslib neuvěřitelných datových rychlostí prostřednictvím modemu Snapdragon X50. Kromě toho však Snapdragon 855 přináší řadu vylepšení do každého bloku systému na čipu, některé výpočetní jednotky zaznamenaly v poslední době největší meziroční zlepšení výkonu a energetické účinnosti Dějiny.

Spectra 380 ISP-CV jsme již podrobně popsali, což například dále zlepšuje fotografování chytrými telefony a zároveň uživatelům přináší zdravé úspory baterie. Zatímco jsme stále více věnovali pozornost periferním komponentům, jako je Hexagon DSP, základní bloky, které nadšenci platí nejvíce pozornost – jmenovitě CPU a GPU – také zaznamenala více než mírné zisky díky architektonickým vylepšením a přechodu na nový proces uzel. V tomto článku rychle zrekapitulujeme, co je nového a co je známo o CPU, GPU a DSP Snapdragonu 855 a jak mohou vylepšení a nové funkce ovlivnit.

vaše uživatelské zkušenosti v roce 2019.


CPU Kryo 485 na bázi A76 a přechod na 7nm

Snapdragon 855 přechází na nejnovější 7nm výrobní proces FinFET společnosti TSMC. Obvykle se setkáváme s revizí uzlu každý rok nebo dva, s zmenšováním nebo optimalizací v polovině cyklu (např. (LPE) na „Low-Power Plus“ (LPP) v uzlech Samsung-LSI), takže jste o těchto metrikách pravděpodobně slyšeli v některých zprávách článek. Ale co to znamená? V této souvislosti popisuje velikost vlastností tranzistoru procesoru, což nám zase napovídá, jaké zlepšení hustoty tranzistorů můžeme očekávat s každou novou generací. S větším počtem tranzistorů na jednotku plochy lze výsledný výkon procesoru škálovat. Tato funkce je také důležitá, protože menší procesní uzly umožňují implementaci návrhů procesorů v menším měřítku, což je intuitivní zmenšuje prostor mezi prvky procesoru, čímž zkracuje vzdálenost, kterou musí elektrony urazit, aby dosáhly výpočet. To přináší zlepšení výkonu a menší procesy mají také nižší kapacitu, což znamená, že tranzistory se mohou zapínat a vypínat s nižší latencí a při nižší energii. Pro informaci, TSMC tvrdí, že přechod na jejich 7nm proces dosáhl výkon a energetická účinnost řádově 20 %, respektive 40 %., i když je to ve srovnání s vlastním 10nm FinFET procesem TSMC.

U několika posledních vlajkových čipsetů Snapdragon jsme viděli spolupráci Qualcommu se Samsungem a implementaci jejich 14nm a 10nm LPP/LPE procesu. Přechod na 7nm TSMC pro Snapdragon 855 však není neočekávaný, vzhledem k tomu, že 7nm proces Samsungu měl právě vstoupil do sériové výroby v říjnu, ačkoli v té době se uvádělo, že na něm bude postaven čipset 5G Qualcomm. Kromě toho je design 7LPP společnosti Samsung vyroben pomocí vylepšené litografické techniky známé jako extrémní ultrafialová litografie (EUVL), přináší 40% zmenšení plochy při stejné složitosti návrhu, o 20 % vyšší rychlosti nebo o 50 % nižší spotřebu energie ve srovnání s 10nm FinFET předchůdci. Každý nový skok do menších procesních uzlů je oslavován právě proto, že je tak obtížné jich dosáhnout. Například jak se tranzistory zmenšují, mohou vykazovat větší „únik“ nebo proud protékající „vypnutými“ tranzistory, což zvyšuje statickou spotřebu energie v klidových stavech. A zatímco menší čipy s hustším počtem tranzistorů mohou umožnit maximální využití daného křemíkového plátku, výtěžnost má tendenci být nižší. kvůli výše uvedenému úniku plus potíže při získávání procesorů s „vyšší binací“, které běží na jejich (vysoké) referenci frekvence. Tohle jsou prostě nějaký z mnoha vývojových překážek, které jsou samozřejmě odstraněny v době, kdy nový procesní uzel zasáhne hromadnou výrobu, ale v Stručně řečeno, existuje mnoho výzev v oblasti výzkumu a vývoje a také výroby, které zvyšují náklady na zavedení nové velikosti procesu trh.

Nejnovější architektura ARM A76 licencovaná pro Kryo 485 je dalším velkým přispěvatelem k podstatným meziročním vylepšením, která vidíme u Qualcomm Snapdragon 855. Jádro A76 je zbrusu nový, prázdný břidlicový design z kanceláří ARM v Austinu s novou mikroarchitekturou postavenou od nuly, aby poskytoval to, co ARM nazývá „výkon třídy notebooků s mobilní efektivita." Stále se jedná o semi-custom design a Qualcomm provedl vylepšení, jako je optimalizované předběžné načítání dat pro lepší efektivitu a větší provedení mimo pořadí okno. Tento nový design nabízí oproti A75, na kterém byla založena zlatá jádra Snapdragonu 845, některá ohromná vylepšení výkonu: slibuje O 35 % lepší výkon a o 40 % lepší energetická účinnost. Při porovnání A75 na 10nm procesu oproti A76 na 7nm procesu při stejném energetickém obalu 750 mW/jádro, výkonnostní výhoda roste na 40 % ve prospěch nového jádra a může se zvýšit i úspora energie na 50 %. A co víc, další vylepšení v Asymetric Single Instruction Multiple Data (ASIMD) potrubí a dot-product pokyny agregovat do ~3,9x zlepšení výkonu úloh strojového učení, jako je inference v konvolučních neuronových sítích. To vše představuje špičkový výkon na plochu a skvělý doplněk k novému 7nm procesu, přičemž 2,84GHz „primární jádro“ Qualcommu se přibližuje k referenčním 3GHz frekvencím ARM. používal při detailování nového jádra. Celkově vzato, Qualcomm slibuje absolutně masivní 45% zlepšení výkonu CPU nad 845, což je zatím největší meziroční nárůst.

Když už mluvíme o „hlavním jádru“ Snapdragonu 855, není také překvapivé, že Qualcomm přechází s tímto novým nastavením clusteru vzhledem k velkým vylepšením. LITTLE povoleno pomocí ARM DynamIQ technologické platformy. DynamIQ v podstatě umožňuje větší flexibilitu a škálovatelnost v návrhu vícejádrových procesorů, což umožňuje návrh více jader v daném clusteru a také jemné řízení napětí na jádro. (EDIT: V Q&A Qualcomm potvrdil, že jádro Prime sdílí svou doménu napájení s výkonnostním clusterem, což omezuje zde popsaný nástroj). A76 se obzvláště dobře hodí pro takové osamocené prémiové jádro s vlastním taktem, protože tlačí na obálku, pokud jde o jednovláknové výkon s o 25 % více celočíselných instrukcí za hodinu než A75 a o 35 % vyšší výkon ASIMD a pohyblivé řádové čárky, přičemž nabízí o 90 % vyšší šířka pásma paměti. Stručně řečeno, A76 představuje větší generační vzestup než předchozí generace, což bezpochyby přispělo k tomu, že Qualcomm meziroční nárůst výkonu Snapdragon 855 větší než obvykle (pro srovnání Qualcomm uvedl 25 až 30% nárůst u modelu 845 oproti 835). To by mohlo stačit k tomu, aby výsledný výkon Qualcomm Snapdragon 855 předčil jádro Mongoose 3 (M3) Samsung LSI, které se nachází v Exynos 9810, ačkoli tento konkrétní design trpěl energetickou účinností způsobem, jakým čipy Qualcomm netrpěly a že Snapdragon 855 s největší pravděpodobností nebude buď.

Co to znamená pro koncového uživatele? Samozřejmě bychom měli očekávat vyšší benchmarková jádra – projekty ARM o 28 % vyšší skóre Geekbench pro mobily a o 35 % lepší výkon Javascriptu. Kromě referenčních hodnot, které mohou mít malý vztah ke zkušenostem koncového uživatele, A76 pokračuje v zaměření A75 na trvalý výkon, což znamená, že uživatelé by měli očekávat menší omezování při delších herních relacích. Přechod na 7nm v kombinaci s novým designem jádra zcela jistě povede ke znatelné baterii zlepšení života pro koncové uživatele, a to je možná nejatraktivnější funkce této sady upgrady. Nové jádro „Prime“ je také zajímavé, vzhledem k tomu, že osamocené jádro zaměřené na špičkový výkon s jedním vláknem by mohlo prokázat přínos v aplikacích a procesech, které nejsou nastaveny tak, aby je náležitě využívaly vícevláknové. 7nm výrobní proces samozřejmě dále ovlivňuje další bloky Snapdragonu 855 a přináší stejnou úsporu energie. na další výpočetní jednotky, které se také podílejí na každodenním uživatelském zážitku, jako je zpracování obrazu pro fotografování chytrými telefony.


„Snapdragon Elite Gaming Experience“ a Adreno 640 GPU

Qualcomm Snapdragon 855 se tentokrát silně zaměřuje na hraní her, což je vzhledem k popularitě titulů nepřekvapivý obrat událostí. jako Fortnite a PlayerUnknown’s Battlegrounds a také rostoucí popularita mobilních eSportů (ano, to je věc) v Asii. Podle údajů společnosti Qualcomm z Zpráva o globálním trhu her Newzoo 2017, mobilní hraní roste s očekávaným celkovým výnosem v roce 2018 ve výši 70,3 miliardy dolarů, což představuje 51 % všech příjmů z hraní her díky 25,5% meziročnímu nárůstu.

Adreno 640 GPU přináší zdravé 20% zvýšení grafického výkonu, což dále zvyšuje náskok Qualcommu před konkurencí v této konkrétní oblasti. Pro srovnání, Snapdragon 845 přinesl 30% nárůst oproti Snapdragonu 835, který sám nabídl 30% zlepšení oproti Snapdragonu 821. Přesto by to mělo Qualcommu udržet náskok v grafickém výkonu, a co je nejdůležitější, v výkonu na watt, pokud se jim podaří zlepšit i v tomto směru. Kromě toho je Qualcomm, pokud jde o Adreno, stejně tajný jako vždy: slyšeli jsme o integrovaném mikrořadič pro správu napájení a jak má 640 nejnižší režii ovladače, ačkoli společnost zmínila zahrnutí O 50 % více aritmetických logických jednotek (ALU), které by dále zrychlily výkon AI.

Jedna věc, o které Qualcomm mluvil hodně času na briefingech, je jejich touha přinést „fyzikálně založené vykreslování“ (PBR) do více mobilních herních zážitků. PBR je stínovací model, který umožňuje realistické vykreslování grafiky, přesné modelování světelného toku v souladu s materiálem zastoupeným v texturách nebo mozaikováním povrchu. To umožňuje, aby objekty ve hře správně napodobovaly vizuální vlastnosti materiálů v reálném světě, včetně správného vykreslení mikropovrchů, jako jsou oděrky a zrcadlová světla. Nejvýraznější vylepšení však přicházejí v tom, jak umožňuje přesnější zobrazení odrazivosti a lesku všech povrchů, dokonce i těch z plochých a neprůhledných (simulovaných) materiálů.

Qualcomm a vývojáři stojící za populárním Unity Engine pracují na zpřístupnění PBR, ale společnost také spolupracuje s dalšími vývojáři enginu a her při optimalizaci mobilních her pro Snapdragon zařízení. Herní enginy jako Unity, Unreal, Messiah a NeoX jsou již optimalizovány například pro zařízení Snapdragon a Snapdragon 855 podporuje nejnovější grafická rozhraní API, jako je např. Vulkan 1.1. Studia jako NetMarble, která stojí za Lineage II: Revolutions, také v minulosti spolupracovala s Qualcomm, aby co nejlépe předvedla silné stránky platformy Snapdragon. Navíc s Snapdragon 675, viděli jsme rozhovory o vlastním algoritmu, který dosáhl až O 90 % méně šmejdů ve srovnání se stejnou platformou bez optimalizací a stejné změny se dostaly i do Snapdragonu 855. Stále není jasné, co tyto optimalizace obnášejí, a neočekáváme, že budou použitelné v každou hru, ale určitě to bude znamenat lepší výkon alespoň ve větších titulech Android.

Navíc k tomu všemu, zatímco Snapdragon 835 a 845 umožňoval přehrávání a zachycení (respektive) 10bitové, skutečné HDR video, Qualcomm Snapdragon 855 bude první mobilní čipset, který umožňuje skutečné HDR hraní. To bude vyžadovat skutečné displeje s podporou HDR, které jsou naštěstí mezi vlajkovými smartphony stále běžnější. Z tohoto důvodu mohou uživatelé očekávat bohatší barvy s větší tonální hloubkou, vyšším dynamickým rozsahem (jak naznačuje název) a vylepšeným kontrastem. Není to nezbytně nezbytně nutná funkce, ale je určitě hezké mít k dispozici současné HDR hraní nastavení vyžadují drahé televizory a monitory s podporou HDR, stejně jako schopné počítače a specifické hry konzole. S Qualcomm Snapdragon 855 bude HDR ve hrách pravděpodobně dostupnější a pohodlnější (samozřejmě bez ovládacích prvků na dotykové obrazovce).


Nový Hexagon 690 DSP pro pracovní zátěže AI

I když ji společnost ve svých marketingových materiálech výslovně nenazývá „neuronovou procesorovou jednotkou“, nové a vylepšené Hexagon 690 DSP budou využívat i pracovní zátěže AI. Qualcomm v tichosti představil tyto koprocesory před mnoha generacemi (s řádným představením QDSP6 v6 vedle 820), ale teprve nedávno je začali prezentovat jako některé z lepších bloků SoC pro AI. Architektura DSP, která byla původně navržena pro urychlení pracovních zátěží zobrazování, se – zejména se zahrnutím Hexagon Vector eXtensions (HVX) – stala skvělou volbou pro úlohy ML. DSP je více programovatelný než hardware s pevnou funkcí, přičemž si stále zachovává část výkonu a výhody efektivity, které charakterizují bloky procesoru specifické pro aplikaci, což výrazně zrychluje skalární a vektorové operace. To se ukázalo jako vynikající pro neustále se měnící algoritmy zpracování obrazu, které lze přenést na DSP, ale také se přirozeně hodí k pracovní zátěži AI. Hexagon DSP byl a výhoda pro strojové učení na okrajových zařízeních díky vynikajícímu vícevláknovému a paralelnímu zpracování na hardwarové úrovni, které je schopné zpracovat tisíce bitů vektorové jednotky na cyklus zpracování ve srovnání se stovkami bitů za cyklus průměrného jádra CPU a obsluhující vícenásobné snížení zátěže sezení.

Hexagon DSP je zvláště vhodný pro zobrazovací úlohy, protože může streamovat data přímo ze zobrazovacího senzoru do místní paměti DSP (L2 Cache), čímž obchází řadič paměti DDR zařízení. Google například použil zpracování obrazu Hexagon DSP k napájení algoritmů HDR+ Pixel a Pixel 2, než představil své vlastní Pixel Visual Core. Jsou to také zařízení připravená na Hexagon, která dosahují nejlepších výsledků z oblíbených portů Google Camera, které můžete prozkoumat tady. Používá se při pracovních zátěžích ve virtuální a rozšířené realitě a skvěle pohání nyní zaniklý Projekt Tango na Lenovo Phab 2 Pro a ASUS ZenFone AR. To znamená, že většina výrobců OEM implementujících vlajková zařízení Snapdragon využívá Hexagon DSP pro zpracování obrazu tak či onak, což můžete ověřit pomocí nástrojů, jako je Snapdragon Profiler.

Co je tedy nového s novým DSP? Hexagon 690 zdvojnásobil počet vektorových akcelerátorů (HVX) ze dvou na čtyři, aby pracovaly v tandemu se čtyřmi skalárními vlákny, které také zaznamenaly lepší výkon o 20 %. Kromě toho Hexagon 690 přináší první urychlovač tenzoru pro mobilní zařízení s Hexagon Tensor Accelerator (HTA). To je významný doplněk: slouží jako hardwarová akcelerace pro drahé násobení matic a také integruje nelineární funkce (jako sigmoid a ReLU) na hardwarové úrovni, což dále zrychluje odvození. Tyto změny DSP by se měly promítnout do lepší výkon hlasového asistenta, od detekce horkých slov až po analýzu příkazů na zařízení, která nabízí například vylepšené potlačení ozvěny a potlačení šumu. Qualcomm zdůrazňuje, že poskytují kompletní heterogenní výpočetní platformu, která umožňuje využití zátěže AI. buď CPU, GPU nebo DSP, nebo jakákoli kombinace těchto tří bloků – slovy Garyho Brotmana z Qualcommu své "více než jedno jádro, to je víc než hardware, je to kompletní systém". Jejich čtvrtá generace „Qualcomm AI Engine“ přesahuje také hardware, protože najdeme také podporu pro Snapdragon Neural Processing SDK a Hexagon NN pro přístup výše uvedené bloky, stejně jako Android NN API a populární ML frameworky jako Caffe/Caffe 2, TensorFlow/Lite a ONNX (Open Neural Network Výměna). V souhrnu může Snapdragon 855 nabídnout trojnásobek hrubého výkonu umělé inteligence svého předchůdce (a dvakrát ve srovnání s Huawei), převyšující 7 bilionů operací za sekundu (TOP). Mějte však na paměti, že Qualcomm se nadále soustředí na heterogenní výpočetní řešení a nezaměřuje se na jediný vyhrazený blok.

Chcete-li se dozvědět více o Hexagon DSP, podívejte se loňský kousek podrobně popisuje, jak pomáhá s pracovní zátěží AI.


Stručně řečeno, výpočetní balíček Snapdragon 855 přináší některá z nejpůsobivějších meziročních vylepšení, která jsme v posledních letech viděli. Spectra 380 ISP-CV, kterému jsme se věnovali v samostatném článku, také přináší ohromné ​​zvýšení výkonu a energetické účinnosti, což umožňuje vynikající nové funkce, jako je nahrávání videa 4K 60FPS HDR s režim na výšku nebo výměna pozadí (docela flex!).

Jak je vysvětleno v tomto článku, tato vylepšení a nové funkce by se měly hmatatelně projevit v uživatelské zkušenosti. Těšíme se na Qualcomm Snapdragon 855 a brzy jej hloubkově otestujeme, takže zůstaňte naladěni na XDA-Developers pro nejnovější zprávy a analýzy Snapdragon 855!