Jak Qualcomm poprawił wydajność, gry i sztuczną inteligencję na Snapdragonie 855

Nowa platforma mobilna Qualcomm Snapdragon 855 zapewnia ogromne ulepszenia w zakresie wydajności, gier i sztucznej inteligencji, a my opisujemy, jak tego dokonano.

Na szczycie Qualcomm Snapdragon Summit 2018 firma ogłosił swój najnowszy, flagowy chipset klasy premium: platformę Snapdragon 855. Ten nowy produkt będzie sercem większości flagowców z 2019 roku, niosąc ze sobą obietnicę niesamowitych prędkości transmisji danych za pośrednictwem modemu Snapdragon X50. Poza tym Snapdragon 855 wprowadza mnóstwo ulepszeń do każdego bloku typu system-on-chip, z niektóre jednostki obliczeniowe odnotowały w ostatnim czasie największą poprawę wydajności i efektywności energetycznej rok do roku historia.

Opisaliśmy już szczegółowo Spectra 380 ISP-CVna przykład, co jeszcze bardziej usprawnia fotografowanie smartfonami, a jednocześnie zapewnia użytkownikom znaczne oszczędności baterii. Chociaż coraz częściej zwracamy uwagę na komponenty peryferyjne, takie jak Hexagon DSP, to podstawowe bloki, za które entuzjaści płacą najwięcej na które zwrócono uwagę — a mianowicie procesor i procesor graficzny — również odnotowały ponad skromne zyski dzięki ulepszeniom architektury i przejściu na nowy proces węzeł. W tym artykule szybko przypomnimy, co nowego i co wiadomo na temat procesora, karty graficznej i procesora DSP Snapdragon 855 oraz w jaki sposób ulepszenia i nowe funkcje mogą wpłynąć na

twój doświadczenia użytkowników w 2019 r.


Procesor Kryo 485 oparty na A76 i przejście na proces 7 nm

Snapdragon 855 przechodzi na najnowszy proces produkcyjny 7 nm FinFET firmy TSMC. Zwykle co rok lub dwa mamy do czynienia z rewizją węzła, obejmującą zmniejszenie rozmiaru lub optymalizację w połowie cyklu (np. przejście z „wczesnej wersji o niskim poborze mocy”) (LPE) do „Low-Power Plus” (LPP) w węzłach Samsung-LSI), więc prawdopodobnie słyszałeś o tych wskaźnikach w takich czy innych wiadomościach artykuł. Ale co to oznacza? W tym kontekście opisuje rozmiar właściwości tranzystora procesora, co z kolei wskazuje nam, jakiego rodzaju poprawy gęstości tranzystorów możemy się spodziewać w każdej nowej generacji. Dzięki większej liczbie tranzystorów na jednostkę powierzchni uzyskaną wydajność procesora można zwiększyć. Cecha ta jest również istotna, ponieważ mniejsze węzły procesowe pozwalają na realizację projektów procesorów na mniejszą skalę, co jest intuicyjne zmniejsza przestrzeń pomiędzy elementami procesora, skracając tym samym odległość, jaką muszą pokonać elektrony obliczenie. Przekłada się to na poprawę wydajności, a mniejsze procesy mają również niższą pojemność, co oznacza, że ​​tranzystory mogą włączać się i wyłączać z mniejszym opóźnieniem i przy niższej energii. Dla porównania, TSMC twierdzi, że przejście na proces 7 nm zostało osiągnięte wydajność i efektywność energetyczną odpowiednio rzędu 20% i 40%., chociaż jest to porównywane z własnym procesem FinFET 10 nm firmy TSMC.

W przypadku kilku flagowych chipsetów Snapdragon Qualcomm współpracował z Samsungiem i wdrażał procesy LPP/LPE 14 nm i 10 nm. Przejście na proces 7 nm TSMC w przypadku Snapdragona 855 nie jest jednak nieoczekiwane, biorąc pod uwagę, że proces 7 nm Samsunga właśnie w październiku wszedł do masowej produkcji, chociaż wówczas informowano, że ma na nim zostać zbudowany chipset 5G Qualcomm. Co więcej, konstrukcja 7LPP firmy Samsung jest wytwarzana przy użyciu ulepszonej techniki litografii znanej jako litografia ekstremalnego ultrafioletu (EUVL), co zapewnia 40% redukcję powierzchni przy tej samej złożoności projektu, przy 20% większych prędkościach lub 50% mniejszym zużyciu energii w porównaniu do 10 nm FinFET przodkowie. Każdy nowy skok do mniejszych węzłów procesu jest celebrowany właśnie dlatego, że jest tak trudny do osiągnięcia. Na przykład, gdy tranzystory stają się mniejsze, mogą wykazywać większy „upływ” lub prąd przepływający przez tranzystory, które są „wyłączone”, zwiększając pobór mocy statycznej w stanach bezczynności. I chociaż mniejsze chipy z większą liczbą tranzystorów mogą pozwolić na maksymalne wykorzystanie danej płytki krzemowej, wydajność jest zwykle niższa ze względu na wspomniany wyciek oraz trudności w uzyskaniu procesorów z „wyższym przedziałem”, które działają na ich (wysokim) poziomie referencyjnym częstotliwości. To są po prostu Niektóre z wielu przeszkód rozwojowych, które oczywiście zostają usunięte do czasu, gdy nowy węzeł procesu trafi do masowej produkcji, ale w Krótko mówiąc, istnieje wiele wyzwań związanych z badaniami i rozwojem oraz produkcją, które zwiększają koszty dostosowania procesu do nowej wielkości rynek.

Najnowsza architektura ARM A76, licencjonowana dla Kryo 485, to kolejny świetny czynnik przyczyniający się do znacznych ulepszeń z roku na rok, które obserwujemy w przypadku Qualcomm Snapdragon 855. Rdzeń A76 to zupełnie nowa konstrukcja z biura ARM w Austin, charakteryzująca się nową mikroarchitekturą zbudowaną od podstaw, aby zapewnić to, co ARM nazywa „wydajnością klasy laptopa z Wydajność mobilna.” Jest to nadal projekt częściowo niestandardowy, a Qualcomm wprowadził ulepszenia, takie jak zoptymalizowane wstępne pobieranie danych w celu zapewnienia lepszej wydajności i większe wykonywanie poza kolejnością okno. Ta nowa konstrukcja oferuje ogromną poprawę wydajności w porównaniu z procesorem A75, na którym opierały się złote rdzenie Snapdragon 845: zapewnia Poprawa wydajności o 35% i efektywność energetyczna o 40%.. Porównując A75 w procesie 10 nm z A76 w procesie 7 nm przy tej samej obwiedni mocy 750 mW/rdzeń, przewaga wydajności wzrasta do 40% na korzyść nowego rdzenia, a oszczędności energii mogą również wzrosnąć do 50%. Co więcej, inne ulepszenia w potokach asymetrycznych pojedynczych instrukcji i wielu danych (ASIMD) oraz instrukcje produktu kropkowego łącznie do ~3,9x poprawy wydajności zadań uczenia maszynowego, takich jak wnioskowanie w splotowych sieciach neuronowych. Wszystko to składa się na wiodącą w branży wydajność na obszar i doskonałe uzupełnienie nowego procesu 7 nm, z „głównym rdzeniem” Qualcomm 2,84 GHz, który zbliża się do referencyjnej częstotliwości ARM 3 GHz użyłem podczas opisywania nowego rdzenia. W sumie, Qualcomm obiecuje absolutnie ogromną poprawę wydajności procesora o 45%. w stosunku do 845, co stanowi największy jak dotąd wzrost rok do roku.

Skoro mowa o „najwyższym rdzeniu” Snapdragona 855, nie jest zaskakujące, że Qualcomm wprowadza nową konfigurację klastrów, biorąc pod uwagę ponadprzeciętne ulepszenia. LITTLE włączone przez ARM DynamiQ platformy technologiczne. Zasadniczo DynamIQ pozwala na większą elastyczność i skalowalność w projektowaniu procesorów wielordzeniowych, umożliwiając projektowanie wielu rdzeni w danym klastrze, a także precyzyjną kontrolę napięcia na rdzeń. (EDYCJA: W odpowiedzi na pytania i odpowiedzi Qualcomm potwierdził, że rdzeń Prime dzieli swoją domenę mocy z klastrem wydajności, ograniczając opisaną tutaj użyteczność). A76 szczególnie dobrze pasuje do tak samotnego rdzenia premium z własnym zegarem, biorąc pod uwagę, że przesuwa granice, jeśli chodzi o jednowątkowy wydajność przy 25% większej liczbie instrukcji całkowitych na zegar w porównaniu do A75 i 35% wyższej wydajności ASIMD i zmiennoprzecinkowej, oferując jednocześnie o 90% wyższą wydajność przepustowość pamięci. Krótko mówiąc, A76 reprezentuje większy wzrost pokoleniowy niż poprzednie generacje, co bez wątpienia przyczyniło się również do wzrostu Qualcomm większy niż zwykle wzrost wydajności Snapdragon 855 rok do roku (dla porównania Qualcomm podał wzrost wydajności o 25 do 30% w przypadku modelu 845 w porównaniu 835). To może wystarczyć, aby wydajność Qualcomm Snapdragon 855 wyprzedziła rdzeń Samsung LSI Mongoose 3 (M3) znajdujący się w Exynos 9810, chociaż ten konkretny projekt ucierpiał z powodu wydajności energetycznej w sposób, jakiego nie mają chipy Qualcomm i że Snapdragon 855 najprawdopodobniej nie będzie albo.

Co to oznacza dla użytkownika końcowego? Oczywiście powinniśmy spodziewać się większej liczby rdzeni testowych — ARM projektuje o 28% wyższe wyniki w Geekbench dla urządzeń mobilnych i o 35% lepszą wydajność JavaScript. Poza wzorcami, które mogą mieć niewielki związek z doświadczeniem użytkownika końcowego, A76 w dalszym ciągu skupia się na A75 trwałe osiągi, co oznacza, że ​​użytkownicy powinni spodziewać się mniejszego dławienia podczas długich sesji grania. Przejście na proces 7 nm w połączeniu z nową konstrukcją rdzenia z pewnością zaowocuje zauważalną baterią ulepszenia życia użytkowników końcowych i to chyba najbardziej atrakcyjna cecha tego zestawu ulepszenia. Nowy rdzeń „Prime” jest również interesujący, biorąc pod uwagę, że samotny rdzeń skupiający się na najwyższej wydajności jednowątkowej mógłby okazują się korzystne we wszystkich aplikacjach i procesach, które nie są skonfigurowane tak, aby można je było właściwie wykorzystać wielowątkowość. Oczywiście proces produkcyjny 7 nm ma dalszy wpływ również na inne bloki Snapdragon 855, zapewniając takie same oszczędności energii do innych jednostek obliczeniowych, które również są zaangażowane w codzienne doświadczenia użytkownika, takie jak przetwarzanie obrazu w przypadku fotografowania smartfonami.


„Snapdragon Elite Gaming Experience” i procesor graficzny Adreno 640

Tym razem Qualcomm Snapdragon 855 w dużym stopniu koncentruje się na grach, co nie jest zaskoczeniem, biorąc pod uwagę popularność tytułów jak Fortnite i PlayerUnknown's Battlegrounds, a także rosnąca popularność mobilnego e-sportu (tak, to jest coś) w Azji. Według danych przedstawionych przez Qualcomm z Raport Newzoo z Globalnego Rynku Gier 2017, gry mobilne wykazują tendencję wzrostową, a oczekiwane całkowite przychody w 2018 r. wyniosą 70,3 miliarda dolarów, co stanowi 51% wszystkich przychodów z gier mobilnych dzięki wzrostowi o 25,5% rok do roku.

Procesor graficzny Adreno 640 zapewnia zdrowe 20% wzrost wydajności grafiki, co dodatkowo zwiększa przewagę Qualcomm nad konkurencją w tym konkretnym obszarze. Dla porównania, Snapdragon 845 przyniósł 30% wzrost w porównaniu ze Snapdragonem 835, który sam w sobie zapewniał również 30% poprawę w porównaniu ze Snapdragonem 821. Mimo to powinno to zapewnić Qualcomm przewagę pod względem wydajności graficznej i, co najważniejsze, wydajności na wat, jeśli uda mu się poprawić również w tym zakresie. Poza tą liczbą Qualcomm jak zawsze skrywa tajemnicę, jeśli chodzi o Adreno: słyszeliśmy o zintegrowanym mikrokontroler do zarządzania energią oraz o tym, jak 640 ma najniższy narzut na sterowniki, chociaż firma wspomniała o tym włączenie 50% więcej jednostek arytmetyczno-logicznych (ALU), które jeszcze bardziej przyspieszyłyby wydajność sztucznej inteligencji.

Jedną z rzeczy, o których Qualcomm dużo mówił na odprawach, jest chęć wprowadzenia „renderowania opartego na fizyce” (PBR) do większej liczby gier mobilnych. PBR to model cieniowania pozwalający na realistyczne renderowanie grafiki, dokładnie modelując przepływ światła zgodnie z materiałem reprezentowanym w teksturach lub teselacji powierzchni. Dzięki temu obiekty w grze prawidłowo naśladują właściwości wizualne materiałów ze świata rzeczywistego, w tym odpowiednie renderowanie mikropowierzchni, takich jak przetarcia i odblaski. Jednak najbardziej zauważalne ulepszenia polegają na tym, że umożliwia dokładniejsze odwzorowanie współczynnika odbicia i połysku wszystkich powierzchni, nawet tych z płaskich i nieprzezroczystych (symulowanych) materiałów.

Qualcomm i twórcy popularnego silnika Unity Engine pracowali nad zwiększeniem dostępności PBR, ale firma współpracuje również z innymi twórcami silników i gier przy optymalizacji gier mobilnych dla Snapdragon urządzenia. Silniki gier, takie jak Unity, Unreal, Messiah i NeoX, są już zoptymalizowane na przykład pod kątem urządzeń Snapdragon, a Snapdragon 855 obsługuje najnowsze interfejsy API grafiki, takie jak nowy Vulkan 1.1. Studia takie jak NetMarble, które stoi za Lineage II: Revolutions, również współpracowały w przeszłości z Qualcomm, aby jak najlepiej zaprezentować mocne strony platformy Snapdragon. Co więcej, z Snapdragona 675, widzieliśmy rozmowy na temat niestandardowego algorytmu, który osiągnął do 90% mniej Jankesów w porównaniu do tej samej platformy bez optymalizacji, a te same zmiany trafiły do ​​Snapdragona 855. Nadal nie jest jasne, na czym polegają te optymalizacje, i nie spodziewamy się, że będą miały zastosowanie w w każdej grze, ale z pewnością będzie to oznaczać lepszą wydajność, przynajmniej w większych tytułach Android.

Co więcej, podczas gdy Snapdragon 835 i 845 umożliwiały odtwarzanie i przechwytywanie (odpowiednio) 10-bitowy, prawdziwy HDR, Qualcomm Snapdragon 855 będzie pierwszym chipsetem mobilnym, który umożliwia prawdziwa gra HDR. Będzie to wymagało wyświetlaczy obsługujących prawdziwy HDR, które na szczęście są coraz powszechniejsze wśród flagowych smartfonów. Z tego powodu użytkownicy mogą oczekiwać bogatszych kolorów, większej głębi tonalnej, wyższego zakresu dynamiki (jak sugeruje nazwa) i lepszego kontrastu. Niekoniecznie jest to funkcja niezbędna, ale z pewnością miło jest mieć taką możliwość w grach HDR konfiguracje wymagają drogich telewizorów i monitorów obsługujących HDR, a także odpowiednich komputerów i określonych gier konsole. Dzięki Qualcomm Snapdragon 855 HDR w grach będzie prawdopodobnie bardziej dostępny i wygodny (oczywiście bez sterowania na ekranie dotykowym).


Nowy procesor DSP Hexagon 690 do obciążeń AI

Chociaż firma w swoich materiałach marketingowych nie nazywa go wyraźnie „jednostką przetwarzania neuronowego”, nowe i udoskonalone procesory DSP Hexagon 690 również skorzystają na obciążeniach AI. Qualcomm po cichu wprowadził te koprocesory wiele pokoleń temu (wraz z właściwym wprowadzeniem QDSP6 v6 obok 820), ale dopiero niedawno zaczęli je przedstawiać jako jedne z lepszych bloków SoC dla sztuczna inteligencja Architektura procesora DSP, pierwotnie zaprojektowana z myślą o przyspieszeniu obciążeń związanych z przetwarzaniem obrazu, w szczególności z uwzględnieniem Hexagon Vector eXtensions (HVX), doskonale nadaje się do zadań ML. Procesor DSP jest bardziej programowalny niż sprzęt o stałych funkcjach, zachowując jednocześnie część wydajności i wydajności korzyści w zakresie wydajności charakteryzujące bloki procesorów specyficzne dla aplikacji, znacznie przyspieszające skalarnie i wektorowo operacje. Okazało się to doskonałe w przypadku stale zmieniających się algorytmów przetwarzania obrazu, które można przenieść do procesora DSP, ale w naturalny sposób nadają się również do obciążeń AI. Hexagon DSP był dobrodziejstwem dla uczenia maszynowego na urządzeniach brzegowych dzięki doskonałej wielowątkowości i przetwarzaniu równoległemu na poziomie sprzętowym, zdolnej do obsługi tysięcy bitów jednostek wektorowych na cykl przetwarzania w porównaniu z setkami bitów przeciętnego rdzenia procesora na cykl i obsługą wielokrotnego odciążania sesje.

Hexagon DSP szczególnie dobrze nadaje się do zadań związanych z obrazowaniem, ponieważ może przesyłać dane bezpośrednio z czujnika obrazu do pamięci lokalnej procesora DSP (pamięć podręczna L2), z pominięciem kontrolera pamięci DDR urządzenia. Na przykład Google wykorzystał przetwarzanie obrazu Hexagon DSP do obsługi algorytmów HDR+ w Pixelu i Pixelu 2, zanim wprowadził własne Rdzeń wizualny pikseli. To także urządzenia obsługujące technologię Hexagon, które uzyskują najlepsze wyniki z popularnych portów aparatu Google, które możesz eksplorować Tutaj. Jest używany w zadaniach związanych z rzeczywistością wirtualną i rozszerzoną, słynąc z zasilania obecnie nieistniejący Projekt Tango na Lenovo Phab2 Pro I ASUS ZenFone AR. To powiedziawszy, większość producentów OEM wdrażających flagowe urządzenia Snapdragon wykorzystuje Hexagon DSP do przetwarzania obrazu w taki czy inny sposób, co można zweryfikować za pomocą narzędzi takich jak Profiler Snapdragona.

Co nowego w nowym DSP? Hexagon 690 podwoił liczbę akceleratorów wektorowych (HVX) z dwóch do czterech, aby współpracować z czterema wątkami skalarnymi, co również poprawiło wydajność o 20%. Co więcej, Hexagon 690 oferuje pierwszy akcelerator tensorowy dla urządzeń mobilnych Akcelerator tensorowy Hexagon (HTA). Jest to znaczący dodatek: służy jako akceleracja sprzętowa dla kosztownego mnożenia macierzy i integruje również funkcje nieliniowe (takie jak sigmoid i ReLU) na poziomie sprzętowym, jeszcze bardziej przyspieszając wnioskowanie. Te zmiany w DSP powinny przełożyć się na lepsza wydajność asystenta głosowego, od wykrywania gorących słów po analizowanie poleceń na urządzeniu, oferując na przykład ulepszone usuwanie echa i tłumienie szumów. Qualcomm podkreśla, że ​​zapewnia kompletną heterogeniczną platformę obliczeniową, która umożliwia wykorzystanie obciążenia AI albo procesor, procesor graficzny lub procesor DSP, albo dowolna kombinacja tych trzech bloków – według słów Gary’ego Brotmana z Qualcomm, to jego „więcej niż jeden rdzeń, to więcej niż sprzęt, to kompletny system”. Ich „Qualcomm AI Engine” czwartej generacji wykracza poza sprzęt, ponieważ zapewnia dostęp do zestawu SDK Snapdragon Neural Processing i Hexagon NN wyżej wymienione bloki, a także Android NN API i popularne frameworki ML, takie jak Caffe/Caffe 2, TensorFlow/Lite i ONNX (Open Neural Network Giełda). Łącznie może zaoferować Snapdragon 855 trzykrotnie większa wydajność sztucznej inteligencji swojego poprzednika (i dwukrotnie w porównaniu do Huawei), pokonując 7 bilionów operacji na sekundę (TOP). Należy jednak pamiętać, że Qualcomm w dalszym ciągu koncentruje się na heterogenicznym rozwiązaniu obliczeniowym, zamiast koncentrować się na jednym dedykowanym bloku.

Aby dowiedzieć się więcej o Hexagon DSP, sprawdź zeszłoroczny kawałek szczegółowo opisując, w jaki sposób pomaga to w przypadku obciążeń AI.


Podsumowując, pakiet obliczeniowy Snapdragona 855 zapewnia jedne z bardziej znaczących ulepszeń rok do roku, które widzieliśmy w ostatnich latach. Spectra 380 ISP-CV, o czym pisaliśmy w osobnym artykule, zapewnia także ogromny wzrost wydajności i efektywności energetycznej, umożliwiając doskonałe nowe funkcje, takie jak nagrywanie wideo 4K 60FPS HDR z tryb portretowy lub zamiana tła (całkiem elastyczna!).

Jak wyjaśniono w tym artykule, te udoskonalenia i nowe funkcje powinny być namacalnie odczuwalne podczas całego doświadczenia użytkownika. Z niecierpliwością czekamy na Qualcomm Snapdragon 855 i wkrótce będziemy mogli go szczegółowo przetestować, więc bądź na bieżąco z programistami XDA, aby uzyskać najnowsze wiadomości i analizy dotyczące Snapdragon 855!