Qualcomm이 Snapdragon 855의 성능, 게임 및 AI를 개선한 방법

click fraud protection

새로운 Qualcomm Snapdragon 855 모바일 플랫폼은 성능, 게임 및 AI 측면에서 큰 개선을 가져왔으며, 이를 어떻게 수행했는지 분석합니다.

Qualcomm의 Snapdragon Summit 2018에서 회사는 최신 프리미엄급 플래그십 칩셋인 Snapdragon 855 플랫폼을 발표했습니다.. 이 신제품은 2019년에 출시된 대부분의 주력 제품의 핵심이 될 것이며 Snapdragon X50 모뎀을 통해 놀라운 데이터 속도를 약속합니다. 하지만 그 외에도 Snapdragon 855는 모든 시스템 온 칩 블록에 다음과 같은 다양한 개선 사항을 제공합니다. 일부 컴퓨팅 장치는 최근 전년 대비 최대 성능 및 전력 효율성 개선을 보였습니다. 역사.

Spectra 380 ISP-CV에 대해서는 이미 자세히 설명했습니다.예를 들어, 이는 스마트폰 사진 촬영을 더욱 향상시키는 동시에 사용자에게 배터리 절약 효과를 제공합니다. 우리는 Hexagon DSP와 같은 주변 구성 요소에 점점 더 많은 관심을 기울이고 있지만 매니아들이 가장 많이 지불하는 핵심 블록은 즉, CPU와 GPU에 대한 관심도 아키텍처 개선과 새로운 프로세스로의 전환을 통해 어느 정도 향상되었습니다. 마디. 이 기사에서는 Snapdragon 855의 CPU, GPU 및 DSP에 대한 새로운 내용과 알려진 내용, 그리고 개선 사항과 새로운 기능이 어떤 영향을 미칠 수 있는지 빠르게 요약해 보겠습니다. 당신의 2019년 사용자 경험.


A76 기반 Kryo 485 CPU와 7nm로의 전환

Snapdragon 855는 TSMC의 최신 7nm FinFET 제조 공정으로 이동합니다. 우리는 일반적으로 크기 축소 또는 중간 주기 최적화(예: "저전력 초기"에서 이동)를 통해 1~2년마다 노드 개정을 봅니다. (LPE)에서 Samsung-LSI 노드의 "LPP(Low-Power Plus)"로)이므로 일부 뉴스에서 이러한 측정 항목을 들어보셨을 것입니다. 기사. 그러나 그것은 무엇을 의미합니까? 이러한 맥락에서 이는 프로세서의 트랜지스터 기능의 크기를 설명하며, 이는 결국 각 새로운 세대에서 어떤 종류의 트랜지스터 밀도 향상을 기대할 수 있는지에 대한 단서를 제공합니다. 단위 면적당 더 많은 트랜지스터를 사용하면 결과적으로 프로세서의 성능을 확장할 수 있습니다. 이 기능은 더 작은 프로세스 노드를 통해 프로세서 설계를 더 작은 규모로 구현할 수 있으므로 중요합니다. 프로세서 요소 사이의 공간을 줄여 결과적으로 전자가 이동해야 하는 거리를 단축합니다. 계산. 이는 성능 향상을 가져오고 더 작은 프로세스의 정전 용량도 더 낮습니다. 즉, 트랜지스터가 더 낮은 대기 시간과 더 낮은 에너지로 켜지고 꺼질 수 있다는 의미입니다. 참고로 TSMC는 7nm 공정으로의 전환이 달성된다고 주장합니다.

성능 및 전력 효율성은 각각 20% 및 40%입니다., 하지만 이는 TSMC의 자체 10nm FinFET 공정과 비교됩니다..

지난 몇 가지 Snapdragon 플래그십 칩셋의 경우 Qualcomm이 삼성과 협력하여 14nm 및 10nm LPP/LPE 프로세스를 구현하는 것을 보았습니다. 그러나 Snapdragon 855를 TSMC의 7nm로 전환한 것은 예상치 못한 일이 아닙니다. 삼성의 7nm 공정이 10월부터 양산에 돌입하지만 당시에는 5G 퀄컴 칩셋이 탑재될 것이라는 보도가 있었습니다. 또한, 삼성의 7LPP 디자인은 극자외선 리소그래피(EUVL)로 알려진 개선된 리소그래피 기술을 바탕으로 제작되었습니다. 10nm FinFET에 비해 20% 더 빠른 속도 또는 50% 더 적은 전력 소비로 동일한 설계 복잡성으로 40% 면적 감소 전임자. 더 작은 프로세스 노드로의 각각의 새로운 도약은 달성하기 매우 어렵기 때문에 정확하게 축하됩니다. 예를 들어, 트랜지스터가 작아질수록 더 많은 '누설'이 발생하거나 '오프'된 트랜지스터를 통해 흐르는 전류가 증가하여 유휴 상태에서 정적 전력 소비가 증가할 수 있습니다. 더 조밀한 트랜지스터 수를 갖춘 더 작은 칩을 사용하면 주어진 실리콘 웨이퍼를 최대한 활용할 수 있지만 수율은 낮아지는 경향이 있습니다. 앞서 언급한 누출로 인해 (높은) 기준에서 실행되는 '더 높은 비닝' 프로세서를 얻기가 어렵습니다. 주파수. 이것들은 단지 일부 물론 새로운 프로세스 노드가 대량 생산에 들어갈 때까지 해결되는 많은 개발 장애물 중 하나입니다. 간단히 말해서, 새로운 프로세스 크기를 도입하는 데 비용을 추가하는 많은 R&D 및 제조 문제가 있습니다. 시장.

Kryo 485용으로 라이센스된 최신 ARM A76 아키텍처는 Qualcomm Snapdragon 855에서 볼 수 있는 전년 대비 상당한 개선에 큰 기여를 했습니다. A76 코어는 ARM 오스틴 사무실의 새로운 빈 슬레이트 디자인으로, ARM이 "노트북급 성능"이라고 부르는 것을 제공하기 위해 처음부터 새로 구축된 새로운 마이크로 아키텍처를 특징으로 합니다. 모바일 효율성." 아직은 반맞춤형 설계이며, Qualcomm은 더 나은 효율성을 위해 최적화된 데이터 프리페칭, 더 큰 규모의 비순차적 실행 등 개선을 이루어냈습니다. 창문. 이 새로운 디자인은 Snapdragon 845의 골드 코어를 기반으로 한 A75에 비해 엄청난 성능 향상을 제공합니다. 성능 35% 향상, 전력 효율성 40% 향상. 동일한 전력 엔벨로프에서 10nm 프로세스의 A75와 7nm 프로세스의 A76을 비교할 때 750mW/코어, 성능 이점은 새 코어에 유리하게 40%까지 증가하고 에너지 절감 효과도 높아질 수 있습니다. 50%로. 또한 ASIMD(Asymmetric Single Instruction Multiple Data) 파이프라인의 기타 개선 사항과 내적 지침 컨볼루셔널 신경망의 추론과 같은 기계 학습 작업의 성능이 최대 3.9배 향상됩니다. 이 모든 것은 업계 최고의 영역당 성능에 해당하며 새로운 7nm 프로세스를 크게 보완합니다. Qualcomm의 2.84GHz '프라임 코어'는 3GHz 기준 클럭 속도 ARM에 가까워지고 있습니다. 사용했었다 새로운 코어를 자세히 설명할 때. 대체로, Qualcomm은 45%의 엄청난 CPU 성능 향상을 약속합니다. 845에 비해 전년 대비 최대 증가폭을 기록했습니다.

Snapdragon 855의 '프라임 코어'에 관해 말하면, Qualcomm이 크게 개선된 이 새로운 클러스터 설정을 사용하는 것도 놀라운 일이 아닙니다. ARM에 의해 활성화된 LITTLE 다이나믹IQ 기술 플랫폼. 본질적으로 DynamIQ는 멀티 코어 프로세서 설계에 더 많은 유연성과 확장성을 제공하여 특정 클러스터에서 다중 코어 설계가 가능하고 코어당 전압을 세밀하게 제어할 수 있습니다. (편집: Q&A에서 Qualcomm은 Prime 코어가 성능 클러스터와 전력 도메인을 공유하여 여기에 설명된 유틸리티를 제한한다는 것을 확인했습니다.) A76은 단일 스레드의 한계를 뛰어넘는 자체 시계를 갖춘 단일 프리미엄 코어에 특히 적합합니다. A75보다 25% 더 높은 클럭당 정수 명령, 35% 더 높은 ASIMD 및 부동 소수점 성능, 90% 더 높은 성능을 제공합니다. 메모리 대역폭. 간단히 말해서, A76은 이전 세대보다 더 큰 세대적 향상을 제공하며, 이는 의심할 여지 없이 Qualcomm의 Snapdragon 855의 전년 대비 성능 향상(참고로 Qualcomm은 845가 25~30% 향상되었다고 언급함) 835). 이는 Qualcomm Snapdragon 855의 결과 성능이 Exynos 9810에 있는 Samsung LSI의 Mongoose 3(M3) 코어보다 앞서기에 충분할 수 있습니다. 특정 디자인은 Qualcomm 칩과 달리 전력 효율성으로 인해 어려움을 겪었으며 Snapdragon 855는 그렇지 않을 가능성이 높습니다. 어느 하나.

최종 사용자에게 이는 무엇을 의미합니까? 물론 벤치마크 코어의 증가를 기대해야 합니다. ARM은 모바일용 Geekbench 점수가 28% 더 높고 Javascript 성능이 35% 향상될 것으로 예상합니다. 최종 사용자 경험과 거의 관련이 없을 수 있는 벤치마크를 넘어 A76은 A75의 초점을 계속해서 유지합니다. 지속적인 성과이는 사용자가 장시간 게임 세션 동안 제한이 덜할 것으로 예상해야 함을 의미합니다. 새로운 코어 설계와 결합된 7nm로의 전환은 확실히 눈에 띄는 배터리 성능을 가져올 것입니다. 최종 사용자의 삶을 개선하며 이는 아마도 이 세트의 가장 매력적인 기능일 것입니다. 업그레이드. 최고의 단일 스레드 성능에 초점을 맞춘 단일 코어가 적절한 이점을 활용하도록 설정되지 않은 응용 프로그램 및 프로세스 전반에 걸쳐 유익한 것으로 입증되었습니다. 멀티스레딩. 물론 7nm 제조 공정은 Snapdragon 855의 다른 블록에도 영향을 미쳐 동일한 절전 효과를 제공합니다. 스마트폰 사진을 위한 이미지 처리와 같이 일상적인 사용자 경험에도 관여하는 다른 컴퓨팅 유닛에 적용됩니다.


'스냅드래곤 엘리트 게이밍 경험'과 Adreno 640 GPU

Qualcomm Snapdragon 855는 이번에 게임에 중점을 두고 있으며, 타이틀의 인기를 고려하면 놀라운 일이 아닙니다. Fortnite 및 PlayerUnknown's Battlegrounds와 같이 아시아에서 모바일 e스포츠의 인기가 높아지고 있습니다(예, 이게 사실입니다). 퀄컴이 공개한 수치에 따르면 Newzoo 2017 글로벌 게임 시장 보고서모바일 게임은 2018년 총 매출 703억 달러로 전년 대비 25.5% 증가해 전체 게임 매출의 51%를 차지할 것으로 예상되며 상승세를 보이고 있습니다.

Adreno 640 GPU는 건강한 그래픽 성능 20% 향상, 이는 이 특정 분야의 경쟁에서 Qualcomm의 우위를 더욱 강화합니다. 참고로 Snapdragon 845는 Snapdragon 835에 비해 30% 향상되었으며 Snapdragon 821에 비해 30% 향상된 성능을 제공했습니다. 그럼에도 불구하고 이는 Qualcomm이 그래픽 성능에서 앞서게 해야 하며, 가장 중요하게는 와트당 성능도 향상된다면 와트당 성능이 향상될 것입니다. 그 수치 외에도 Qualcomm은 Adreno에 관해서는 그 어느 때보 다 비밀 스럽습니다. 전력 관리를 위한 마이크로 컨트롤러와 640의 드라이버 오버헤드가 가장 낮은 이유에 대해 설명했습니다. 포함 50% 더 많은 산술 논리 장치 (ALU)는 AI 성능을 더욱 가속화합니다.

Qualcomm이 브리핑에서 많은 시간을 들여 이야기한 것 중 하나는 '물리 기반 렌더링'(PBR)을 더 많은 모바일 게임 경험에 도입하려는 열망입니다. PBR은 사실적인 그래픽 렌더링을 허용하고 텍스처로 표현된 재료나 표면 테셀레이션에 따라 빛의 흐름을 정확하게 모델링할 수 있는 셰이딩 모델입니다. 이를 통해 게임 내 개체가 마모 및 반사 하이라이트와 같은 미세 표면의 적절한 렌더링을 포함하여 실제 재료의 시각적 특성을 적절하게 모방할 수 있습니다. 그러나 가장 눈에 띄는 개선 사항은 평면 및 불투명(시뮬레이션) 재질의 표면을 포함하여 모든 표면의 반사율과 광택을 보다 정확하게 묘사할 수 있다는 점입니다.

Qualcomm과 인기 있는 Unity 엔진 개발자들은 PBR의 접근성을 높이기 위해 노력해 왔습니다. 하지만 회사는 또한 Snapdragon용 모바일 게임을 최적화하기 위해 다른 엔진 및 게임 개발자와 협력하고 있습니다. 장치. 예를 들어 Unity, Unreal, Messiah 및 NeoX와 같은 게임 엔진은 이미 Snapdragon 장치에 최적화되어 있으며 Snapdragon 855는 새로운 그래픽 API를 지원합니다. 불칸 1.1. Lineage II: Revolutions를 제작한 NetMarble과 같은 스튜디오도 과거 Qualcomm과 협력하여 Snapdragon 플랫폼의 강점을 가장 잘 보여주었습니다. 더욱이, 금어초 675, 우리는 다음을 달성한 맞춤형 알고리즘에 대한 이야기를 보았습니다. 버벅거림 90% 감소 동일한 플랫폼에 비해 최적화가 이루어지지 않았으며 Snapdragon 855에도 동일한 변경 사항이 적용되었습니다. 이러한 최적화가 무엇을 수반하는지 아직 명확하지 않으며, 이러한 최적화가 다음 분야에 적용될 것으로 기대하지 않습니다. 하지만 이는 확실히 더 큰 게임에서 더 나은 성능을 의미할 것입니다. 기계적 인조 인간.

무엇보다도 Snapdragon 835와 845는 각각의 재생 및 캡처를 허용했습니다. 10비트, 진정한 HDR 비디오인 Qualcomm Snapdragon 855는 다음을 허용하는 최초의 모바일 칩셋이 될 것입니다. 진정한 HDR 게이밍. 이를 위해서는 진정한 HDR 지원 디스플레이가 필요하며, 다행히도 플래그십 스마트폰에서 점점 더 보편화되고 있습니다. 이로 인해 사용자는 더 깊은 색조 깊이, 더 높은 동적 범위(이름에서 알 수 있듯이) 및 향상된 대비로 더 풍부한 색상을 기대할 수 있습니다. 이것이 꼭 필요한 기능은 아니지만 현재 HDR 게임에 이러한 기능을 제공한다는 것은 확실히 좋은 일입니다. 설정에는 고가의 HDR 지원 TV와 모니터는 물론 성능이 뛰어난 컴퓨터와 특정 게임이 필요합니다. 콘솔. Qualcomm Snapdragon 855를 사용하면 게임에서의 HDR이 더 쉽게 접근하고 편리해질 것입니다(물론 터치스크린 컨트롤은 제외).


AI 워크로드를 위한 새로운 Hexagon 690 DSP

회사는 마케팅 자료에서 이를 "신경 처리 장치"라고 명시적으로 부르지 않지만 AI 워크로드도 새롭게 개선된 Hexagon 690 DSP의 이점을 누릴 수 있습니다. Qualcomm은 여러 세대 전에 조용히 이러한 보조 프로세서를 도입했습니다(QDSP6 v6의 적절한 도입으로). 820과 함께) 그러나 최근까지 그들은 더 나은 SoC 블록 중 하나로 소개하기 시작했습니다. 일체 포함. 원래 이미징 워크로드를 가속화하기 위해 설계된 DSP 아키텍처는 특히 HVX(Hexagon Vector eXtensions)를 포함하여 ML 작업에 매우 적합했습니다. DSP는 고정 기능 하드웨어보다 프로그래밍이 가능하면서도 일부 성능과 성능을 그대로 유지합니다. 애플리케이션별 프로세서 블록을 특성화하여 스칼라 및 벡터를 크게 가속화하는 효율성 이점 운영. 이는 DSP로 오프로드할 수 있을 뿐만 아니라 자연스럽게 AI 워크로드에도 적합한 끊임없이 변화하는 이미지 처리 알고리즘에 탁월한 것으로 입증되었습니다. Hexagon DSP는 머신러닝에 도움이 된다 수천 비트의 데이터를 처리할 수 있는 우수한 하드웨어 수준의 멀티스레딩 및 병렬 컴퓨팅 덕분에 엣지 장치에서 평균 CPU 코어의 사이클당 수백 비트와 비교하여 처리 사이클당 벡터 단위 수 및 다중 오프로드 서비스 제공 세션.

Hexagon DSP는 장치의 DDR 메모리 컨트롤러를 우회하여 이미징 센서에서 DSP의 로컬 메모리(L2 캐시)로 직접 데이터를 스트리밍할 수 있으므로 이미징 작업에 특히 적합합니다. 예를 들어 Google은 자체 기술을 도입하기 전에 Hexagon DSP의 이미지 처리를 사용하여 Pixel 및 Pixel 2의 HDR+ 알고리즘을 구동했습니다. 픽셀 비주얼 코어. 또한 탐색할 수 있는 인기 있는 Google 카메라 포트에서 최상의 결과를 볼 수 있는 Hexagon 지원 장치이기도 합니다. 여기. 가상 및 증강 현실 워크로드에 사용되었으며, 지금은 없어진 프로젝트 탱고 레노버 Phab 2 프로 그리고 에이수스 젠폰 AR. 즉, Snapdragon 플래그십 장치를 구현하는 대부분의 OEM은 어떤 방식으로든 이미지 처리를 위해 Hexagon DSP를 활용합니다. 이는 다음과 같은 도구를 사용하여 확인할 수 있습니다. 스냅드래곤 프로파일러.

그렇다면 새로운 DSP의 새로운 점은 무엇입니까? Hexagon 690은 4개의 스칼라 스레드와 함께 작동하기 위해 벡터 가속기(HVX) 수를 2개에서 4개로 두 배 늘려 성능도 20% 향상되었습니다. 또한 Hexagon 690은 모바일용 최초의 텐서 가속기를 제공합니다. 육각형 텐서 가속기(HTA). 이는 중요한 추가 사항입니다. 값비싼 행렬 곱셈을 위한 하드웨어 가속 역할을 하며, 또한 하드웨어 수준에서 비선형 기능(예: Sigmoid 및 ReLU)을 통합하여 속도를 더욱 향상시킵니다. 추론. DSP에 대한 이러한 변경 사항은 다음과 같이 해석되어야 합니다. 더 나은 음성 어시스턴트 성능, 핫워드 감지부터 장치 내 명령 구문 분석에 이르기까지 개선된 반향 제거 및 잡음 억제 기능을 제공합니다. Qualcomm은 AI 워크로드를 활용할 수 있는 완전한 이기종 컴퓨팅 플랫폼을 제공한다고 강조합니다. Qualcomm의 Gary Brotman에 따르면 CPU, GPU, DSP 또는 세 블록의 조합입니다. 그것은 "하나 이상의 코어, 하드웨어 그 이상, 완전한 시스템입니다.". 4세대 "Qualcomm AI 엔진"은 하드웨어를 뛰어넘어 Snapdragon 신경 처리 SDK 및 Hexagon NN에 대한 지원도 제공합니다. 앞서 언급한 블록과 Android NN API, Caffe/Caffe 2, TensorFlow/Lite, ONNX(Open Neural Network)와 같은 널리 사용되는 ML 프레임워크를 포함합니다. 교환). 전체적으로 Snapdragon 855는 다음을 제공할 수 있습니다. 원시 AI 성능의 3배 이전 제품보다 (화웨이에 비해 두 배), 1위를 차지했습니다. 초당 7조 작업(TOP). 그러나 Qualcomm은 단일 전용 블록에 초점을 맞추는 것보다 이기종 컴퓨팅 솔루션에 계속 초점을 맞추고 있다는 점을 명심하십시오.

Hexagon DSP에 대해 자세히 알아보려면 다음을 확인하세요. 작년 작품 AI 워크로드에 어떻게 도움이 되는지 자세히 설명합니다.


요약하자면, Snapdragon 855의 컴퓨팅 패키지는 최근 몇 년간 우리가 보아온 전년 대비 더욱 영향력 있는 개선 사항을 제공합니다. 스펙트럼 380 ISP-CV, 이에 대해서는 별도의 기사에서 다루었습니다., 또한 성능과 전력 효율성을 대폭 향상시켜 4K 60FPS HDR 비디오 녹화와 같은 뛰어난 새로운 기능을 가능하게 합니다. ~와 함께 세로 모드 또는 배경 교체(매우 유연함!)

이 기사에서 설명했듯이 이러한 발전과 새로운 기능은 사용자 경험 전반에 걸쳐 눈에 띄게 느껴져야 합니다. 우리는 Qualcomm Snapdragon 855를 기대하고 있으며 곧 심층적으로 테스트할 예정이므로 최신 Snapdragon 855 뉴스 및 분석을 위해 XDA-Developers를 계속 지켜봐 주시기 바랍니다!