ARM, 새로운 "Valhall" GPU 아키텍처와 1.4배 성능 향상을 갖춘 Mali-G77 GPU 발표

ARM이 Mali-G77 GPU를 발표했습니다. 2016년에 출시된 Bifrost 아키텍처를 계승하는 새로운 Valhall 아키텍처를 제공합니다.

ARM은 연례 TechDay에서 Cortex-A77 CPU와 함께 Mali-G77 GPU를 발표했습니다. Cortex-A77은 이전 제품인 Cortex-A76에 비해 세대적으로 크게 발전한 반면, Mali-G77 GPU는 완전히 다릅니다. 2016년 Bifrost 아키텍처를 도입한 Mali-G71 이후 새로운 GPU 아키텍처를 도입하는 ARM Mali 라인업의 첫 번째 GPU입니다. Mali-G77은 새로운 "Valhall" 아키텍처를 제공합니다.

ARM의 CPU IP는 역사적으로 더 넓은 스마트폰 환경에서 상당히 경쟁력이 있었지만, 회사의 Mali GPU 라인업은 동급 최고의 솔루션과 경쟁하기 위해 고군분투해 왔습니다. 연령. Mali GPU 시리즈는 성능과 전력 효율성 측면에서 Adreno 및 Imagination Technologies의 PowerVR GPU보다 열등한 것으로 거듭 입증되었습니다. Bifrost 아키텍처는 Midgard 아키텍처를 계승하여 벡터 유형에서 스칼라 유형으로 전환되었습니다. 안타깝게도 점점 더 커져가는 것처럼 보이는 성능 및 전력 효율성 격차를 극복하는 결과는 나오지 않았습니다. Mali-G71과 Mali-G72는 지나치게 높은 전력 소모와 스로틀링 문제를 겪었다. Qualcomm의 Adreno GPU 및 Apple의 맞춤형 GPU(Apple부터 시작)보다 열등하게 만들었습니다. A11).

열악한 GPU 성능은 벤더들이 한 세대 후에 GPU가 약간 향상될 것이라는 전망을 무시할 만큼 심각한 문제가 되었습니다. 그만큼 엑시노스 9810예를 들어 Mali-G72MP18 GPU는 이전 제품보다 약간 개선되었습니다. Huawei의 HiSilicon Group은 Mali GPU로 인해 훨씬 ​​더 큰 어려움을 겪었습니다. 하이실리콘 기린 960 그리고 기린 970 상대적으로 적은 양의 전력을 제공하는 동시에 비정상적으로 많은 양의 전력을 소비하는 GPU로 인해 실망했습니다. Huawei가 비 전통적인 제한 메커니즘을 도입해야 할 정도로 성능이 향상되었습니다. 이로 인해

벤치마크 부정행위가 발견되었습니다 작년에 여러 개의 Huawei 휴대폰에 대해.

작년의 Mali-G76은 고맙게도 성능과 전력 효율성 측면 모두에서 상당한 개선을 제공했습니다. Mali-G76의 10코어 버전을 사용하여 HiSilicon은 46%의 성능 향상을 약속할 수 있었고 회사가 해당 성능 수치를 달성했음에도 불구하고 여전히 GPU 성능(최고 성능과 지속 성능 모두)을 감당하지 못했습니다. 전력 효율 크라운도 마찬가지입니다. 삼성시스템 LSI는 엑시노스 9820에 12코어 GPU 버전을 구현했으며, 결국 격차는 줄어들었다 ~로 퀄컴 스냅드래곤 855의 Adreno 640 GPU. Qualcomm의 Adreno GPU는 Android 시장에서 여전히 선두 자리를 유지하고 있지만 Apple은 작년에 Apple A12의 맞춤형 GPU로 한 단계 더 발전했습니다. Apple은 최대 성능과 지속 성능 측면에서 모두 Qualcomm을 이길 수 있었고, 회사는 경쟁력 있는 전력 효율성도 선보였습니다. 현재 A12의 GPU는 여전히 선두를 달리고 있으며 Snapdragon 855의 Adreno 640 GPU는 대부분의 벤치마크에서 2위를 차지하고 있습니다.

이러한 경쟁 환경에 직면하여 ARM은 도전에 맞서기 위해 한 발 더 나서야 했습니다.

그 결과 Mali-G77과 새로운 Valhall 아키텍처가 탄생했습니다. ARM은 성능 밀도 30% 증가, 에너지 효율성 30% 향상, 머신러닝(ML) 60% 향상을 제공한다고 밝혔습니다. ARM은 Mali-G77 기반이 모바일 기기에서 40% 향상된 최대 그래픽 성능을 제공할 것으로 기대하고 있습니다.

회사는 Mali-G77이 휴대폰에 더 많은 고급 게임을 제공할 것으로 기대하고 있으며 2018년은 모바일 게임 매출이 처음으로 콘솔 및 PC 기반 게임 매출을 앞지른 해 시간.

ML과 관련하여 ARM은 Mali-G77이 60% 성능 밀도 향상을 통해 장치에서 "점점 더 복잡한" ML 작업을 더 빠르게 수행할 수 있는 기능을 장치에 제공한다고 밝혔습니다. 이는 처리를 위해 클라우드로 보내는 것보다 낫기 때문에 보안 문제가 더 커지고 성능이 저하되며 대기 시간이 길어집니다.

새로운 Valhall 아키텍처는 Mali-G77과 향후 Mali GPU의 기반입니다. ARM은 Valhall의 다음 기능이 이를 "새로운 아키텍처"로 만든다고 말합니다.

  • "에너지 효율성과 성능 밀도를 한 단계 더 도약시키는 새로운 슈퍼스칼라 엔진
  • 더욱 컴파일러 친화적인 새로운 명령어 세트를 갖춘 단순화된 스칼라 ISA
  • 새로운 동적 명령어 스케줄링
  • 재작업된 데이터 구조는 Vulkan과 같은 최신 API에 더 잘 맞춰졌습니다.
  • 다양한 발전과 새로운 기능이 있지만 두 가지 핵심은 Mali-G77의 실행 엔진과 텍스처 매퍼입니다."

ARM에 따르면 Mali-G77의 광범위한 실행 엔진은 광범위한 레인에 대한 제어를 공유함으로써 성능 밀도를 향상시킵니다. Mali-G76에는 8개의 넓은 워프와 셰이더 코어당 총 24개의 FMA 레인이 있는 반면, Mali-G77에는 16개의 넓은 워프, 32개의 레인(실행 엔진당 16FMA의 2개 클러스터) 및 셰이더 코어당 엔진 1개가 있습니다. 회사에 따르면 이는 G76에 비해 동일한 영역에서 33% 더 많은 컴퓨팅 성능을 제공합니다.

ARM은 또한 Mali-G77의 향상된 게이밍 성능이 쿼드 텍스처 매퍼와 연결되어 있다고 밝혔습니다. 이는 4개의 텍셀/사이클을 제공합니다. 이는 Mali-G76보다 2배, Mali-G76보다 4배 더 높은 처리량입니다. G72. 고화질 및 캐주얼 게임 전반에 걸쳐 개선을 제공한다고 알려져 있지만 특히 텍스처가 많은 게임에 큰 영향을 미칠 것입니다. ARM에 따르면 G77의 컴퓨팅 성능이 향상되었으므로 기계 균형을 유지하기 위해 텍스처 성능도 향상되어야 했습니다. 최종 목표는? 이전보다 평방밀리미터당 더 많은 성능을 제공합니다.

Mali-G77은 새로운 16폭 실행 엔진과 쿼드 텍스처 매퍼에 맞게 최적화되었습니다. 이 최적화에는 성능 밀도와 에너지 효율성에 초점을 맞춘 LSC 및 속성 파이프의 재설계가 포함됩니다.

ARM은 에너지 효율성 향상에 '상당한 초점'을 맞추고 있으며 Mali-G77이 2년 전보다 Mali-G72의 에너지의 50%로 동일한 작업을 수행할 수 있다고 홍보합니다. 회사에 따르면 Valhall 아키텍처와 Mali-G77은 모든 작업 부하에서 에너지 효율성을 높여 "다양한 콘텐츠" 전반에 걸쳐 1.3배 개선되어 사용자가 프리미엄으로 더 긴 배터리 수명을 누릴 수 있음을 의미합니다. 장치.

ARM은 더 나은 성능을 제공하기 위해 동적 명령어 스케줄링이 이제 하드웨어에서 처리된다고 말합니다. 동적 스케줄러는 어떤 워프에서 어떤 명령을 실행할지 결정하고 작업은 수퍼스칼라 스타일로 독립적인 병렬 ALU에 발행됩니다.

마지막으로 ARM은 Valhall 아키텍처가 AFBC 1.3을 통해 ARM 프레임 버퍼 압축의 발전을 계속하고 있다고 지적합니다. ARM 블로그 게시물에서 읽을 수 있는 몇 가지 새로운 기능이 제공됩니다.

ARM은 Mali-G77에 대해 몇 가지 큰 약속을 하고 있으며 복잡한 AR 및 ML에서 상당한 성능 향상을 가져올 것이라고 선언했습니다. "타협할 수 없는 그래픽 성능과 향상된 효율성"을 제공합니다. 주장이 실현되면 마침내 ARM Mali GPU가 출시되는 것을 볼 수 있습니다. 특정 세대의 Adreno GPU와 직접 대결하거나 더 나은 성능을 발휘할 수 있으며 모바일 GPU 시장은 훨씬 더 커질 것입니다. 경쟁력 있는.

원천:

을 통해: 아난드테크