Arm은 Immortalis G720, Mali G720 및 Mali G620을 발표했는데 매우 유망해 보입니다.
Cortex-X4, A720, A520 형태의 Arm의 새로운 2023년 토탈 컴퓨팅 솔루션 출시와 함께 내년도 Arm의 GPU도 살펴보겠습니다. 여기에는 새로운 내용이 포함됩니다. 불멸의 G720, 말리 G720, 말리 G620. 이는 Arm의 5세대 GPU이며 이는 Arm GPU의 새로운 명명 규칙이기도 합니다. 더 이상 "Valhall"이나 "Bifrost"가 없습니다. 바로 "5세대"입니다.
이러한 각 GPU는 이전 제품에 비해 상대적으로 간단한 증분이며, Immortalis G720은 아직 Arm의 최고의 GPU입니다. 코어와 마찬가지로 여기의 GPU는 효율성 향상으로 특히 주목받고 있지만 상당한 성능 향상도 있습니다. Arm이 말했듯이, 고전력 게임에서 소비되는 전력의 3분의 1은 메모리 액세스에서 나오며, 메모리 대역폭 사용량은 최대 40%까지 감소했습니다.
작년에 Immortalis G715가 얼마나 훌륭했는지를 보면 Arm이 GPU 분야에서 실제로 강력한 경쟁자가 되기 시작했다는 것이 분명합니다.
불멸과 말리의 구별
Arm의 새로운 GPU를 살펴보기 전에 Immortalis와 Mali의 차이점을 구별하는 것이 중요합니다. 특히 공유 부품 이름으로 인해 선이 다소 흐려졌기 때문입니다. Arm에 물었을 때 OEM이 칩셋에 Arm GPU를 장착하면 GPU는 Immortalis로 판매된다고 들었습니다. ~ 해야 하다 광선 추적 장치가 있는 반면 Mali G720은 ~할 수 있다 하지만 반드시 그럴 필요는 없습니다.
게다가 Mali G720은 6~9개의 코어를 가질 수 있는 반면, Immortalis G720은 최대 16개의 코어를 가질 수 있습니다. Mali G620의 경우 최대 5개의 코어로 제한되지만 예산 GPU도 훨씬 더 많습니다.
Arm의 Immortalis G720은 역대 최고의 GPU입니다.
Arm의 최신 GPU의 가장 큰 혁명은 DVS(Deferred Vertex Shading)입니다. Arm은 이미 가변율 셰이딩(Variable Rate Shading)과 레이 트레이싱(Ray Tracing) 분야를 선도해 왔으며 개선을 위한 다음 단계는 대역폭과 전력 소비였습니다. 이러한 개선의 결과로 Arm은 와트당 성능이 최대 15% 향상되고 최고 성능도 평균 15% 향상된다고 자랑합니다.
실제 성능에서 Arm은 Immortalis G715에 비해 최대 20% 성능 향상을 측정했으며, 그 중 상당 부분은 DVS의 대역폭 절감에 기인할 수 있습니다. 이러한 대역폭 절감으로 인해 실시간 동적 조명, 블루밍, 피사계 심도, 화면 공간 주변 폐색과 같은 PC 수준 효과를 추가할 수 있습니다. 사실, 이로 인해 Unreal Engine 5의 데스크톱 렌더러가 올해 후반에 Android에 출시될 예정입니다.
지연된 정점 셰이딩은 G720의 "헤드라인 기능"이며 이를 통해 렌더러는 (타일별) 프래그먼트 셰이딩까지 정점 셰이딩을 연기할 수 있습니다. 폴리곤 목록에서는 여전히 순서가 유지되며 G715에 비해 프레임 속도가 평균 15% 증가합니다. 사용자는 중간 정점 데이터를 저장할 필요가 없는 렌더링 파이프라인 덕분에 대역폭 사용량 감소의 이점을 누릴 수 있습니다. 메모리. Arm은 또한 이것이 프레임 시간에 영향을 미치지 않으므로 일관된 게임 경험을 제공할 것이라고 확신했습니다. 이는 GPU에 내장되어 있으므로 개발자는 사용법을 통합하기 위해 아무것도 할 필요가 없습니다.
결과적으로 Arm은 특정 수치를 공유하지 않았지만 이는 광선 추적을 사용할 때 성능에도 도움이 될 것입니다. 이미 Immortalis GPU를 통해 이 분야에서 Arm의 선두를 점하고 있는 점을 감안할 때, 경쟁업체가 크게 도약하지 않는 한 이는 격차를 더 벌릴 가능성이 높습니다. Arm은 또한 이전에 개발자가 GPU에서 2x MSAA를 요청하면 자동으로 4x MSAA로 점프했던 것처럼 2x MSAA 모듈을 추가했습니다.
GPU에서도 다른 개선 사항이 이루어졌지만 규모는 더 작습니다. 명령 스트림 프런트엔드(CSF)는 스트리밍 처리를 위한 추가 작업 레지스터를 통해 일부 개선을 보였으며, 보드 전체의 다른 장치에서는 처리량이 개선되었습니다. CSF는 자체 계산 기능을 사용하여 예약 및 그리기 호출을 처리합니다.
Arm은 작년 GPU와 동일한 전력 제약으로 인해 동일한 양의 전력에 대해 더 효율적인 GPU로 축소되는 더 강력한 GPU를 갖게 될 것이라고 말합니다.
코어와 마찬가지로 GPU 효율성도 중요합니다.
Arm은 올해 효율성이 큰 것으로 보이며 GPU도 마찬가지입니다. 더 나은 성과가 목표가 아니라는 말은 아닙니다. 분명히 그렇듯이(그리고 회사는 여전히 어느 정도 따라잡기 위해 노력하고 있습니다) 효율성은 대부분의 사람들에게 중요합니다. 이번에는 성능 향상의 가능성이 매우 크지만 대부분의 사람들은 아마도 전반적으로 더 나은 배터리 수명을 바랄 것입니다.
그럼에도 불구하고 40%의 대역폭 개선은 과소평가될 수 없으며 평균 프레임 속도의 15% 개선은 비웃을 만한 것이 아닙니다. 앞으로 어떤 칩셋에 이 GPU가 통합될지, 그리고 올해 말 Snapdragon 8 Gen 3와 같은 칩셋에서 곧 출시될 GPU와 어떻게 비교할지 기대됩니다.