![암(ARM)것두 몰라유? (21.06.04. :: 제 1편)](https://i.ytimg.com/vi/fEimMwdE-9k/hqdefault.jpg)
콘텐츠
- 차세대 성능 20-30 % 향상
- Cortex-A77은 A76 디자인을 기반으로합니다.
- Valhall은 Arm의 GPU에 대한 주요 변경 사항입니다
- Mali-D77은 큰 VR 문제를 해결합니다
- 팔은 기계 학습에 열이 있지만 조용히 유지됩니다.
Arm Tech Day 2019의 브리핑과 Computex 2019의 시작과 함께 Arm은 CPU 및 GPU 라인업에서 두 가지 새로운 주요 항목을 발표했습니다. Arm Cortex-A77은 최고 수준의 CPU 성능을 새로운 차원으로 끌어 올립니다. 한편 Valhall이 Bifrost를 대체함에 따라 새로운 주력 제품인 Mali-G77 GPU는 새로운 그래픽 아키텍처의 시작입니다. 아니요, 오타가 아닙니다. 현대 스칸디나비아 철자법에는 끝에 'a'가 없습니다. 누가 알았 겠어?
모든 세부 사항을 다룬 후에는 Cortex-A77과 Mali-G77에 대한 심도 깊은 다이빙을 확인하십시오. Arm의 최신 공지 사항에서 주요 내용을 파악한 후 바로 찾아 오셨습니다.
차세대 성능 20-30 % 향상
차세대 프로세서는 전력 소비를 늘리지 않고 항상 더 나은 성능과 Arm의 경우를 목표로합니다. 새로운 Cortex-A77은 동일한 처리 노드 및 클럭 속도를 사용할 때 Cortex-A76에 비해 약 20 %의 성능 향상을 목표로합니다. 또한 동일한 파워 엔벨로프와 약간 더 큰 실리콘 면적 크기를 유지하는 동안에도 마찬가지입니다. SoC가 개선 된 7nm 공정으로 전환 할 때 몇 퍼센트 더 개선점을 볼 수 있지만 내년의 약 20 %는 야구장의 향상입니다.
Mali-G77은 성능 향상에 조금 더 적극적입니다. 새로운 GPU 아키텍처는 Mali-G76보다 약 30 % 향상된 성능 에너지 효율과 성능 밀도를 자랑합니다. 제조업체는 성능을 더욱 향상시키기 위해 더 많은 GPU 실리콘을 배치 할 수도 있습니다. Arm은이를 통해 새로운 프로세스 개선을 고려하여 Mali-G77 성능이 G76보다 최대 40 % 더 높을 것으로 예상합니다. Qualcomm Adreno의 모바일 성능이 현재 모바일에서 인식되고 있다는 점을 감안하면 상당히 큰 문제입니다.
Cortex-A77은 A76 디자인을 기반으로합니다.
Arm Cortex-A77은 작년 최고급 Cortex-A76의 직접적인 후속 제품입니다. 우리는 2020 년의 주력 스마트 폰 내에 4 개의 에너지 효율 Cortex-A55와 함께이 새로운 CPU 4 개를 거의 확실하게 보게 될 것입니다.
마이크로 아키텍처의 가장 큰 변화는 분기 예측 캐시와 사이클 당 6 개의 명령을 처리 할 수있는 강화 된 기능입니다. 실행 코어 내에 새로운 ALU 및 분기 장치도 있습니다. 기술적 인 점을 무시하고 이해해야 할 핵심은 Cortex-A77이 더 빠른 처리량을 위해 CPU에 데이터를 더 잘 공급하는 것을 목표로한다는 것입니다. 이는 CPU 하드웨어의 초기 단계에서 병목 현상을 줄이고 코어가 한 번에 처리 할 수있는 실행 수를 늘림으로써 수행됩니다.
넓은 처리량은 이미 Cortex-A76의 게임 이름이며 A77은이 공식을 더욱 향상 시켰습니다. 기술 변경에 대한 자세한 설명은 심층 다이빙에서 찾을 수 있습니다.
Valhall은 Arm의 GPU에 대한 주요 변경 사항입니다
Cortex-A77은 반복적 인 CPU 설계 인 반면 Mali-G77은 Arm의 새로운 GPU 설계를 아우르는 브랜드입니다. Bifrost가 종료되고 Vahall이 시작되어 결과적으로 성능이 최대 40 % 향상 될 수 있습니다.
Mali-G77의 개선의 열쇠는 실행 단위에서 찾을 수 있습니다. Bifrost를 사용하여 각 코어에서 3 개 (Mali-G52의 경우 2 개) 실행 장치를 실행하는 대신 Mali-G77에는 2 개의 강화 처리 장치가 내장 된 새로운 단일 실행 코어가 있습니다. 또한 새로운 Quad Texture Mapper와 성능을 60 % 향상시킬 수있는 기계 학습 워크로드에 대한 전용 지침이 있습니다.
Mali-G77은 7 ~ 16 코어 범위의 코어 구성으로 나타납니다. 각 코어의 크기는 G76과 거의 동일하기 때문에 스마트 폰 디자인은 중간에 떨어질 수 있습니다. 새로운 코어 디자인으로 인해 코어 수만 기준으로 세대 간 성능을 비교하는 것이 더욱 어려워 질 것입니다.
Mali-D77은 큰 VR 문제를 해결합니다
Mali-D77 디스플레이 프로세서는 몇 주 전에 발표되었으므로 핵심 내용을 확인하십시오. Mali-D77은 가상 현실 헤드셋을 위해 특별히 설계되었습니다. 스마트 폰에는 나타나지 않습니다. 그럼에도 불구하고 VR 시장에서 적절한 성능 향상을 가져다 줄 흥미로운 기술입니다.
이 디스플레이 프로세서에는 이미지 재 투영 및 비동기 타임 워프에 대한 하드웨어 지원 기능이있어 움직임 업데이트 대기 시간을 줄이고 멀미를 퇴치 할 수 있습니다. 또한 D77은 GPU 사이클을 수행하지 않고도 렌즈 보정을 수행하고 색수차를 수정하여 프레임 속도를 높이기 위해 GPU 리소스를 최대 15 % 이동시킵니다.
팔은 기계 학습에 열이 있지만 조용히 유지됩니다.
우리는 Arm에 자체 머신 러닝 프로세서가 있다는 것을 알고 있지만 회사는 비밀 소스의 대부분을 감싼다. 우리가 아는 것은 각 머신 러닝 코어가 4TOPS의 처리량을 처리 할 수 있으므로 2 개 또는 3 개의 코어가 Apple A12 범위에있게된다는 것입니다. 이 코어는 FMA (Fused-Fulse Multiple Compute) 연산 장치와 1MB SRAM과 쌍을 이루는 Arm 마이크로 컨트롤러를 기반으로 한 두 번째 범용 코어로 구성됩니다. 그러나이 코어가 성능면에서 Cortex-M0 또는 M7에 더 가까운 지 여부는 밝히지 않았습니다.
최대 32 개의 코어에서 확장 가능한 Arm의 머신 러닝 하드웨어는 초 저전력 애플리케이션 및 전화에서 클라우드 처리에 이르기까지 모든 것을 위해 설계되었습니다. 이 회사는 몇 명의 파트너와 협력하고 있지만 이름을 공개 할 때까지 기다려야합니다.
All-in-all Arm은 저전력 컴퓨팅 공간에서 성능 한계를 지속적으로 추진하고 있습니다. 이 회사는 더 높은 성능을 위해 노력하면서 점점 랩톱 급 성능 시장에 진출하고 있으며 연결된 랩톱은 확실히 로드맵의 일부입니다. 팔의 접근 방식은 단순한 원력에 관한 것이 아닙니다. 이 회사는 프로세서의 이기종 컴퓨팅 기능을 지속적으로 개선하여 신경망 및 기타 컴퓨팅 굶주린 작업을 CPU, GPU, DPU 및 머신 러닝 프로세서에서 효율적으로 실행할 수 있습니다. 말할 필요도없이 내년의 스마트 폰 SoC는 그 어느 때보 다도 더 나아질 것입니다.