* HPE, Arm 및 Marvell과 공동으로 작성한 포스팅입니다.
정확한 자동차 시뮬레이션에 대한 산업 수요는 점점 더 증가하고 있으며 Armv8 아키텍처는 HPC, 데이터 센터 및 클라우드 컴퓨팅 시장에서 x86과 같은 레거시 명령 세트 아키텍처의 대안으로 부상하고 있습니다.
Arm 기반 CPU는 컴퓨팅 집약적인 애플리케이션을 처리할 수 있으며 에너지 효율 및 하드웨어 비용 최적화를 위한 매력적인 선택이 될 수 있습니다.
알테어는 고성능 컴퓨팅(HPC) 부문에서 Arm 프로세서 아키텍처의 잠재력을 잘 이해하기 위해 Altair HyperWorks 솔버를 실행할 때 Arm 기반 프로세서의 성능을 평가하기 위해 Arm, Marvell 및 HPE와의 협업을 시작했습니다.
플랜은 충돌 코드 벤치마크를 실행하여 Marvell® ThunderX2® 프로세서가 있는 HPE Apollo 70 서버 클러스터의 성능을 평가하는 것으로 시작되었습니다.
충돌 시뮬레이션은 가장 까다로운 유형의 수치 애플리케이션 중 하나이며, 알테어의 구조 해석 솔버인 Radioss가 Arm에서 최초로 평가된 알테어 솔버로 선정되었습니다.
이 제품은 소비재, 전자 제품 및 방위를 포함한 영역에 추가 애플리케이션을 사용하여 자동차 충돌과 같은 고도의 비선형 현상을 시뮬레이션 하는 데 사용됩니다.
Radioss로 하는 차량 충돌 시뮬레이션
Radioss와 같은 애플리케이션을 통해 자동차 제조업체는 비용이 많이 드는 물리적 프로토타입을 제작하고 직접 실험하는 대신, 슈퍼컴퓨터에서 가상 차량을 통해 충돌 영향을 모델링하고 시뮬레이션 할 수 있습니다.
시뮬레이션을 통해 제조업체는 시간과 비용을 절약할 수 있으며, 이를 통해 제조업체는 더 많은 설계 옵션을 검토할 수 있으므로 폭넓은 선택과 최적화된 결과를 얻을 수 있습니다.
Radioss는 Arm과 알테어 엔지니어가 협력하여 Arm과 연결된 최초의 상용 애플리케이션 중 하나입니다. 이 코드는 코어가 많이 사용되고 메모리 대역폭이 증가되는 등 최신 프로세서 개선의 이점을 제공하는 고도로 최적화된 코드입니다.
고급 병렬화 방식을 통해 단일 Radioss 시뮬레이션 작업에 사용되는 노드 수를 늘림으로써 해결 시간을 단축할 수 있습니다. 이러한 병렬화 기능은 MPI 라이브러리의 효율적인 구현과 함께 고속 인터커넥트 네트워크를 사용하는 능력에 따라 크게 좌우됩니다.
벤치마킹 및 Catalyst UK 프로그램
Radioss는 64노드 Bristol 클러스터에서 Catalyst UK 프로그램의 일환으로 벤치마킹되었습니다. 이 프로그램은 영국에서 Arm 기반 슈퍼컴퓨터 애플리케이션의 적용을 가속화하고, 향후 아키텍처와 소프트웨어에 대한 연구를 지원하며, HPC를 위한 Arm 소프트웨어 생태계를 확장하기 위해 수립되었습니다.
Catalyst UK Cluster 개요
Catalyst UK 프로젝트는 HPE, Arm, SUSE, Marvell, Mellanox, University of Bristol, University of Leicester 및 University of Edinburgh (EPCC) 간의 협업입니다. 여기에는 전 세계에서 가장 큰 Arm 기반 슈퍼 컴퓨팅 설치 중 하나의 개발 및 사용이 포함되어 있습니다.
이 프로젝트는 2019년에 HPC wire Readers’s Choice Award for Best HPC Collaboration for Academia, Government and Industry를 수상했으며, 2021년까지 연구와 협력을 계속할 예정입니다.
확장성 결과
프로젝트의 HPE Apollo 70 클러스터 벤치마킹 결과에 따르면 Arm Marvell ThunderX2 프로세서에서 실행되는 Radios는 매우 강력한 확장성을 제공하는 것으로 나타났습니다. 이 팀은 여러 MPI 라이브러리 및 설정을 테스트하여 멀티 노드 클러스터에서 몇 가지 산업 사례를 실행함으로써 높은 수준의 효율성을 달성했습니다.
왼쪽의 아래 그림과 같이 천만 요소 차량 충돌 시뮬레이션의 경우 1개 노드(64 코어)에서 48개 노드(3072 코어)까지 강력한 스케일링을 연구합니다. 오른쪽은 Arm에서 얻은 확장성 곡선을 기준 곡선과 비교하여 기준보다 비교 가능하거나 훨씬 우수한 효율성을 제공한다는 것을 보여줍니다.
결과적으로 Arm에서 작동하는 Radioss로 가격 대비 우수한 성능을 기대할 수 있습니다. 고객은 보다 빠르고 효율적으로 설계하는 데 기여하는 시뮬레이션 조건을 기대할 수 있습니다.
이러한 향상된 조건은 생산성과 신뢰성 향상시키고 시장에서 출시 시간을 단축시키는데 기여합니다.
Apollo 70 클러스터에서 Radioss 스케일링
Arm 생태계의 미래
Radioss는 포팅이 완료되고 ThunderX2 기반 플랫폼에서 높은 확장성과 효율성있는 결과를 입증하였기 때문에 차세대 Arm 하드웨어를 사용할 수 있습니다. 여기에는 턴키 구현을 위한 미래의 Marvell ThunderX® 장치 및 SC19에서 발표 된 Fujitsu A64FX 칩과 같은 프로세서가 포함됩니다.
알테어는 파트너와 협력하여 멀티 노드 클러스터의 성능을 추가로 평가합니다. Radioss는 현재 Arm 아키텍처에서 POC (Proof of Concept)로 사용 가능합니다.
원문은 (여기)에서 확인하실 수 있습니다.
감사합니다.
한국알테어