AMD, HPC용 GPU ‘AMD 인스팅트 MI100’ 발표
AMD, HPC용 GPU ‘AMD 인스팅트 MI100’ 발표
  • 최종엽 기자
  • 승인 2020.11.18 08:16
  • 댓글 0
이 기사를 공유합니다

x86 서버 GPU 최초로 10테라플롭스 이상 성능 지원, 엑사스케일 시대에 다양한 연구 활동 지원 설계
AMD 인스팅트 MI100 GPU와 에픽 프로세서
AMD 인스팅트 MI100 GPU와 에픽 프로세서

[디지털경제뉴스 최종엽 기자] AMD가 x86 서버 GPU 최초로 10테라플롭스 이상의 성능을 지원하는 고성능 컴퓨팅(HPC)용 GPU ‘AMD 인스팅트 MI100(AMD Instinct MI100)’을 발표했다.

AMD 인스팅트 MI1000은 올해 말부터 델, HPE, 기가바이트, 슈퍼마이크로 등 주요 OEM 및 ODM 파트너사들을 통해 출시될 예정이다:

새로운 AMD CDNA 아키텍처 기반의 AMD 인스팅트 MI100 GPU는 AMD 에픽 프로세서와 함께 HPC 및 AI 기술 발전을 위한 새로운 수준의 가속 시스템을 지원한다.

MI100은 HPC에서 최대 11.5 테라플롭스의 최대 FP64 성능을, AI 및 머신 러닝 워크로드에서는 최대 46.1 테라플롭스의 최대 FP32 매트릭스(Matrix) 성능을 지원한다.

새로운 AMD 매트릭스 코어(AMD Matrix Core) 기술을 통해 AI 트레이닝 워크로드에서 전작 대비 7배 향상된 FP16 최대 이론 부동소수점 성능(theoretical peak floating point performance)을 지원한다.

MI100은 최대 2배 높은 PCIe 4.0 이상의 P2P I/O 대역폭과 GPU당 초당 최대 340GB의 통합 대역폭을 지원하는 AMD 인피니티 패브릭 링크(Links)를 제공한다. 서버 내에서 MI100 GPU는 최대 두 개의 연결된 쿼드 GPU 하이브(hive)를 구성할 수 있으며, 초당 552GB의 P2P I/O 대역폭으로 빠른 데이터 공유를 지원한다.

32GB의 고대역폭 HBM2 메모리를 통해 1.2GHz의 클럭 속도와 초당 1.23GB의 초고대역 메모리 대역폭으로 대용량의 데이터를 지원하고, 메모리에 데이터를 저장하고 추출하는 과정에서 발생하는 병목현상을 해결하는 데 도움을 준다. 최신 PCIe 4.0 기술이 적용되어 CPU와 GPU 간 초당 최대 64GB의 최고 이론 데이터 전송 대역폭을 지원한다.

AMD ROCm 개발자 소프트웨어는 엑사스케일 컴퓨팅을 위한 기반을 제공한다. ROCm은 컴파일러, 프로그래밍 API 및 라이브러리로 구성된 오픈소스 툴셋으로, 엑사스케일 소프트웨어 개발자들의 고성능 애플리케이션 개발을 돕는다.

또한, ROCm 4.0은 MI100 기반 시스템의 규모에 맞게 최적화됐으며, 컴파일러를 오픈소스로 업그레이드하고 OpenMP와 HIP를 모두 지원하도록 통합했다.

ROCm 4.0에 맞추어 최적화된 파이토치 및 텐서플로우 프레임워크는 MI100를 통해 더 높은 성능을 제공할 수 있게 됐으며, ROCm 4.0은 HPC, ML 및 AI 애플리케이션 개발자들이 뛰어난 성능의 휴대용 소프트웨어를 개발할 수 있도록 지원하게 됐다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.