[엔비디아 GTC 2020] 엔비디아, ‘DGX A100’, '자비스', '멜라녹스 ConnectX-6 Lx' 발표
[엔비디아 GTC 2020] 엔비디아, ‘DGX A100’, '자비스', '멜라녹스 ConnectX-6 Lx' 발표
  • 박시현 기자
  • 승인 2020.05.17 11:14
  • 댓글 0
이 기사를 공유합니다

[디지털경제뉴스 박시현 기자] 엔비디아는 온라인으로 열린 ‘GTC 2020’의 둘째 날(한국시간 15일)에 ▲DGX A100 ▲자비스 ▲멜라녹스 ConnectX-6 Lx 등을 발표했다.

엔비디아 DGX A100 = 엔비디아 DGX A100은 인공지능(AI) 시스템인 엔비디아 DGX의 3세대 제품이다. 데이터 분석부터 훈련, 추론에 이르는 엔드-투-엔드 머신러닝 워크플로우를 위해 구축된 AI 시스템이다.

엔비디아 DGX A100
엔비디아 DGX A100

DGX A100 시스템은 엔비디아 A100 텐서 코어(Tensor Core) GPU 8개를 통합해 최대 규모의 AI 데이터세트 훈련시킬 수 있는 320GB 메모리와 200Gb의 속도를 구현하는 멜라녹스(Mellanox)의 최신 HDR 상호연결 솔루션을 제공한다.

또한, A100 멀티 인스턴스 GPU 기능을 사용해 DGX A100을 시스템 당 최대 56개의 인스턴스로 분할해 여러 개의 작은 워크로드를 가속화할 수 있다. 이를 통해, 기업들은 온디맨드 형식으로 통합된 소프트웨어 정의 플랫폼에서 데이터 분석, 훈련, 추론을 포함한 다양한 워크로드를 가속화하기 위해 필요에 따라 컴퓨팅 성능과 리소스를 최적화할 수 있다.

DGX A100은 이미 전세계적으로 출시되어 미 에너지국(DOE)의 아르곤국립연구소(Argonne National Laboratory)는 DGX 100의 AI 및 컴퓨팅 역량을 이용해 코로나19를 이해 및 분석하고 있다.

DGX A100을 조기에 도입한 기업은 ◾독일 함부르크 에펜도르프 대학 메디컬센터(Hamburg-Eppendorf) 바이오의약품 AI 센터 태국의 쭐라롱꼰 대학교(Chulalongkorn University) 몬트리올의 AI 기반 솔루션 및 서비스 개발업체 엘레멘트 AI(Element AI) 독일 AI연구센터(DFKI) 호주 헬스케어 AI 기업인 해리슨.ai(Harrison.ai) UAE 인공지능 사무소(The UAE Artificial Intelligence Office) 베트남 AI 연구소 빈AI 리서치(VinAI Research) 등이다.

엔비디아는 또한 700페타플롭(PF)의 AI 컴퓨팅 파워를 구현하는 140개 DGX A100 시스템의 클러스터인 차세대 DGX 슈퍼POD(DGX SuperPOD)를 공개했다.

엔비디아는 140개의 DGX A100 시스템과 엔비디아 멜라녹스 200Gb HDR 인피니밴드(InfiniBand) 인터커넥트를 결합해 대화형 AI, 게놈, 자율주행 등의 연구를 강화하기 위해 차세대 DGX 슈퍼POD AI 슈퍼컴퓨터를 구축했다.

이 클러스터는 세계에서 가장 빠른 AI 슈퍼컴퓨터 중 하나로, 기존에는 수천 대의 서버가 필요했던 수준의 성능을 제공한다.

엔비디아는 고객들이 DGX A100 기반 자체 데이터센터를 구축할 수 있도록 돕기 위해 DGX 슈퍼POD 레퍼런스 아키텍처도 새롭게 출시했다. 이를 통해, 엔비디아가 DGX A100 기반 AI 슈퍼컴퓨팅 클러스터를 구축하는 데 사용한 것과 동일한 설계 원칙 및 모범사례를 따르는 청사진을 제공한다.

엔비디아는 이밖에 DGX 고객을 AI 전문가들과 연결하는 DGXpert 프로그램과 더불어, 고객이 AI 워크플로우에 인증된 엔터프라이즈급 소프트웨어를 활용할 수 있도록 하는 엔비디아 DGX-레디 소프트웨어 프로그램을 출시했다.

DGXpert는 계획부터 구현, 최적화까지 고객의 AI 구축 과정 전반을 돕는 AI 전문가들로, DGX A100 고객이 최첨단 AI 인프라를 구축 및 유지하도록 지원한다.

◆대화형 AI 서비스 구축 돕는 ‘자비스’ = 엔비디아 자비스(NVIDIA Jarvis)는 영상 및 음성 데이터를 활용해 맞춤형 언어 기반 AI 서비스를 손쉽게 구축할 수 있는 GPU 가속 애플리케이션 프레임워크이다.

엔비디아 자비스 구동 모습
엔비디아 자비스 구동 모습

자비스를 기반으로 구축된 애플리케이션은 AI 컴퓨팅을 위한 새로운 엔비디아 A100 텐서 코어 GPU의 혁신 기술뿐 아니라, 추론을 위한 엔비디아 텐서RT(TensorRT)의 최신 최적화 기능을 활용할 수 있다.

이를 통해, 실시간 상호작용에 필요한 수준인 300밀리초 임계값 보다 더 빠르고 강력한 비전 및 음성 모델을 사용해 전체 멀티모달(multimodal) 애플리케이션을 실행할 수 있다.

자비스는 개발자가 각 기업 및 고객 고유의 용어를 이해할 수 있는 엔드-투-엔드 실시간 대화형 AI 애플리케이션을 쉽게 생성, 배치 및 실행할 수 있도록 하는 GPU 가속 소프트웨어 스택과 툴을 제공한다.

자비스는 대화형 AI를 위한 엔드-투-엔드 딥러닝 파이프라인을 제공하며, 여기에는 자연어 이해를 위해 엔비디아의 메가트론 버트(Megatron BERT) 등 최첨단 딥러닝 모델이 포함돼 있다.

기업들은 엔비디아 네모(NVIDIA NeMo)를 사용해 데이터에서 이러한 모델을 미세 조정하고, 텐서RT를 통해 추론을 최적화하며, 엔비디아의 GPU 최적화 소프트웨어 카탈로그인 NGC에서 이용할 수 있는 헬름(Helm) 차트를 활용해 클라우드 및 엣지 환경에 배치할 수 있다.

자비스 기반의 대화형 AI 제품 및 서비스를 활용하고 있는 기업들은 AI 기반의 콜센터 솔루션을 제공하는 보카(Voca), 금융 분야 AI 기술 기업 켄쇼(Kensho), 일정 관리를 위한 가상 어시스턴트 스퀘어(Square) 등이다.

◆스마트NIC ‘멜라녹스 ConnectX-6 Lx’ = 엔비디아 멜라녹스 ConnectX-6 Lx는 25GbE 및 50GbE 스마트NIC(스마트 네트워크 인터페이스 카드) 제품이다.

엔비디아 멜라녹스 ConnectX-6 Lx
엔비디아 멜라녹스 ConnectX-6 Lx

ConnectX-6 Lx는 멜라녹스 ConnectX 제품군의 11세대 제품으로, 엔터프라이즈 애플리케이션, 인공지능, 실시간 분석과 같은 까다로운 워크플로우를 처리하기 위해 25Gb 연결이 표준화되고 있는 현대 데이터센터의 요구사항을 충족하도록 설계됐다.

새로운 스마트NIC은 소프트웨어 정의형 하드웨어 가속 엔진을 활용해 CPU에서 더 많은 보안 및 네트워크 처리를 오프로드해 가속 컴퓨팅을 확장시키는 것이 특징이다.

멜라녹스 ConnectX-6 Lx는 인라인 IPsec 암호화, 하드웨어 자체 보안 기능(Hardware Root of Trust)과 같은 가속화된 보안 기능과 더불어, 커넥션 트래킹(Connection Tracking)을 위해 10배 이상 향상된 성능을 제공해 데이터센터 전반에 걸쳐 제로 트러스트(Zero Trust) 보안을 구현한다.

또한, 높은 수준의 RoCE(RDMA over converged Ethernet), 고급 가상화 및 컨테이너화, 그리고 NVMe-oF(NVMe over Fabrics) 스토리지 오프로드는 확장성과 성능이 매우 뛰어난 네트워킹을 제공한다.

멜라녹스 ConnectX-6 Lx는 현재 시제품으로 제공되고 있으며, 2020년 3분기에 출시될 예정이다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.