[디지털경제뉴스 박시현 기자] 인텔이 데이터센터 포트폴리오에 두 가지의 업데이트를 포함한 최신 AI 인프라스트럭처 지원 사항에 대해 발표했다. 이번에 발표한 업데이트의 주요 내용은 제온 6 P-코어와 가우디 3 AI 가속기의 출시다.
인텔코리아는 26일 기자간담회를 갖고 제온 6 P-코어와 가우디 3 신제품의 기술사항을 발표했다. 이날 인텔 데이터센터 및 AI 사업부 한국 영업 총괄 나승주 상무는 “지난 6월 E코어 기반 제온 6를 출시한데 이어, 이번에 코어당 고성능 제품을 원하는 고객을 공략할 수 있는 P코어 제품을 출시하며 제온 6 라인업이 좀 더 풍성해졌다. 뿐만 아니라, AI 가속기 신제품인 가우디 3 제품을 출시함으로써, 국내 고객들에게 AI 인프라 구축에 폭넓은 선택지를 제공할 수 있게 됐다. 조만간 주요 OEM에서 이번에 출시한 인텔 제품을 탑재한 서버를 국내 출시할 계획인 만큼 국내 고객들도 인텔 신제품의 강점을 빠른 시일안에 경험할 수 있을 것으로 예상한다”고 밝혔다.
인텔 제온 6 P-코어는 컴퓨팅 집약적인 워크로드를 뛰어난 효율로 처리할 수 있도록 설계됐으며, 이전 세대 대비 2배 높은 성능을 제공한다. 코어 수 증가, 메모리 대역폭 2배 증가, 모든 코어에 내장 AI 가속 기능을 갖춘 것이 특징이다. 이 프로세서는 엣지에서 데이터센터 및 클라우드 환경에 이르기까지 AI의 성능 요구를 충족하도록 설계됐다.
대규모 생성형 AI에 최적화된 가우디 3은 64개의 텐서 프로세서 코어와 8개의 행렬 곱셈 엔진을 통해 심층 신경망 연산을 가속화한다. 가우디 3은 학습 및 추론 작업을 위한 128GB의 HBM2e 메모리와 확장 가능한 네트워킹을 위한 24개의 200Gb 이더넷 포트를 갖추고 있다. 또한 파이토치 프레임워크와 허깅페이스의 고급 트랜스포머 및 디퓨전 모델과의 호환성을 제공한다.
인텔은 최근 IBM과 협력해 IBM 클라우드에서 가우디 3을 서비스 방식으로 배포한다고 발표한 바 있다. 이를 통해 인텔과 IBM은 AI를 활용하고 확장하는 데 있어 총 소유 비용을 줄이고 성능을 향상시킬 계획이다.
대규모 AI 배포를 위해서는 유연한 배포 옵션, 경쟁력 있는 가격 대비 성능, 접근 가능한 AI 기술 등을 고려해야 한다. 인텔의 x86 인프라와 광범위한 개방형 생태계는 기업들이 최적의 TCO와 성능 대 전력비를 갖춘 고부가가치 AI 시스템을 구축할 수 있도록 지원한다.
인텔은 델 테크놀로지스, 슈퍼마이크로 등 주요 OEM 파트너들과 협력해 고객의 특정 요구에 맞춘 AI 배포 시스템을 공동 설계하고 있다. 델 테크놀로지스는 현재 가우디 3과 제온 6을 활용한 RAG 기반 솔루션을 공동 설계 중이다.
생성형 AI 솔루션을 프로토타입에서 생산 준비가 완료된 시스템으로 전환하는 과정에는 실시간 모니터링, 오류 처리, 로깅, 보안, 확장성 등에 대한 과제가 포함된다. 인텔은 OEM 및 파트너들과의 공동 엔지니어링을 통해 이러한 문제를 해결하며, 생산 준비가 완료된 RAG 솔루션을 제공한다.
이 솔루션은 오픈 플랫폼 엔터프라이즈 AI(OPEA) 플랫폼을 기반으로 하며, OPEA 기반 마이크로서비스를 통합해 확장 가능한 RAG 시스템을 구축하고, 제온 및 가우디 AI 시스템에 최적화되어 고객이 쿠버네티스, 레드햇 오픈시프트 AI 및 레드햇 엔터프라이즈 리눅스 AI에서 쉽게 애플리케이션을 통합할 수 있도록 해준다.
인텔의 타이버 포트폴리오는 AI, 클라우드, 엣지 환경 전반에서 접근성, 비용, 복잡성, 보안, 효율성 및 확장성 문제를 해결하는 비즈니스 솔루션을 제공한다. 인텔 타이버 개발자 클라우드 이제 기술 평가 및 테스트를 위한 인텔 제온 6의 미리보기 시스템을 제공한다.
또한, 선별된 고객들은 AI 모델 배포를 검증할 수 있는 인텔 가우디 3에 대한 조기 접근 권한을 이용할 수 있으며, 가우디 3 클러스터는 다음 분기부터 대규모 생산 배포를 위해 출시될 예정이다.