엔비디아, 실시간 대화형 AI 기반 언어이해 모델 발표

최첨단 AI 언어모델 ‘버트’ 53분에 훈련, 2밀리세컨드에 AI 추론 완료

엔비디아는 최첨단 AI 언어모델 중 하나인 버트(BERT)를 53분에 훈련시키고, 2밀리세컨드만에 AI 추론를 완료하는 실시간 대화형 인공지능 기반 언어이해 모델을 발표했다.

[디지털경제뉴스 최종엽 기자] 엔비디아는 실시간 대화형 인공지능(AI)을 통해 기업이 고객과 보다 자연스럽게 소통할 수 있는 언어이해 모델을 발표했다.

엔비디아의 이 AI 기반 언어이해 모델은 최첨단 AI 언어모델 중 하나인 버트(Bidirectional Encoder Representations from Transformers)를 53분에 훈련시키고, 2밀리세컨드(ms)만에 AI 추론를 완료한다.

마이크로소프트를 포함한 혁신적인 몇몇 스타트업은 초기부터 엔비디아를 채택해 성능 향상을 확인했다. 이들 기업은 엔비디아 플랫폼을 활용해 자사의 고객을 위해 매우 직관적이고 즉각적인 반응형 언어 기반 서비스를 개발하고 있다.

대화형 AI 서비스는 몇 년 동안 제한적으로 존재해왔다. 현재까지 엄청나게 방대한 AI 모델을 배치하는 것이 불가능해 챗봇, 지능형 개인 비서, 검색 엔진 서비스가 인간 수준의 이해력 갖춘 채로 작동되기는 매우 어려웠다.

엔비디아는 AI 플랫폼에 핵심 최적화 기능을 추가해 이러한 문제를 해결했으며, AI 훈련과 인퍼런스를 기록적인 속도로 수행하고, 현재까지 가장 방대한 언어 모델을 구축했다.

자연어 이해에 기반한 AI 서비스는 향후 몇 년 동안 기하급수적으로 성장할 것으로 예상된다.

실제로, 주니퍼리서치(Juniper Research)는 디지털 음성 비서만의 사용건수가 향후 4년 내에 25억에서 80억으로 증가할 것으로 예측했다. 또한, 가트너는 2021년까지 모든 고객 서비스 상호작용의 15%가 AI로 완전히 처리되고, 2017년도 대비 400% 증가할 것으로 예측했다.

엔비디아는 이 새로운 시대를 선도하기 위해 핵심 최적화를 통해 AI 플랫폼을 미세하게 조정했다. 엔비디아는 자연어 성능과 관련해 세 가지 성과를 기록했다.

세가지 성과는 ▲가장 빠른 훈련 ▲가장 빠른 인퍼런스 ▲가장 방대한 모델 등이다.

먼저 세계에서 가장 진보된 AI 언어모델 중 하나인 버트(BERT)의 가장 방대한 버전을 수행한다. 1,472개의 엔비디아 V100 GPU를 실행해 924개의 엔비디아 DGX-2H 시스템을 사용하는 엔비디아 DGX 수퍼POD(DGX SuperPOD)를 통해 며칠이 소요되던 BERT-라지(BERT-Large)의 훈련 시간을 53분으로 단축했다.

엔비디아 텐서RT(TensorRT)를 사용하는 엔비디아 T4 GPU를 통해 엔비디아는 버트-베이스 스쿼드(BERT-Base SQuAD) 데이터세트를 단 2.2ms만에 인퍼런스했다.

엔비디아 리서치는 점점 더 방대한 모델을 요구하는 개발자의 요청에 부응해 버트에 사용되는 기술 빌딩 블록(building block)과 점점 더 늘어나는 다른 자연어 AI 모델을 기반으로 세계 최대 언어모델을 구축하고 훈련시켰다.

엔비디아의 맟춤형 모델은 83억 개의 매개변수를 가졌으며, 버트-라지 크기의 24배다.

최종엽 기자 다른기사 보기