마인즈랩, CUDA 기술 활용 AI 음성생성 서비스 품질 대폭 향상

AI 음성생성 속도 수십배 이상 향상, 구글·페이스북 등 글로벌 기업 수준

[디지털경제뉴스 박시현 기자] 마인즈랩(대표 유태준)이 CUDA 기술을 활용해 AI 음성생성(Text to Speech) 서비스 품질을 비약적으로 발전시켰다고 밝혔다.

CUDA 기술은 그래픽 처리 장치(GPU)에서 수행하는 병렬처리 알고리즘을 C 프로그래밍 언어를 비롯한 산업표준 언어로 작성할 수 있는 가속화 컴퓨팅 기술이다.

CUDA는 페이스북이 주도하고 있는 머신러닝 프레임워크인 파이토치(PyTorch)와 구글이 주도하는 머신러닝 프레임워크인 텐서플로우(Tensorflow) 등에서 속도개선 및 비용절감을 위해 반드시 활용돼야 하는 핵심 기술이다.

마인즈랩 연구진들은 오픈소스 생태계에서 구글과 페이스북의 개발자들과 의견을 주고받으며, CUDA 코드의 수정 및 테스트를 통한 최적화에 기여했으며, 이 과정에서 공식적으로 마인즈랩이 제안한 코드가 파이토치(PyTorch) 및 텐서플로우(Tensorflow)에 추가됐다.

마인즈랩 자체적으로도 이 기술을 적용해 현재 가장 높은 수요의 인공지능 엔진 중 하나인 AI 음성생성(Text to Speech)의 속도를 수십배 이상 향상시켰다. 이는 국내 최고 수준이며, 구글, 페이스북 등 글로벌 기업 수준에 이른다는 게 마인즈랩 측의 설명.

마인즈랩 CUDA팀 이중건 팀장은 “최신 딥러닝 기반 음성생성 기술은 기존에 1초의 음성을 만들기 위해 1분의 시간이 소요되어 상용화하기 어려웠는데, CUDA 기술을 일찌감치 연구함으로써 음성생성 시간을 약 300배 향상시키는 데 성공했다”라면서 “인공지능 기술 연구개발이 아직 초창기에 있는 만큼 향후 상용 서비스 적용이 본격화되면서 속도 개선을 위한 CUDA 기술의 수요가 폭발적으로 늘어날 것으로 예상한다"고 말했다.

인공지능 서비스 고도화 과정에서 필수적으로 여기는 CUDA 기술에 대한 수요가 점점 늘어날 것으로 전망되지만 국내에서는 해당 인력을 찾기 어려운 상황이다.

마인즈랩은 해당 기술의 잠재적 중요성에 대해 일찌감치 파악하고, 빠르게 대처해 전폭적인 투자를 통해 글로벌 수준의 기술력을 확보했다.

앞으로는 음성생성 기술 뿐 아니라 음성인식, 챗봇, 안면인식, 영상처리 등 현재 상용으로 서비스하고 있는 다양한 엔진들에도 적용할 예정이다.

박시현 기자 다른기사 보기