[AI 테크] 셀바스 AI, ‘대화형 음성합성 오픈소스 플랫폼’ 구축
[AI 테크] 셀바스 AI, ‘대화형 음성합성 오픈소스 플랫폼’ 구축
  • 박시현 기자
  • 승인 2021.01.07 14:30
  • 댓글 0
이 기사를 공유합니다

한국과학기술원, 성신여대, 대전대학교, 서강대학교와 공동 연구 산물

[디지털경제뉴스 박시현 기자] 셀바스 AI가 ‘로봇의 감정 및 개성을 표현할 수 있는 대화형 음성합성 오픈소스 플랫폼’을 구축했다.

이 오픈소스 플랫폼은 산업통상자원부 산업기술혁신사업의 일환으로, 한국과학기술원 주관으로 진행된 ‘음원 다양화를 통해 로봇의 감정 및 개성을 표현할 수 있는 대화음성합성 원천기술 개발’ 국책연구과제의 결과물이다.

개발된 오픈소스 플랫폼은 소스코드 공유사이트 깃허브(GitHub)에 공개됐다.

깃허브에 공개된 기능은 △DNN(Deep Neural Network) 음성합성기 제작에 필요한 음성코퍼스 △로봇에 감정과 개성을 부여하기 위한 Emotional SSML 해석기 △딥러닝 기반 한국어 G2P(Grapheme-To-Phoneme) 변환기 △딥러닝 훈련이 가능한 엔드 투 엔드 한국어 음성합성기 및 음색과 감정을 표현할 수 있는 음성합성기 등이다. 여기에다 가창 기반 음성합성기 연구를 위해 수집한 한국어와 영어 각각 50개로 구성된 어린이 노래 코퍼스도 포함됐다.

이 오픈소스 플랫폼은 한국과학기술원, 성신여대, 대전대학교, 서강대학교 그리고 셀바스 AI에서 공동 연구한 결과물이다.

셀바스 AI는 연구과제 중 DNN 음성합성기 제작에 필요한 음성코퍼스 설계 및 구축을 담당해 총 40명의 목소리로 이뤄진 24,247개 문장, 34시간 분량의 음성 데이터베이스를 구축했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.