​​​​​​사이냅소프트, '사이냅 도큐애널라이저' 올해 5월 내놓는다
​​​​​​사이냅소프트, '사이냅 도큐애널라이저' 올해 5월 내놓는다
  • 박시현 기자
  • 승인 2024.04.02 19:05
  • 댓글 0
이 기사를 공유합니다

문서형 지식정보 자산화…학습 데이터의 품질 향상시키고 입력 데이터의 검증 강화

[디지털경제뉴스 박시현 기자] 사이냅소프트가 다양한 문서에서 표, 그래프 등의 시각적 정보와 문서 구조 정보를 분석해 주는 ‘사이냅 도큐애널라이저’를 오는 5월 출시한다.

사이냅 도큐애널라이저는 기업과 정부기관의 문서형 지식정보를 자산화해 LLM과 인공지능을 통해 활용하는데 필수적인 솔루션이다.

<그림>사이냅 도큐애널라이저 개념도 및 처리 프로세스

아래아 한글, 오피스 문서, PDF 등의 일반 업무용 문서와 이미지 문서 등 다양한 비정형 문서의 포맷과 레이아웃, 속성 및 객체를 분석해 정보화한다. 또한, 표, 도형, 그래프와 같은 시각적 정보와 제목, 문단, 머리글/바닥글, 캡션, 각주, 페이지번호 등의 문서 구조 정보를 Markdown, XML 형식의 정형 데이터로 전환한다.

이는 생성형 AI의 약점인 할루시네이션을 최소화하는 RAG 시스템 구성에서 학습 데이터의 품질을 향상시키고 입력 데이터의 검증을 강화하는데 중요한 역할을 하며, 이를 통해 정보의 정확성과 신뢰도를 높일 수 있다. 분석결과는 디지털 정보 자산 구축 및 LLM 학습에 활용될 수 있다.

전경헌 사이냅소프트 대표는 “5월 1일부터 3일까지 코엑스에서 열리는 AI 엑스 2024에서 사이냅 도큐애널라이저를 선보일 예정이다. 코난테크놀로지, 셀렉트스타 등과 협력 중이며, LLM 모델 생성에 있어 학습 데이터의 품질을 중시하는 고객 및 파트너들로부터 큰 관심을 받고 있다. 이 제품이 디지털 자산 활용이 필요한 기업 및 기관에 실질적인 도움을 줄 것으로 기대한다”고 밝혔다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.