'사이냅 문서필터', 인공지능 OCR과 연동으로 텍스트 추출 기술력 강화
'사이냅 문서필터', 인공지능 OCR과 연동으로 텍스트 추출 기술력 강화
  • 박시현 기자
  • 승인 2020.09.14 21:14
  • 댓글 0
이 기사를 공유합니다

문서 내 텍스트뿐만 아니라 이미지 속 텍스트도 추출 가능

[디지털경제뉴스 박시현 기자] 사이냅소프트는 ‘사이냅 문서필터’가 인공지능 OCR과의 연동으로 텍스트 추출 기술력을 강화했다고 밝혔다. 두 솔루션의 결합으로 문서에 포함된 이미지 내 텍스트도 추출할 수 있어 사이냅 문서필터만의 차별화된 경쟁력을 갖추게 됐다.

사이냅 문서필터는 문서에서 텍스트를 추출하는 솔루션이다. 400종이 넘는 문서 포맷의 종류를 식별하고 50종 이상 포맷의 문서 파일로부터 텍스트를 추출한다. 다국어 인코딩 지원, 빠른 속도와 안정성으로 검색 엔진, 메일, 보안 솔루션의 첨부파일 텍스트 필터링에 활용되고 있다.

문서필터는 네이버, 카카오 등 대형 포털 사이트에 적용될 정도로 빠르고 안정적인 텍스트 추출에 강점을 지닌 솔루션이다. 하지만 문서 내 이미지에 포함된 텍스트는 추출할 수 없는 아쉬움이 있었다.

사이냅소프트는 이러한 한계를 보완하기 위해 문서필터에 인공지능 딥러닝 기술을 활용해 다양한 형태 이미지에 포함된 텍스트를 인식하는 ‘사이냅 OCR’를 연동했다.

두 솔루션의 결합으로 일반 텍스트는 물론 이미지 내 텍스트까지 인식과 추출이 가능해졌다. 문서에 포함된 모든 텍스트를 완벽히 추출할 수 있게 되어 문서필터의 가치를 한 단계 끌어 올렸다.

사이냅 문서필터는 사이냅 OCR과의 연동을 통해 SK텔레콤, 안랩 등 다양한 레퍼런스를 확보하며 문서필터 시장을 이끌어 가고 있다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.