S2W, NLP 학술대회 ‘ACL’에서 논문 채택
S2W, NLP 학술대회 ‘ACL’에서 논문 채택
  • 박시현 기자
  • 승인 2023.05.04 15:22
  • 댓글 0
이 기사를 공유합니다

‘다크버트: 인터넷의 어두운 단면을 위한 언어 모델’ 주제

[디지털경제뉴스 박시현 기자] S2W는 올해 7월에 열리는 자연어처리(NLP) 국제 학술대회 ‘ACL(Association for Computational Linguistics)’에서 논문이 채택됐다고 밝혔다.

S2W는 지난 2022년에도 자연어 처리 분야 국제 3대 학술 대회 중 하나인 북미 지역 NAACL에서 ‘다크웹 언어에 대한 새로운 조명’ 논문을 발표한 바 있다.

ACL(Association for Computational Linguistics)은 자연 언어 처리 및 기계 번역과 같은 컴퓨터 과학 분야의 학자 및 전문가들이 모여 최신 연구 결과 및 기술 개발에 대해 발표하고 공유하는 자리다. 지난 1962년에 첫 개최 이후 올해 61년째를 맞이했다.

S2W가 2023년 7월에 ACL에서 발표할 논문 주제는 ‘다크버트: 인터넷의 어두운 단면을 위한 언어 모델(DarkBERT: A Language Model for the Dark Side of the Internet)’이다. S2W는 논문 준비를 위해 독자적으로 보유한 다크웹 수집, 정제, 분석 엔진과 범용 언어모델 BERT를 이용해 다크웹에 특화된 언어모델 ‘다크버트’를 제작했다.

‘다크버트’는 최근 다양한 사이버 범죄 및 위협의 주요 원인으로 꼽히는 다크웹에서 음란물, 총기류, 마약 등의 콘텐츠를 자동으로 분류하고, 각종 사이버 위협과 관련된 키워드를 추론하는데 이용할 수 있다. 또한 기밀 정보 유출 사이트를 탐지하고 해킹포럼 내 중요 게시물을 분류하는 등 다양한 유형의 범죄 활동을 탐지하고 분석하는데 있어 기존의 범용 언어모델보다 뛰어난 성능을 보인다. 이는 S2W AI팀의 장우진, 정진우, 최건, 이용재 연구원이 KAIST 연구팀과 공동으로 연구한 결과다.

S2W는 이러한 다크버트에 대한 설명과 관련된 벤치마크 데이터를 오는 6월 열릴 자체 정기 웨비나 ‘with’와 7월 정기 오프라인 세미나 ‘SIS 2023’에서 공개할 예정이다.

S2W는 “국내 사이버 보안 업체가 2년 연속으로 NLP의 국제적인 학회에서 논문을 발표한 것은 이번이 처음”이라며, “글로벌 사이버 보안 업계의 선두 주자로서 기술 발전과 보안에 지속적으로 기여할 것”이라고 밝혔다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.