무하유, 'AI가 작성한 뉴스 기사에 특화된 유사도 비교 기술 개발' 과제 참여기업 선정

자연어를 이해하는 실용 AI 기업 무하유는 한국콘텐츠진흥원이 주관하는 'AI가 작성한 뉴스 기사에 특화된 유사도 비교 기술 개발' 과제에 참여기업으로 선정됐다고 29일 밝혔다.

이번 과제는 생성형 AI를 이용해 작성된 기사 저작물(뉴스 기사)에 특화된 유사도 분석을 진행하고, 이를 표준화된 수치로 표현하는 기술 개발을 목표로 한다.

무하유 측은 “생성형AI로 작성된 저작물의 복제·인용·표절 등의 문제를 해결하고, 무분별한 확산을 막기 위함”이라며 “사실 확인이 어려운 AI 작성 기사가 빠르게 확산될 경우, 부정확한 정보를 포함한 뉴스가 광범위하게 퍼질 우려가 있다”고 이번 과제 개발 계획을 설명했다.

무하유는 이번 과제에서 AI를 활용해 생성된 콘텐츠의 저작물 유사도 비교 기술 개발을 담당한다. 지난 13년간 AI 표절검사 서비스 ‘카피킬러’를 운영하며 쌓아 온 데이터 분석 역량과 텍스트 유사도 비교 기술, 자연어 처리(NLP) 기술 등을 바탕으로 연구 개발 요건을 구체화했다. 100만 건의 뉴스 데이터를 연구했으며, 이를 바탕으로 유사도 구성 요소를 마련하고 각 요소별 표준 비율을 정의한다.

또한 유형별 메타 데이터 , 형태소 등 유사도를 구성하는 요소들을 관리하는 기술도 개발하게 된다. 저작물 데이터 확보를 위해 데이터를 수집 및 추출하고, 메타 식별 플랫폼을 구축할 예정이다.

한편 무하유는 무분별한 표절을 사전 예방하고, 저작물 윤리 의식을 도모할 수 있도록 다양한 표절검사 서비스를 운영하고 있다. 대표 서비스 ‘카피킬러’는 표절, 출처 미표기, 중복 게재 등 사람이 하나하나 파악하기 힘든 검토 작업을 AI 기술을 이용해 빠르게 진행한다. 또한 최근AI 기반 표·이미지 식별 솔루션인 '비주얼체커'를 출시했으며, 이를 통해 논문 내 삽입돼 있는 표나 이미지에 대한 표절 여부까지 판단하고 있다.

지난해 9월에는 생성형 AI가 쓴 문장을 탐지해주는 'GPT킬러' 서비스를 선보이며, 생성형 AI 오남용을 막는데 앞장서고 있다. AI가 문서를 문단 단위로 분석한 후, 각 부분에서 생성형 AI로 작성됐을 확률을 판단한다. 생성형 AI가 만들었을 법한 토큰(단어)의 확률을 역추적해 94%의 높은 정확도로 생성형 AI 사용 여부를 파악한다.

신동호 무하유 대표는 "생성형 AI를 이용한 기사 저작물에 대한 유사도를 육안으로 확인하는 것은 매우 어려운 일"이라며 "표준화된 유사도 수치로 표현하는 서비스 기술을 개발함으로써 언론의 신뢰성 향상과 저작권 보호에 기여할 수 있을 것"이라고 전했다.

황정호 기자

jhh@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

자소설닷컴, ‘대학생 장학·지원금 1초 조회’ 출시

대졸 신입 · 주니어 경력 취업플랫폼 ‘자소설닷컴’을 운영하는 앵커리어는 ‘대학생 장학·지원금 1초 조회’ 서비스를 출시했다고 25일 밝혔다. 교육부 산하 한국대학교육협의회와...

팔로알토 네트웍스, 북한 지원받는 해커 그룹과 플레이 랜섬웨어 그룹 협력 사실 최초 발견

글로벌 사이버 보안 기업인 팔로알토 네트웍스(Palo Alto Networks®)는 위협 연구 기관 ‘유닛 42(Unit42)’의 조사를 바탕으로, 북한의 지원을 받는 해커 조직과...

사이냅소프트, 소상공인을 위한 주문서 특화 서비스와 무료 웹 도구 출시

인공지능 디지털 문서 SaaS 기업 사이냅소프트는 사이냅오피스에서 ‘사이냅 폼'을 이용한 주문서 특화 서비스인 ‘사이냅 주문서’와 다양한 무료 온라인 웹 도구인...

카스퍼스키, 기업 맞춤형 사이버 위협 분석 서비스 출시

카스퍼스키는 25일 자사의 보안정보 서비스인 'Threat Intelligence Portal'에 기업별 맞춤형 위협 분석 기능을 새롭게 추가했다고 밝혔다. 'Threat Landscape'로 명명된 이...