무하유, 'AI가 작성한 뉴스 기사에 특화된 유사도 비교 기술 개발' 과제 참여기업 선정

자연어를 이해하는 실용 AI 기업 무하유는 한국콘텐츠진흥원이 주관하는 'AI가 작성한 뉴스 기사에 특화된 유사도 비교 기술 개발' 과제에 참여기업으로 선정됐다고 29일 밝혔다.

이번 과제는 생성형 AI를 이용해 작성된 기사 저작물(뉴스 기사)에 특화된 유사도 분석을 진행하고, 이를 표준화된 수치로 표현하는 기술 개발을 목표로 한다.

무하유 측은 “생성형AI로 작성된 저작물의 복제·인용·표절 등의 문제를 해결하고, 무분별한 확산을 막기 위함”이라며 “사실 확인이 어려운 AI 작성 기사가 빠르게 확산될 경우, 부정확한 정보를 포함한 뉴스가 광범위하게 퍼질 우려가 있다”고 이번 과제 개발 계획을 설명했다.

무하유는 이번 과제에서 AI를 활용해 생성된 콘텐츠의 저작물 유사도 비교 기술 개발을 담당한다. 지난 13년간 AI 표절검사 서비스 ‘카피킬러’를 운영하며 쌓아 온 데이터 분석 역량과 텍스트 유사도 비교 기술, 자연어 처리(NLP) 기술 등을 바탕으로 연구 개발 요건을 구체화했다. 100만 건의 뉴스 데이터를 연구했으며, 이를 바탕으로 유사도 구성 요소를 마련하고 각 요소별 표준 비율을 정의한다.

또한 유형별 메타 데이터 , 형태소 등 유사도를 구성하는 요소들을 관리하는 기술도 개발하게 된다. 저작물 데이터 확보를 위해 데이터를 수집 및 추출하고, 메타 식별 플랫폼을 구축할 예정이다.

한편 무하유는 무분별한 표절을 사전 예방하고, 저작물 윤리 의식을 도모할 수 있도록 다양한 표절검사 서비스를 운영하고 있다. 대표 서비스 ‘카피킬러’는 표절, 출처 미표기, 중복 게재 등 사람이 하나하나 파악하기 힘든 검토 작업을 AI 기술을 이용해 빠르게 진행한다. 또한 최근AI 기반 표·이미지 식별 솔루션인 '비주얼체커'를 출시했으며, 이를 통해 논문 내 삽입돼 있는 표나 이미지에 대한 표절 여부까지 판단하고 있다.

지난해 9월에는 생성형 AI가 쓴 문장을 탐지해주는 'GPT킬러' 서비스를 선보이며, 생성형 AI 오남용을 막는데 앞장서고 있다. AI가 문서를 문단 단위로 분석한 후, 각 부분에서 생성형 AI로 작성됐을 확률을 판단한다. 생성형 AI가 만들었을 법한 토큰(단어)의 확률을 역추적해 94%의 높은 정확도로 생성형 AI 사용 여부를 파악한다.

신동호 무하유 대표는 "생성형 AI를 이용한 기사 저작물에 대한 유사도를 육안으로 확인하는 것은 매우 어려운 일"이라며 "표준화된 유사도 수치로 표현하는 서비스 기술을 개발함으로써 언론의 신뢰성 향상과 저작권 보호에 기여할 수 있을 것"이라고 전했다.

황정호 기자

jhh@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

엔피, 카이스트와 ‘초개인화 XR앱’ 공동 연구 개발

XR(확장현실) 콘텐츠 전문기업 엔피(NP)는 카이스트 뇌인지과학과와 공동 연구로 ‘XR 명상 앱’을 개발 중이라고 10일 밝혔다.  엔피에 따르면 ‘XR 명상 앱’은...

플라이북, 2024년 독서 트렌드…2024년 회원들이 가장 사랑한 작가는 ‘한강’

책을 중심으로 한 소셜 네트워크 서비스(SNS) 플라이북은 10일 자사 회원 데이터를 기반으로2024년 독서 트렌드를 공개했다. 플라이북에 따르면 회원들은 총 200만권의...

리멤버, 누적 스카웃 제안 800만건 돌파

리멤버는 자사 플랫폼을 통한 경력직 스카웃 제안 수가 최근 800만건을 돌파했다고 10일 밝혔다. 이는 기업이 원하는 인재를 직접 검색하고 입사를...

실비아헬스, 인지검사 키오스크 강원도서 본격 실증

인지 건강 전문 디지털 헬스케어 기업 실비아헬스는 강원테크노파크 실증사업에 선정돼 강원 내륙 지역 6곳에 인지검사 키오스크를 설치하고 운영을 시작했다고 10일...