자연어를 이해하는 실용 AI 기술 기업 무하유는 7일 자사 AI 표절검사 서비스 카피킬러에 출처검사 기능을 도입했다고 밝혔다.
무하유에 따르면 카피킬러는 과제물 작성자가 표절 행태를 경계할 수 있도록 길잡이 역할을 제공하는 AI 표절검사 서비스다. 내용 표절·출처 미표기·중복 게재 등 사람이 하나하나 파악하기 힘든 작업을 AI 기술을 이용해 빠르게 검토할 수 있다. 자연어 이해(NLU) 기반 AI가 문장 내 6 어절 이상 일치할 경우 표절로 처리한다는 최소한의 가이드라인을 제공하며, 표절률과 함께 검사 결과지를 제공해 표절 의심 영역을 상세히 표시하도록 한다.
무하유 측은 “기존의 카피킬러는 문서 내용의 표절 여부를 중점으로 검사를 진행했기 때문에 본문 내에 인용 표시를 했는지 확인할 수 있지만, 해당 인용구에 대한 출처 검사는 불가능했다”며 “이번 출처검사 기능을 신규 도입하며 참고문헌·각주 등 내용 외 요소까지 검증할 수 있게 됐다”고 설명했다.
논문에 인용을 할 때는 내용과 함께 출처를 반드시 남겨야 하지만, 출처 표기법은 구두점·띄어쓰기·기호에 따라 달라질 수 있어 작성자가 실수하기 쉽다. 문서 내에서 표준화된 스타일로 일관되게 작성하는 것이 중요하며, 같은 자료를 인용하더라도 분야나 제출처에 따라 권장하는 표기법이 다르기 때문에 해당 양식에 맞춰서 작성하기 어렵다.
신규 도입된 출처검사는 이런 문제점을 해결하기 위해 인용정보 누락, 출처 표기 오류, 최신성 검사, 편향성 검사 등의 다양한 기능을 제공한다. 주석이나 인용구를 작성했는데 대응되는 참고문헌이 없거나, 반대로 참고문헌으로 작성한 내용이 주석 및 인용구에 없는 경우를 검출할 수 있으며, 잘못된 출처 표기법을 사용했는지에 대한 검사도 가능하다.
인용된 자료의 편향성도 검증할 수 있다. 출처 중 특정 저자나 매체가 차지하는 비율이 40% 이상일 경우 해당 문서의 편향성이 높다는 안내 메세지가 제공되는 식이다. 또한 너무 오래된 자료의 경우 최신 이론이나 해석과 다를 수 있기 때문에 논문 연구 방향이 잘못되는 것을 막고자 논문 발행 후 10년을 기준으로 최신성 검사도 진행된다.
무하유의 왕일 프로는 "논문은 선행연구 이해와 활용을 기반으로 작성되기 때문에 인용한 자료의 '출처'를 정확하게 밝히는 게 매우 중요하지만 출처 표시는 표절처럼 사람이 직접 일일이 대조하거나 틀린 부분을 찾기 힘든 영역이라 출처 표기법을 명확히 숙지하지 못한 상태로 논문을 작성하다 보면, 출처 표기 형식이 틀리거나 참고문헌을 누락하는 식의 오류를 범할 수 있다"며 "이번에 새롭게 도입된 출처검사 기능이 사람의 육안으로 찾아내기 어려운 오류를 대신 찾아 보완점을 알려줌으로써 문서의 완벽성을 높여주는 도구가 될 것"이라고 전했다.