우리의 뇌가 하나의 방법으로만 공부하지 않듯 인공지능(AI) 역시 여러 가지 학습법을 가지고 있다.
그중 널리 활용되는 분야인 사용자의 취향이나 패턴을 학습하는 AI의 경우 협력적 필터링으로 학습한다.
말 그대로 여러 데이터를 한 번에 취합한 결과를 필터링해서 선택 가능한 범위를 줄이는 방법이다.
사용자를 알아야 추천도 할 수 있다
협력적 필터링의 전제는 둘로 구분할 수 있다.
나와 비슷한 다수의 사용자가 선택한 좋고 나쁨의 결과가 추천 리스트에 영향을 준다는 의미다.
이러한 대표적인 협력적 필터링 사례로는 넷플릭스와 유튜브와 같은 콘텐츠 추천 시스템이 있다.
다만, 추천이 어긋나는 이유는 사용자에 대한 데이터가 부족하기 때문.
다른 사용자의 데이터만 많다고 해서 추천이 고도화될 수 없는 이유다.
이러한 벽을 넘기 위해 콘텐츠 제공 서비스 기업은 일정 기간의 프로모션을 통해 사용자를 묶어두고자 한다.
저 사람이 틀린 문제, 나도 틀렸다면?
즉, 사용자 데이터를 확보해야만 사용자 개인화가 가능해진다.
이러한 협력적 필터링 기법은 영상이나 글 등 콘텐츠를 넘어 활용할 수 있다.
대표적인 사례가 토익 문제에 협력적 필터링을 적용한 뤼이드의 산타토익이 있다.
산타토익은 수험생이 계속 틀리는 문제를 추천 콘텐츠로 지정했다.
AI가 오답 노트를 작성해주는 것. 그 오답 노트는 나와 유사한 학습 수준과 유형을 가진 이들과 함께 만들어진다.
그리고 빠르게 원하는 토익 점수를 달성케 하는 방법이다.
예를 들어, 아래와 같이 미애, A, B, C, D의 5명의 수험자가 있다고 하자.
그리고 A~D는 이미 6번까지의 문제를 풀었다.
각각 채점 결과 느리게 풀고 문제도 틀린 1부터 빠르게 풀고 문제도 맞힌 5까지 결과도 역시 나왔다.
결과를 비교하니, 미애와 B는 유사한 문제 풀이 형태를 보였다.
이 경우, 미애에게 아이템5 문제를 준다고 해도 잘 맞출 것이고, 아이템 6 문제를 틀릴 가능성이 높다.
산타토익은 틀릴 문제만 골라줌으로써 빠른 점수 획득이 관건인 수험생의 시간까지 절약하는 셈.
수험생이 한 회 모의고사 분량인 LC 100문제, RC 100문제만 풀어도, 넷플릭스의 관점에서 보면 200편의 영상을 시청한 셈이다.
이는 수험생 개인화로 이어진다.
같은 서비스를 이용하지만 다른 콘텐츠를 제공 받듯, 산타토익 역시 다른 문제를 제공 받는다.
이러한 사용자 중심 서비스는 이미 한국과 일본의 교육 앱부문 매출 1위를 달성으로 증명됐으며, 2017년 출시 이후 200만명 이상의 누적 사용자를 보유하고 있다.
"단순한 세대 차이가 아니다"
협력적 필터링 기법은 향후 서비스 시장에서 더욱 활용될 것으로 예상된다.
특히 사람을 매개로 비즈니스 되는 결혼정보회사, 소개팅 애플리케이션, 취향 기반 서비스 등에서
시장분석기업 앱엔이프에 따르면, 2020년 말 국내 온라인 데이팅 서비스 사용자는 1년 만에 약 55%가 증가했다.
애플리케이션 매출 순위권 역시 게임을 제외하면 데이팅 앱이 차지하고 있다.
직장인 커뮤니티 블라인드도 직장인 전용 데이팅 서비스인 '블릿'을 출시한 바 있다.
애플리케이션 내 매칭 역시 넷플릭스와 산타토익과 같은 협력적 필터링을 통해 이뤄진다.
소개팅 서비스 운영사 관계자는 "단순히 시대의 변화라기보다는 이전에 중매의 판단에만 의존했던 서비스가 AI와 데이터를 통해 개선되는 것"이라고 전했다.