인공지능(AI) 학습 데이터 구축 서비스 ‘TEXTNET’의 운영사 스피링크는 언어모델 학습을 위한 사전 구축 데이터를 판매하는 ‘Data Market’을 오픈했다고 21일 밝혔다.
스피링크에 따르면 ‘Data Market’은 고객이 필요한 학습 데이터를 빠르게 확보할 수 있도록 마련된 서비스로, 준비된 데이터 샘플을 확인한 후 즉시 구매하여 학습에 활용할 수 있도록 돕는다. 이를 통해 고객은 데이터 구축 업체 선정, 데이터 명세 협의 등 복잡한 과정 없이 충분한 기획/작업기간과 꼼꼼한 검수, 개선 과정을 거친 사전 구축 데이터를 신속하게 수급할 수 있다.
스피링크 측은 “고객은 ‘Data Market’에서 판매 중인 데이터 리스트를 통해 데이터의 세부 정보를 확인하고 적합한 데이터 샘플을 요청하여 구매 결정을 내릴 수 있다”며 “사전 구축 데이터를 학습 목적과 자사의 모델에 맞게 일부 수정하는 것도 가능하다”고 설명했다.
TEXTNET의 ‘Data Market’은 공식 홈페이지를 통해 접속할 수 있다. 국내 최대 자연어처리 학회(HCLT 2023) 우수논문의 실증 데이터인 ‘성향별 청자의 공감 반응 패턴 데이터’ 등 다양한 자연어 학습 데이터가 지속 업데이트 될 예정이다.
더불어 스피링크는 ‘Data Market’ 오픈을 기념해 데이터 수요 조사에 참여한 고객에게는 실제 데이터 구축 시 30% 할인된 가격으로 데이터를 우선 공급 받을 수 있는 얼리 액세스 혜택도 제공한다.
고경민 스피링크 대표는 “인공지능 기술이 발전할수록 경쟁사보다 빠르게 고품질 데이터를 확보하려는 경쟁이 격화될 것”이라며 “다년간의 데이터 설계 및 구축 노하우를 담아 꼼꼼하게 구축한 데이터를 적시에 제공해 고객들이 골든타임을 놓치지 않도록 최선을 다할 것”이라고 말했다.
한편 스피링크는 TEXTNET를 통해 최근 KT, NC 등 자체 언어모델을 개발하고 있는 기업들의 학습 데이터 구축 프로젝트를 수주, 성공적으로 수행하며 데이터 설계 및 구축 전문성을 입증했다.