결론부터 말하자면, 큰 차이는 없다.
그들은 자신들의 일로 여전히 바쁘다.
"일 들어와도 몇 달 후에나..."
데이터 라벨링 스타트업 A사는 밀려드는 작업 의뢰로 2021년 일정이 가득 차있다.
"모든 개발자가 각각 프로젝트에 투입된 상태입니다"
데이터 라벨링은 원본 데이터를 AI가 학습 가능한 형태로 변환하는 작업이다.
원본 데이터에는 이미지, 텍스트, 오디오, 비디오 등이다.
A사는 대부분 고객사가 보유한 데이터를 AI 지도 학습 가능한 데이터로 변환하는 B2B 프로젝트를 진행하고 있다.
변환 데이터는 비용 절감 등 BM 예측 모델에 적용된다.
이 때문에 데이터 스펙 논의부터 작업 소요 측정, 실제 변환 및 수집 개발 등에 이르기까지 거의 모든 일원이 붙어 있다.
스타트업이다 보니 인원 확충도 쉽지 않은 상황.
그들은 이루다 논란을 신경 쓸 새 없이 바빴다.
"신경 쓸 게 더 늘어"
이루다는 AI스타트업 업계에 경종을 울렸다.
하지만 제대로 일하는 기업에게는 폐가 되기도 했다.
스타트업 B사는 데이터를 모으는 과정에서 난감함을 겪었다.
일반적으로 데이터를 수집, 가공하는 방법은 두 가지다.
의뢰하는 쪽에 보유한 데이터를 제공하거나, 혹은 데이터 확보까지 기업에 일임한다.
특히 데이터 확보부터 시작하게 된다면, 소유권에 대한 문제가 발생하기 때문에 정밀한 작업이 요구된다.
예를 들어, 차량의 도로 주행 이미지 내 번호판을 수집하는 작업이라고 하자.
이때 해당 이미지를 바운딩 박스, 폴리곤 등을 하기 위해 데이터 작업자에게 배포된다.
AI가 학습 가능한 기초 데이터를 만들면 이를 토대로 AI는 다른 데이터를 분석할 수 있다.
그런데 이루다 이후, 데이터 작업자 선별이 더 까다로워진 것.
의뢰 기업들도 일반인을 모으는 크라우드소싱보다는 검증된 전문가를 원한다.
그러나 전문 작업일수록 작업 단가 역시 올라가게 되고, 찾기도 힘들다.
같은 일을 하지만, 수익은 더 줄어든 셈이다.
흔들리지 않는 쪽도 있다.
스타트업 C사는 "크게 영향 받지 않아 동요하지 않는 것 같다"고 전했다.
이루다는 AI스타트업을 표방하지만, 결국 인터넷 서비스 기업이다.
AI스타트업이라도 물류, 부동산, 교육, 의료, 앞서 언급한 데이터 라벨링 기업 등 다양하다.
NIA에 따르면, 산업별로 비중은 AI 플랫폼이 31.4%이 가장 높다.
그 외 헬스케어 16.3%, 보안 9.2% , 유통·물류 8.5% 순이다.
IDC에 따르면 국내 AI 시장은 2023년에 6,400억원에 달할 것이라 전망했다.
연평균 17.8%의 성장세다.
또 정부는 3천억원 규모의 AI 펀드 조성 등을 통해 AI 스타트업 발굴 및 육성 지원책을 추진 중이다.
이미 스타트업 생태계는 하나의 분류로 나눌 수 없을 정도로 확장했다.
* 해당 스타트업 측에서 기업 이름 노출을 원하지 않아 익명 처리합니다.