[AI혁명](63)데이터 라벨링 시장 독보적 1위…크라우드웍스
50만명의 크라우드 소싱 작업자 보유
완벽한 품질 위해 180여개 기술 특허
시총 상위 30개사 중 70%가 크라우드웍스 고객
"인공지능(AI)은 사람 손으로 키운다고 봐야죠."
AI 경쟁 우위 핵심은 양질의 데이터를 확보하는 것이다. 특히 생성형 AI는 사람들이 수집하고 가공한 데이터를 바탕으로 학습한 결과물이기 때문에 품질을 높이려면 양질의 학습 데이터가 중요하다. 또 어떠한 데이터를 어떻게 사용했는지에 따라 모델의 편향성이나 정확도에 영향을 주기 때문에 AI 시장이 성장할수록 숙련된 데이터 라벨러의 수요는 증가할 수밖에 없다.
데이터 라벨링은 이미지나 문서, 음성, 영상 등의 데이터를 AI가 학습할 수 있도록 가공하는 작업을 뜻한다. 예를 들어 자율주행 분야에서 AI가 학습할 수 있도록 수많은 도로 사진을 수집한 후 사진에서 무엇이 도로고 무엇이 장애물인지 입력하는 작업이다. AI는 라벨링이 된 데이터를 반복 학습하면서 도로와 장애물을 구분하게 된다.
이러한 데이터 라벨링 시장에서 ‘크라우드 소싱’이라는 획기적인 방식으로 성장 가도를 달리는 기업이 있다. 바로 크라우드웍스다.
데이터를 기업 내부 인력으로 직접 수집하고 가공할 경우 비용과 시간이 많이 들 수 밖에 없는데, 크라우드웍스의 아웃소싱 데이터 라벨러들을 활용하면 비용과 시간을 크게 절감할 수 있다.
크라우드웍스는 품질을 보장하기 힘들다는 크라우드 소싱의 한계를 극복하기 위해 180여개 기술 특허를 통해 뛰어난 데이터 품질을 유지하고 있다. 박민우 크라우드웍스 대표는 "약 50만 명의 크라우드소싱 작업자들 덕분에 후발주자들이 따라올 수 없을 정도로 압도적인 데이터를 가지고 있다"라며 "4단계로 구성된 인력 검증시스템을 활용해 50만명이 수집·가공한 데이터를 100% 전수 검수하고 있다. 이는 데이터 품질 99% 보증이란 결과로 이어지고 있다"고 설명했다.
실제 이날 기준 크라우드웍스 웹사이트 가입자 숫자는 53만3538명이다. 유효활동 숫자는 가변적이지만, 이들 모두가 라벨러로서 언제든 활동이 가능하다는 게 회사 측의 설명이다.
크라우드웍스가 제공하는 서비스는 ▲ 인공지능 구축 서비스 '크라우드웍스' ▲ 인공지능 데이터 구축을 위한 통합 솔루션 '웍스스테이지' ▲ 데이터 라벨러 인력 매칭 및 파견 서비스 '크라우드 잡스' ▲ 데이터 라벨러 교육 서비스 '크라우드 아카데미' 등이다.
이러한 서비스들을 기반으로 창업 4개월 만에 네이버로부터 2억원의 투자를 받았다. 이후 6년여 동안 네이버 50여개 팀과 협업을 해왔고, 지금은 네이버 거대언어모델(LLM) 하이퍼클로바X를 비롯한 AI 서비스 개발에 필수인 데이터 구축에 참여하고 있다.
현재 카카오와 삼성전자, KT, KB국민은행 등 430여개 고객사에 맞춤형 서비스를 제공하고 있다. 코스피 IT기업 시가총액 상위 30개사 중 70%가 크라우드웍스 고객이다. 지난달 말에는 코스닥 입성에도 성공했다.
'크라우드 잡스'와 '크라우드 아카데미'는 취업률 개선에도 일조하고 있다. 크라우드웍스가 지난해 라벨링 훈련 과정 수강생의 소득 데이터를 분석했더니, 월 100만원 이상의 소득을 이뤄낸 교육생 중 80%가 실업자였다가 데이터 라벨러 직업군에 자리 잡아 활동 중인 것으로 나타났다.
박 대표는 "소득과 업무시간이 불규칙한 프리랜서부터 지리적인 요건이 취약한 이들까지 교육 이수 후 데이터 라벨러로 활동하고 있는 것을 알 수 있었다"라며 "데이터 라벨링 관련 교육에 더 많은 정보를 제공해 수강생들이 취업하는 데 도움이 될 수 있도록 하겠다"고 말했다.
기업 대 정부(B2G) 사업에도 힘을 싣고 있다. 크라우드웍스는 지난해 4월 공공사업본부를 신설해 기관, 연구소, 학교발 데이터 수요에 대응 중이다.
크라우드웍스의 다음 목표는 글로벌 진출이다. 국내에서 쌓은 노하우와 기술적 역량을 바탕으로 유럽, 미주 및 일본 등 해외에 본격적으로 진출해 시장을 확장해 나간다는 계획이다.
꼭 봐야 할 주요 뉴스
"월 150만원 견디느니, 美 가서 5억 벌죠" 서울대...
박 대표는 "최근 해외 기업들이 기업에 꼭 맞는 생성형 AI 모델을 도입해 업무 생산성과 효율성을 높이고 있다"라며 "기업 맞춤형 데이터를 설계 및 구축하고, 기업의 니즈에 맞는 언어 모델을 개발해 해외 시장을 선도해 나갈 것"이라고 말했다.
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>