bar_progress
Dim영역

2024년이면 전세계 37조 시장, AI 공부시키는 '합성 데이터' 뜬다

뉴스듣기 스크랩 글자크기

글자크기 설정

닫기
인쇄 RSS

합성 데이터 기술 스타트업 빠르게 성장
글로벌 빅테크 기업 합성 데이터에 투자
매년 23% 성장…2024년 시장 규모 261억 달러

이미지=게티이미지뱅크

이미지=게티이미지뱅크

AD
원본보기 아이콘


#자율주행차에 적용된 인공지능(AI)의 '공부량'은 안전과 직결된다. 도로에서 마주치는 위험의 종류는 너무 다양해 충분한 양의 영상 데이터를 학습해야 하기 때문이다. 자칫 어느 한 부분이라도 놓치면 사고로 이어질 수 있다. 하지만 위험이 발생할 수 있는 상황에 대한 실제 데이터는 턱없이 부족하다. 이에 테슬라는 최근 사고 사례 중심의 '합성 데이터'를 만들어 AI를 학습시키고 있다.


#내시경 영상을 분석해 위암을 진단하는 AI, 병변의 위치와 형태는 천차만별인데다가 의료정보의 확보는 쉽지 않아 실제 데이터만으로는 AI 학습이 어렵다. 여기에도 합성 데이터가 쓰인다. 기존 영상에 병변을 합성해 다양한 위암 이미지를 생성하면 AI의 진단 성능은 획기적으로 개선된다.

'합성 데이터'가 가 뜨고 있다. 관련 기업들이 빠르게 성장하고 있고 이 기술을 내세운 스타트업들도 속속 시장에 등장하고 있다. AI가 국가 경제를 이끌 혁신 기술로 대두되면서 AI의 성능을 좌우할 데이터의 중요성이 커진 데 따른 것이다. AI 개발을 위해 필요한 데이터가 너무 적고 확보도 쉽지 않아 양적이나 질적으로 향상된 데이터를 만드는 합성 데이터 기술에 관심이 집중되고 있다.


25일 관련 업계에 따르면 합성 데이터 스타트업 씨앤에이아이(CN.AI)의 주요 파트너사는 지난해 9개에서 올해 34개로 3.8배 증가했다. 신규 확보한 파트너사는 대기업을 포함해 정부기관, 교육기관, 의료기관 등이 주로 포진돼 있다. 2019년 설립된 이 회사는 당시만 해도 국내에서는 낯설었던 AI 합성 데이터 기술을 앞세워 관련 시장을 주도해 왔다. 씨앤에이아이가 짧은 시간에 다양한 분야에서 적용 사례를 만들 수 있었던 것은 AI 기술의 측면에서 합성 데이터에 대한 관심을 방증한다.


합성 데이터는 AI 학습용으로 만들어낸 가상의 데이터를 말한다. 컴퓨터 알고리즘이 실제 데이터의 특징을 반영해 무한대로 생성한다. 합성 데이터가 부상한 것은 AI를 공부시킬 데이터를 확보하는 게 쉽지 않기 때문이다. AI는 학습 데이터양이 많을수록 성능은 올라간다. 하지만 데이터를 구하는 것에는 큰 비용이 든다. 데이터를 분류하는 라벨링 작업은 사람의 손을 거쳐야 해 '21세기판 인형 눈 붙이기'라고 불릴 정도다. 또 실제 데이터는 개인정보 등의 문제로 데이터 수집과 활용에 제한이 있다.

합성 데이터를 사용하면 데이터를 모으는 시간과 비용을 줄일 수 있다고 씨앤에이아이는 설명했다. 올해 MIT테크놀로지리뷰가 합성 데이터를 10대 혁신 기술에 선정한 이유다. 해외에서도 합성 데이터 기술이 주목을 받고 있다. 테슬라가 자율주행 AI 학습에 합성 데이터를 적용하고 있고 엔비디아도 공간 이미지 중심 합성 데이터를 활용해 AI 훈련 데이터셋을 증대시키는 프로세스를 구축했다. 또 AI.리베리라는 미국의 합성 데이터 스타트업은 지난해 메타에 인수됐고 이어 북미 최대 식료품 배달업체인 인스타카트가 캐퍼라는 합성 데이터 기업을 인수했다. 업계 관계자는 "페이스북 같은 플랫폼을 보유한 기업도 데이터 확보를 위해 합성 데이터 회사를 인수한 것은 AI 기술 변화 방향을 보여준다"며 "합성 데이터는 학습데이터 생성, 자율주행 등에서 시작해 전 분야에서 핵심적으로 활용될 것"이라고 설명했다.


시장 전망도 밝다. 글로벌 조사기관 가트너에 따르면 오는 2026년 AI 학습에서 합성 데이터 사용 비율이 실제 데이터 사용 규모를 넘어설 전망이다. 현재 세계적으로 합성 데이터 시장은 매년 23%씩 성장 중이며 2024년 시장 규모는 261억 달러에 이를 것으로 예상된다. 국내에서도 합성 데이터 생성 시장은 2018년 약 1629억원 규모에서 연평균 9.4% 성장해 2024년에는 약 5752억원 규모로 확대될 전망이다.


국내 시장에선 씨앤에이아이 외에도 페블러스, 나니아랩스, 드림투리얼, 어나더리얼 등의 스타트업이 합성 데이터 관련 기술을 앞세워 시장에 뛰어들고 있다. 네이버도 올해 합성데이터 스타트업 젠젠AI에 투자했다. 젠젠AI는 AI 학습 데이터를 자동으로 생성·합성하는 솔루션을 개발하고 있는 회사로 실제 환경에서 수집하기 어려운 고품질의 데이터를 빠르게 확보할 수 있어 AI 모델 성능을 효율적으로 고도화할 수 있다는 점을 강조하고 있다.


이원섭 씨앤에이아이 대표는 "합성데이터는 현재 자율주행이나 로보틱스 등의 분야에 가장 활발하게 적용되고 있고 이 밖에 일반 소매 판매 시장, 스마트시티, 국방 영역 등에서 활용 사례가 늘어날 것"이라고 말했다.




김철현 기자 kch@asiae.co.kr
AD

<ⓒ경제를 보는 눈, 세계를 보는 창 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

이슈 PICK

  • "나 저격왕 유튜버야, 식당 망하고 싶나" 행패男 구속 "10만 돌파 감사해요"…꽃다발 든 조민, 감사 인사 "하마터면 초대형사고 날 뻔"…담배 물고 주유한 20대女

    #국내이슈

  • 한그릇 6만원 '바다 바퀴벌레' 대만 라멘…없어서 못 팔아 "호그와트 교복 한벌에 2억"…스타워즈, 해리포터 등 소품 내달 경매행 바이든도 애도한 '록의 여왕'의 별세

    #해외이슈

  • [포토]형형색색 연등 걸린 조계사 '찡그린 표정으로 응시'…구속 피한 유아인, 시민이 던진 커피는 못 피했다 美 가려던 수상한 중국인…'세계2위 파워' 한국 여권 내밀었다

    #포토PICK

  • [타볼레오]외모에 안정성까지 풀체인지…새까만 과거는 잊어라 폭스바겐, 투아렉 부분변경 모델 공개 "E클래스 비켜" BMW, 5시리즈 완전변경 모델 공개

    #CAR라이프

  • [뉴스속 인물]美 합참의장 지명된 '찰스 브라운' [뉴스속 용어]국가배상때 군복무 기간 포함 '일실이익' [뉴스속 용어]美 억만장자의 회춘 위한 '프로젝트 블루프린트'

    #뉴스속OO

간격처리를 위한 class

많이 본 뉴스 !가장 많이 읽힌 뉴스를 제공합니다. 집계 기준에 따라 최대 3일 전 기사까지 제공될 수 있습니다.

한눈에 보는 뉴스&트렌드