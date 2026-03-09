뒤늦게 '데이터 팩토리' 확장 뛰어들었지만

제조 경험·노하우 있어 데이터 경쟁 유리

현장 데이터 수집으로 SW 강화 노력 필요

국내 로봇 기업 로보티즈가 우즈베키스탄에 법인을 설립하고 초대형 데이터 팩토리 구축에 나선 것은 제조 강점을 지닌 한국이 미국, 중국과 차별화할 수 있는 분야가 바로 '데이터'에 있다고 판단한 것으로 풀이된다.

관계자는 "미국은 소프트웨어 기반 기술이 우수하지만 제조환경이 부족하다 보니 데이터 수요가 큰데 중국에 데이터 위탁을 맡길 수 없어 한국의 데이터가 필요하다"면서 "국내에 이어 우즈베키스탄에 데이터 팩토리 운영을 확대해 글로벌 진출에 적극 나설 것"이라고 말했다.

박일우 산업통상자원부 로봇 PD(프로그램 디렉터)는 "우리 정부는 '맥스(M.AX: '제조'와 '인공지능 전환' 결합) 얼라이언스'를 중심으로 한 생태계 협력을 통해 '휴머노이드 3대 강국'으로 도약하는 것을 목표로 하고 있다"면서 "휴머노이드 로봇 학습을 위한 데이터 확보와 액추에이터·로봇핸드 등 핵심부품 기술력 내재화, 로봇 산업현장 실증 확대 등 다양한 정책을 업계와 논의 중"이라고 말했다.

중국 로봇 공습…'데이터 팩토리'로 방대한 데이터 축적

글로벌 로봇기업들의 '데이터 확보' 전쟁은 치열하다. 중국은 일찌감치 데이터의 중요성을 확인하고, 인공지능(AI) 고도화 필수 요소인 데이터 수집을 위해 전국 7곳에 데이터 팩토리를 구축해 운영 중이다. 중국 정부는 로봇에 활용할 데이터를 모으는 데 국가 역량을 집중하고 있으며, '휴머노이드 로봇 혁신 발전' 정책을 통해 2028년까지 1000개 업종과 100개 세부 업종에 로봇을 전면 도입하겠다는 계획을 밝혔다.

특히 중국 기업들은 '피지컬 AI'라는 말이 확산하기 전부터 자체 데이터 팩토리를 통해 방대한 데이터 수집에 나선 상황이다. 중국 상하이 소재 휴머노이드 로봇 기업 애지봇(AgiBot)은 4000㎡ 이상 규모에 가구, 식당, 산업, 쇼핑몰, 사무실 등을 일정 공간에 세트로 구현하고 이 장소에서 이뤄지는 모든 인간 행위 데이터를 수집·분석해 로봇을 훈련시키고 있다. 실제 환경과 동일한 환경을 구현하고 데이터 수집에 나선 애지봇은 2024년 12월 로봇 AI 모델을 오픈소스로 공개했으며, 회사 설립 3년 만에 전세계 휴머노이드 1위 기업으로 떠올랐다.

전문가들은 앞으로 로봇 업계에서 '현장 데이터 확보 능력'과 '데이터 생성 능력'을 동시에 갖춘 국가와 기업이 주도권을 갖게 될 가능성이 높다고 전망했다. 로봇 데이터는 영상 데이터에 비해 수집 비용이 매우 높고, 축적 속도가 매우 느리다. 또 안전 문제가 뒤따를 뿐만 아니라 환경 다양성을 확보하기 어렵고, 표준화된 데이터 구조가 부족하기 때문에 결국 로봇 데이터를 확보한 기업과 국가가 경쟁력을 갖출 수밖에 없다는 것이다. 로봇 데이터 확보가 구조적으로 어렵고 제약 조건이 많다 보니 최근에는 시뮬레이션, 합성 데이터(Synthetic Data), 월드모델 기반 등을 활용한 데이터 생성 능력이 중요해지고 있다.

김익재 한국과학기술연구원(KIST) AI·로봇연구소장은 "시뮬레이션과 생성 데이터가 중요하지만, 현장의 실제 데이터 확보는 여전히 필수적"이라면서 "특히 물리세계는 마찰, 접촉, 예외 상황, 인간과의 상호작용 등과 같은 복잡한 요소를 포함하고 있기 때문에, 이런 요소들은 가상 환경만으로는 완전히 학습되기 어렵다"고 지적했다.

제조 강점 한국, 역량 축적된 데이터가 핵심 경쟁력

기존 생성형 AI의 발전 과정을 보면 현재 AI 모델들은 여전히 데이터 의존적 구조 위에 설계돼 있는데 대규모 데이터가 학습될수록 성능이 향상되고 일반화 능력이 높아지며 다양한 환경에서도 안정적으로 작동할 수 있다. 김 소장은 "이 점은 피지컬AI에서도 동일하게 적용된다"면서 "데이터를 얼마나 많이 모으는가도 중요하고, 실제 경험을 얼마나 빠르게 학습 가능한 형태로 전환하느냐도 피지컬AI 시대의 핵심과제"라고 강조했다.

미국과 중국이 로봇 산업의 주도권을 위해 각축전을 벌이고 있는 상황에서 제조 강점을 지닌 한국이 차별화할 수 있는 분야 역시 데이터가 될 것이란 의견이다.

손동신 위원은 "실제 산업 현장에서는 로봇이 사람 수준의 엄격한 요건 하에서 작업을 수행할 수 있도록 만드는 데이터가 필요하다"면서 "시뮬레이션으로 생성된 데이터만으로는 현장에서 사람이 능숙하게 일하는 수준을 구현하기 어렵기 때문에 반드시 현장에서 데이터를 확보해야 하며, 다양한 분야에서 제조 경험과 노하우를 축적한 한국이 경쟁력을 찾을 수 있는 분야"라고 내다봤다.

안성원 소프트웨어정책연구소 AI정책연구실장은 "결국 로봇이 수많은 변수에 대응하기 위해선 사전 학습 모델의 경우 얼마나 많은 양의 데이터를 학습했느냐가 중요하다"면서 "중동 등 글로벌 시장을 뚫기 위해 우리가 잘하고 데이터를 많이 가진 제조·금융·의료 분야 특화형 모델을 만들어서 진출해보는 방안을 구체화해야 한다"고 말했다.

서소정 기자



