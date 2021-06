[아시아경제 구은모 기자] 과학기술정보통신부와 한국지능정보사회진흥원(NIA)은 지난 18일 총 170종 중 60종 데이터 개방 후, 데이터셋 품질검증과 사전검토 보완조치를 완료한 인공지능(AI) 학습용 데이터 110종을 25일부터 순차 개방한다고 밝혔다.

과기정통부는 110종의 데이터 중 44종을 인공지능 통합 플랫폼 ‘AI 허브’에 25일부터 27일까지 개방할 예정이며, 이번에 개방하는 데이터는 한국어 강의음성, 동의보감 약초이미지, 생활페기물 이미지 등이다. 이후 헬스케어 데이터를 포함한 66종의 데이터가 오는 30일에 개방되면 지난해 구축한 170종의 모든 데이터 개방이 완료된다.

과기정통부는 데이터 개방 후에도 더 나은 데이터 제공을 위한 오는 9월까지 이용자 참여 집중개선기간 운영을 통해 요구사항을 적극적으로 반영하고, 데이터 품질을 지속적으로 관리·개선해 AI 혁신 성과가 창출될 수 있도록 노력해나갈 예정이다.

앞서 과기정통부와 NIA는 지난 18일 AI 학습용 데이터 170종을 AI 허브를 통해 순차적으로 개방한다고 밝혔다. 디지털 뉴딜의 주요 프로젝트인 '데이터 댐' 구축의 일환으로 추진되는 AI학습용 데이터 구축 사업은 AI 성능을 개선하는 데 필요한 데이터를 정부가 직접 대량 구축해 누구나 활용할 수 있게 한 사업이다.

이번 개방으로 AI 산업계가 활용할 수 있는 학습용 데이터의 양이 대폭 늘어나게 됐다. 분야 별로는 음성·자연어(한국어 방언 등 39종), 헬스케어(암진단 영상 등 32종), 자율주행(도로주행영상 등 21종), 비전(스포츠 동작 영상 등 15종), 국토환경(산림수종 이미지 등 12종), 농축수산(가축행동 영상 등 14종), 안전(노후 시설물 이미지 등 19종), 기타(패션상품 이미지 등 18종) 등 8개 분야 170종(4억8000만건)이다.

구은모 기자 gooeunmo@asiae.co.kr