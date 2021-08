[아시아경제 영남취재본부 이상현 기자] 창원대학교는 벤처기업인 '데이터리(Data.ly)'가 문화체육관광부 국립국어원의 ‘2021년 국립국어원 개체명 분석 및 개체 연결 말뭉치 연구분석사업’에 선정됐다고 26일 밝혔다.

데이터리는 인공지능 분야의 딥러닝 학습에 필요한 데이터를 생성, 관리, 가공, 보급하는 전문기업이다.

주관기관 데이터리와 참여기관인 한림대학교의 협업으로 진행되며, 올해 총 6억400만원을 지원받아 수행하게 된다.

2019년부터 3년간 국립국어원 개체명 구축 및 분석 사업에 참여한 경험을 바탕으로 개발한 고성능의 도구와 프로세스를 이용해 과제의 진행, 총괄 관리를 맡는다.

개체명 사업은 빅데이터 활용 및 인공지능 학습에 필요한 국어 자원을 구축하고, 그 과정에서 국내 표준화 및 참조, 평가 기반이 될 수 있는 자료들을 생성해 배포함으로써 공공의 이익에 이바지하는 데 목적을 둔다.

개체명 분석 데이터는 자연어 처리 데이터 중 가장 활용도가 높은 데이터로, 구축된 대용량 개체명 말뭉치는 실제 기업이나 연구소에서 인공지능 산업 연구 및 개발을 위해 다용도로 사용될 예정이다.

특히 민간에서도 쉽게 활용이 가능한 고품질의 개체명 지침 및 사전 수립 작업으로까지 이어질 전망이다.

데이터리 차정원 대표는 "이번 국립국어원 개체명 사업을 통해 4차 산업혁명을 대비하는 인공지능 기술 개발과 활용을 위한 대규모 말뭉치 분석과 활용으로 국어 자원 활용도와 가치 제고가 이뤄질 것"이라고 말했다.

