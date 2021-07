[아시아경제 조슬기나 기자] 모바일 기기에서도 인공지능(AI) 학습방식인 '심층 강화학습'(DRL)을 처리할 수 있도록 하는 반도체 칩을 국내 연구진이 개발했다. 앞서 구글 딥마인드가 개발한 바둑 AI 프로그램 '알파고'에 적용됐던 AI 학습방식과 동일하다.

과학기술정보통신부는 한국과학기술원(KAIST) 유회준 교수 연구팀이 이 같은 내용의 AI 반도체 기술 '옴니DRL(omniDRL)'을 개발했다고 16일 밝혔다.

심층 강화학습은 인간이 미리 만든 데이터-정답 쌍을 활용해 AI를 학습시키는 ‘지도학습’과 달리 AI가 주어진 환경에서 시행착오로 얻어진 경험을 활용해 스스로 최적의 답안을 도출하면 인간이 그 결과에 대한 피드백을 주는 방식으로 이뤄진다. 신경망이 복잡하게 얽혀 있고 대규모 데이터를 처리해야 해 대용량 메모리를 가진 고성능 컴퓨터 여러 개를 병렬해야만 구현할 수 있었다. 이 때문에 연산 능력이 제한적인 스마트폰 등 모바일 기기에서는 심층 강화학습을 구현하기 어려웠다.

이에 연구진은 신개념 반도체(PIM)를 사용해 모바일 기기에서도 사용할 수 있는 심층 강화학습 가속기 반도체 칩을 개발했다. 기존 반도체보다 압축률을 높여 데이터 이동 속도를 높였고, 데이터 압축 상태에서도 해제 없이 연산이 가능하다. 또한 연산(프로세서)·저장(메모리) 기능이 통합된 SRAM(Static RAM) 기반의 PIM(Processing-In-Memory) 반도체 기술 등을 사용했다.

특히 기존 PIM 반도체는 정수 단위만 연산이 가능했지만, 이번 연구를 통해 세계 최초로 소수점 기반 연산이 가능한 기술을 개발했다. ‘OmniDRL’을 심층 강화학습 알고리즘의 성능 비교 연구에 주로 활용되는 ‘인간형 로봇 적응 보행 시스템’에 적용한 결과, ‘OmniDRL’이 연결되지 않았을 때보다 7배 이상 빠른 속도로 적응 보행이 가능했다고 연구진은 설명했다.

유 교수는 "이번 연구는 한 개의 반도체에서 심층 신경망을 높은 압축을 유지한 상태로 추론 및 학습을 가능하게 했으며, 특히 불가능이라 여겨졌던 소수점 연산이 가능한 인공지능 반도체 기술을 개발했다는 점에서 의미가 크다"면서 "향후 지능형 로봇 조종, 자율주행 드론, 게임 등 다양한 분야에 응용이 가능할 것"으로 기대했다.

송경희 과기정통부 인공지능기반정책관은 "지난해 착수한 1조원 규모의 인공지능 반도체 연구개발을 지속 지원하는 한편, 내년부터 4000억원 규모의 PIM 반도체 기술 개발 사업을 본격적으로 추진하는 등 인공지능 반도체 분야에 대한 투자를 지속 확대해 나갈 계획"이라고 밝혔다.

이번 연구는 지난 6월14~19일 개최된 반도체 분야 최고 학회 중 하나인 'IEEE VLSI 기술 및 회로에 대한 심포지엄'에서 발표됐다. 200여편의 발표 논문 중 우수 논문인 하이라이트 논문으로도 선정됐다.

조슬기나 기자 seul@asiae.co.kr