네이버, 음성인식 AI에도 ‘하이퍼클로바' 기술 적용
[아시아경제 강나훔 기자] 네이버는 '하이퍼클로바'의 딥러닝 기술을 음성인식 AI(인공지능) 엔진에도 접목해 성능을 대폭 강화했다고 8일 밝혔다.
기존 AI 딥러닝은 데이터와 데이터를 설명하는 '레이블(label)'을 쌍으로 학습시키는 '지도학습(supervised learning)' 방식으로 이뤄져왔다. 예를 들면 고양이 이미지와 '고양이'라는 설명을 같이 학습시키는 식이다.
음성인식 AI를 개발하기 위해서는, 음성과 음성 속 텍스트를 같이 학습시켜야 한다. 이러한 '데이터 레이블링'은 사람의 수작업으로 이뤄지기 때문에 학습데이터 구축에 시간과 비용이 많이 든다.
반면 '자기지도학습(self-supervised learning)'은 레이블 없이 데이터 자체만으로 학습할 수 있는 최신 딥러닝 기법으로 학습의 효율성을 훨씬 높일 수 있다. 이는 네이버가 최근 공개한 초대규모(hyperscale) AI '하이퍼클로바'의 핵심 기술이기도 하다.
네이버는 자기지도학습 기법을 AI 음성인식 엔진 'NEST(Neural End-to-end Speech Transcriber)'에도 적용, 기존 대비 음성인식의 정확도를 약 30% 높였다고 설명했다. 새로운 학습기법 적용으로 음원 데이터 속 텍스트를 확인하는 전사(transcription) 작업을 최소화하면서도 기존보다 정확한 AI 학습이 가능해져, 모델의 학습 시간 및 비용도 획기적으로 단축됐다.
NEST 엔진은 단문 위주의 음성 명령보다 복잡한 장문의 음성 표현을 인식하는데 최적화된 기술로, 네이버가 지난해 4월 처음 공개했다.
업그레이드된 NEST 엔진은 가장 우선적으로 '클로바노트'에 탑재됐다. 네이버가 지난해 말 출시한 음성기록 서비스 클로바노트는 높은 인식률을 바탕으로 사용자들의 호응을 얻고 있다.
꼭 봐야 할 주요 뉴스
"한국은 선진국과 비슷한 움직임"…전 세계 2억320...
네이버는 클로바 케어콜 등 음성인식 AI를 활용한 여러 서비스에 이 엔진을 탑재해 사용자의 편의성을 높인다는 계획이다.
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>