본문 바로가기
Dim영역

ETRI, 4개 국어 언어음성 DB 국내 첫 배포

스크랩 글자크기

글자크기 설정

닫기
인쇄 RSS
[아시아경제 강희종 기자]한국전자통신연구원(ETRI)은 4개 국어 대화체 음성 데이터베이스(DB) 총 36만 문장 및 한국어 대역 총 20만 문장을 산업체 및 학계 등에 배포한다고 30일 밝혔다.

이번에 배포하는 음성DB는 독일어, 러시아어, 아랍어, 베트남어 대화체다. 언어음성 DB는 음성인식 분야와 언어번역 분야의 SW 개발이나 음성언어처리 연구의 기초 데이터로 사용된다. 태블릿PC나 내비게이션, 스마트폰, 전자사전, 지능형 로봇 분야에 활용된다.
언어음성 DB는 여행이나 관광, 어학 분야 소프트웨어(SW)에 활용된다. 음성리모콘제조사, 외국어 교육 업체, 자동통번역 서비스업체, 자동차 및 내비게이션 제조사, 포탈업체 등에 유용할 것으로 보인다.

이번 DB 배포는 지난 2011년부터 2016년까지 미래창조과학부가 NIA(한국정보화진흥원)를 통해 추진하는 국가DB사업 중 하나인 '스마트 모바일용 다국어 언어음성DB' 구축사업의 일환으로 진행됐다.

ETRI가 이번에 배포하는 DB는 ▲독일어, 러시아어, 아랍어, 베트남어 대화체 음성DB ▲한국어-독일어, 한국어-러시아어, 한국어-아랍어, 한국어-베트남어 대화체 대역문장DB 등 8종의 언어음성 DB다.
그동안 음성DB를 이용한 상용제품들은 국가DB사업에서 구축한 자료를 이용해 국내 기술로 자체개발한 부분도 있으나, 국내 DB가 없는 경우 외국에서 개발한 음성인식 및 번역엔진을 도입해 탑재하는 형편이었다.

유럽언어자원협회(ELRA) 등 해외로부터 일부 외국어 DB 구입이 가능하나, 300~500명이 발화한 음성DB의 경우 1~2억원 정도의 비용이 소요된다. 이에 반해, ETRI가 제공하는 4개국어 음성DB는 발화 인원수도 총 2400명에 달하며 가격면에서도 해외DB대비 5~10% 수준으로 중소기업에 제공한다.

ETRI는 현재까지 국내 57개 기관에 247개 DB를 배포, 총 430억원에 해당하는 비용 절감 성과를 얻었다. ETRI는 이번에 배포하는 8종의 DB를 국내 10개 기관에 배포할 경우 최소 120억원의 수입대체 효과를 얻을 수 있다고 설명했다.

그동안 ETRI가 배포한 DB업체로는 삼성전자, LG전자, KT, 네이버, 카카오, 보이스웨어, 쓰리소프트, 인피니티텔레콤, 디오텍, 시리우스소프트, 시스트란 인터내셔널, 솔트룩스 등이 있다.

한편, ETRI가 현재 배포중인 DB목록은 총 37개 자료로 음성 2300시간, A4기준 텍스트는 2만 8천면에 달한다. 이에 관한 자료는https://astc.etri.re.kr/tcenter/db/db_form.jsp를 참고하면 된다.



강희종 기자 mindle@asiae.co.kr
AD

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

함께 본 뉴스

새로보기

이슈 PICK

  • [포토] 외국인환대행사, 행운을 잡아라 영풍 장녀, 13억에 영풍문고 개인 최대주주 됐다 "1500명? 2000명?"…의대 증원 수험생 유불리에도 영향

    #국내이슈

  • "화웨이, 하버드 등 美대학 연구자금 비밀리 지원" 이재용, 바티칸서 교황 만났다…'삼성 전광판' 답례 차원인 듯 피벗 지연예고에도 "금리 인상 없을 것"…예상보다 '비둘기' 파월(종합)

    #해외이슈

  • [포토] '공중 곡예' [포토] 우아한 '날갯짓' [포토] 연휴 앞두고 '해외로!'

    #포토PICK

  • 현대차 수소전기트럭, 美 달린다…5대 추가 수주 현대차, 美 하이브리드 月 판매 1만대 돌파 고유가시대엔 하이브리드…르노 '아르카나' 인기

    #CAR라이프

  • 국내 첫 임신 동성부부, 딸 출산 "사랑하면 가족…혈연은 중요치 않아" [뉴스속 용어]'네오탐'이 장 건강 해친다? [뉴스속 인물]하이브에 반기 든 '뉴진스의 엄마' 민희진

    #뉴스속OO

간격처리를 위한 class

많이 본 뉴스 !가장 많이 읽힌 뉴스를 제공합니다. 집계 기준에 따라 최대 3일 전 기사까지 제공될 수 있습니다.

top버튼