본문 바로가기
Dim영역

[LAB을 찾아서]음성·음향 인공지능 기술 선도…장준혁 한양대 교수 연구팀

뉴스듣기 스크랩 글자크기

글자크기 설정

닫기
인쇄 RSS

장준혁 한양대 융합전자공학부 교수 연구팀이 세계 음향 인공지능(AI) 챌린지인 ‘IEEE DCASE 2023 Challenge’ 오디오 생성 부문에서 우승을 차지했다.


장준혁 한양대 교수(맨 왼쪽)와 음성음향신호처리 및 머신러닝 연구실 구성원들.[사진제공=한양대]

장준혁 한양대 교수(맨 왼쪽)와 음성음향신호처리 및 머신러닝 연구실 구성원들.[사진제공=한양대]

AD
원본보기 아이콘

장 교수팀은 전 세계 14개 팀이 28개 시스템을 제출한 '오디오 생성부문'에서 우승을, 10개 팀이 29개 시스템을 선보인 '자동 오디오 캡셔닝' 부문에서 준우승을 각각 차지했다. 특히 오디오 생성 분야에서 사용한 기술은 생성형 AI 기술에서 떠오르고 있는 디퓨전 기반의 기술과 대표적인 생성 모델인 'GAN'(Generative Adversarial Networks) 기술을 활용해 설계했다. 두 기술의 장점을 조합해 단순히 높은 품질의 오디오뿐 아니라 다양한 소리를 생성해 높은 평가를 받았다.

장 교수팀은 다양한 데이터 세트에 대한 실험, 최신 딥러닝 알고리즘 도입 등 활발한 연구를 통해 음성·음향 분야 발전에 힘쓰고 있다. 장 교수가 이끄는 음성음향신호처리 및 머신러닝 연구실은 딥러닝 기반의 음성, 음향, 신호처리 등 다양한 연구를 수행한다. 세계적으로도 보기 드문 대규모 연구실로 박사과정 25명과 석사과정 17명, 인턴 5명으로 구성돼 있다. 이들은 음성인식, 음성합성, 화자인식, 신호처리 등 연구 분야에 따라 팀을 이뤄 연구를 진행한다. 특히 음성 오디오 AI 분야의 국제 최정상 학술대회로 인정받는 'ICASSP', 'INTERSPEECH'에 다수의 논문을 게재함으로써 연구실의 역량을 입증했다. 이밖에 삼성전자, 현대자동차 등 국내 유수 기업들과 소통하며 산학과제, 세미나 등을 꾸준히 진행하고 있다.


현재 세계적으로 음성·음향 분야 AI 기술 개발 연구가 활발히 이뤄지고 있다. 인간의 일을 대체하기 위해서는 AI와 인간과의 커뮤니케이션이 필수이기 때문이다. 오픈AI, 구글, 마이크로소프트 등 글로벌 기업들이 챗GPT와 같은 데이터 학습 모델을 선보이고 투자하는 이유다. 장 교수는 "내년 서울에서 개최되는 음성 AI 분야의 국제 저명 학회 ‘ICASSP 2024’를 위해 연구실 학생들이 의기투합해 논문 작업에 매진하고 있다"며 "앞으로도 최신 기술 트렌드를 빠르게 습득하고, 국내뿐 아니라 세계적으로도 경쟁력을 갖춘 연구자를 배출하는 연구실로서 끊임없이 노력할 계획"이라고 말했다.




임춘한 기자 choon@asiae.co.kr
AD

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

함께 본 뉴스

새로보기

이슈 PICK

  • 하이브, 어도어 이사회 물갈이…민희진은 대표직 유임 (상보) 김호중 검찰 송치…음주운전·범인도피교사 혐의 추가 [포토] 북한탄도미사일 발사

    #국내이슈

  • 트럼프 "나는 결백해…진짜 판결은 11월 대선에서" "버닝썬서 의식잃어…그날 DJ는 승리" 홍콩 인플루언서 충격고백 안개 때문에 열차-신호등 헷갈려…미국 테슬라차주 목숨 잃을 뻔

    #해외이슈

  • [포토] 일주일 앞으로 다가온 현충일 [이미지 다이어리] '예스키즈존도 어린이에겐 울타리' [포토] 시트지로 가린 창문 속 노인의 외침 '지금의 나는 미래의 너다'

    #포토PICK

  • 베일 벗은 지프 전기차…왜고니어S 첫 공개 3년간 팔린 택시 10대 중 3대 전기차…현대차 "전용 플랫폼 효과" 현대차, 中·인도·인니 배터리 전략 다르게…UAM은 수소전지로

    #CAR라이프

  • [뉴스속 용어]심상찮은 '판의 경계'‥아이슬란드서 또 화산 폭발 [뉴스속 용어]한-UAE 'CEPA' 체결, FTA와 차이점은? [뉴스속 용어]'거대언어모델(LLM)' 개발에 속도내는 엔씨소프트

    #뉴스속OO

간격처리를 위한 class

많이 본 뉴스 !가장 많이 읽힌 뉴스를 제공합니다. 집계 기준에 따라 최대 3일 전 기사까지 제공될 수 있습니다.

top버튼