[走进LAB]引领语音与声学人工智能技术…Hanyang大学Jang Junhyuk教授团队

by Lim Chunhan

Published 08 Dec.2023 07:00(KST)

Hanyang大学融合电子工学部教授Jang Junhyeok研究团队在全球声学人工智能（AI）竞赛“IEEE DCASE 2023 Challenge”的音频生成组中夺得冠军。

最左侧为汉阳大学教授 Jang Junhyeok 与语音声学信号处理及机器学习研究室成员。汉阳大学提供

Jang教授团队在有来自全球14个团队提交的28个系统参与的“音频生成组”中获得冠军，又在有10个团队提交29个系统参与的“自动音频描述”组中获得亚军。尤其是在音频生成领域所采用的技术，是利用在生成式AI技术中备受关注的扩散模型技术以及代表性的生成模型“GAN（Generative Adversarial Networks，生成对抗网络）”技术进行设计的。团队将这两种技术的优势相结合，不仅生成了高质量音频，还能生成多样化的声音，因此获得了高度评价。

Jang教授团队通过针对多种数据集的实验、引入最新深度学习算法等积极研究，为语音与声学领域的发展作出贡献。由Jang教授主导的语音声学信号处理及机器学习实验室，开展基于深度学习的语音、声学与信号处理等多样研究。该实验室在全球范围内也属罕见的大型研究团队，由25名博士研究生、17名硕士研究生及5名实习生组成。研究人员根据语音识别、语音合成、说话人识别、信号处理等不同研究方向分组开展研究。尤其是在被公认为语音音频AI领域国际顶级学术会议的“ICASSP”和“INTERSPEECH”上发表了多篇论文，证明了实验室的科研实力。此外，实验室还与三星电子、现代汽车等国内一流企业保持沟通，持续推进产学合作项目和研讨会等活动。

必读新闻

100万亿恐打水漂…“三星罢工成史上级利好” 价格暴涨20%市况大乱 [台湾芯片通信]

目前，全球范围内语音与声学领域AI技术开发研究正如火如荼地展开。要替代人类工作，AI与人类之间的交流沟通是必不可少的。这也是OpenAI、谷歌、微软等全球企业推出并投资类似ChatGPT等数据学习模型的原因。Jang教授表示：“为了迎接明年在首尔举办的语音AI领域国际知名学术会议‘ICASSP 2024’，实验室学生正齐心协力全力投入论文撰写工作”，“今后也将不断努力，快速掌握最新技术趋势，培养不仅在国内、而且在全球范围内都具备竞争力的研究人才。”

한글 기사 보기

本报道由人工智能(AI)翻译技术生成。

[走进LAB]引领语音与声学人工智能技术…Hanyang大学Jang Junhyuk教授团队

必读新闻

不容错过的热点