Hanyang大学融合电子工学部教授Jang Junhyeok研究团队在全球声学人工智能(AI)竞赛“IEEE DCASE 2023 Challenge”的音频生成组中夺得冠军。
Jang教授团队在有来自全球14个团队提交的28个系统参与的“音频生成组”中获得冠军,又在有10个团队提交29个系统参与的“自动音频描述”组中获得亚军。尤其是在音频生成领域所采用的技术,是利用在生成式AI技术中备受关注的扩散模型技术以及代表性的生成模型“GAN(Generative Adversarial Networks,生成对抗网络)”技术进行设计的。团队将这两种技术的优势相结合,不仅生成了高质量音频,还能生成多样化的声音,因此获得了高度评价。
Jang教授团队通过针对多种数据集的实验、引入最新深度学习算法等积极研究,为语音与声学领域的发展作出贡献。由Jang教授主导的语音声学信号处理及机器学习实验室,开展基于深度学习的语音、声学与信号处理等多样研究。该实验室在全球范围内也属罕见的大型研究团队,由25名博士研究生、17名硕士研究生及5名实习生组成。研究人员根据语音识别、语音合成、说话人识别、信号处理等不同研究方向分组开展研究。尤其是在被公认为语音音频AI领域国际顶级学术会议的“ICASSP”和“INTERSPEECH”上发表了多篇论文,证明了实验室的科研实力。此外,实验室还与三星电子、现代汽车等国内一流企业保持沟通,持续推进产学合作项目和研讨会等活动。
目前,全球范围内语音与声学领域AI技术开发研究正如火如荼地展开。要替代人类工作,AI与人类之间的交流沟通是必不可少的。这也是OpenAI、谷歌、微软等全球企业推出并投资类似ChatGPT等数据学习模型的原因。Jang教授表示:“为了迎接明年在首尔举办的语音AI领域国际知名学术会议‘ICASSP 2024’,实验室学生正齐心协力全力投入论文撰写工作”,“今后也将不断努力,快速掌握最新技术趋势,培养不仅在国内、而且在全球范围内都具备竞争力的研究人才。”
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。