国立釜庆大学人工智能研究所荣获韩国多媒体学会“BEST PAPER AWARD”

Published 05 Dec.2024 11:17(KST)

Updated 02 Aug.2025 12:25(KST)

open/close

国立釜庆大学（校长 Bae Sanghun）人工智能研究所研究团队在韩国多媒体学会 2024 年秋季学术大会本科生论文竞赛中荣获 2 篇“最佳论文奖（BEST PAPER AWARD）”。

国立釜庆大学人工智能研究所研究团队。釜庆大学提供

在近日于济州大学举行的本次竞赛现场评审中，国立釜庆大学人工智能研究所的 Joo Seonguk、Choi Daneyoung、Jeong Yechan 本科生与专职研究员 Kim Chaegyu、韩国电子通信研究院博士 Jeong Jiyoon 团队凭借论文《GradF2M：用于视觉-听觉感官替代的基于可解释人工智能的音乐生成方法》的研究成果，以及国立釜庆大学的 Choi Daneyoung、Jang Yechan、Joo Seonguk 本科生与专职研究员 Kim Chaegyu、韩国电子通信研究院博士 Moon Gyeongdeok 团队凭借论文《利用长短期记忆网络及 Transformer 模型的基于面部表情情感提取的情感音乐生成方法》的研究成果，分别获得“最佳论文奖（BEST PAPER AWARD）”。

这些论文围绕感官置换技术开展研究，即将丧失的感觉器官所获取的信息转换为其他感觉器官可感知的信息并传递给用户，从而实现对信息的感知。两篇论文在视觉到听觉（Visual-to-Auditory，V2A）感官替代方法中，提出了将面部表情转换为情感音乐的生成方法，因而获得了优秀评价。

论文《GradF2M：用于视觉-听觉感官替代的基于可解释人工智能的音乐生成方法》提出，利用情感分类模型从面部表情图像中提取高维情感信息，并将其转换为听觉信息形式的音乐旋律，从而实现信息转换。同时，论文从可解释人工智能（eXplainable AI）中提取用户可以理解的信息，并将其用于调节听觉信息，以此提出提升感官替代识别率的方案。

论文《利用长短期记忆网络及 Transformer 模型的基于面部表情情感提取的情感音乐生成方法》利用长短期记忆网络（Long Short-Term Memory）及 Transformer 模型，在从面部表情中提取出的情感旋律基础上生成情感音乐，并通过调节节奏、调性等音乐属性，以增强在“喜悦”和“悲伤”两种情感上的音乐表达与传达效果。该研究提出情感音乐生成不仅可应用于人类，也具有在机器人和动物领域的应用可能性，因此被认为有望为今后情感识别与交互技术的发展作出贡献。

在国立釜庆大学人工智能研究所专职研究员 Kim Chaegyu 的研究室，本科生参与了多种研究项目，撰写程序代码、研究论文和专利说明书等，并通过技术开发积累研究经验，获得了宝贵的实践机会。