ChatGPT 已打入学术论文领域……“韩国生物医学论文 20% 留有 AI 痕迹”
韩中等非英语国家使用论文写作LLM比例高
论文写作LLM使用量持续增长
有分析指出,去年国内研究者发表的生物医学领域论文中,有五分之一得到了ChatGPT等大型语言模型(LLM)的帮助。8日,联合通讯社援引德国蒂宾根大学Dimitri Kobak博士研究团队近期在国际学术期刊《Science Advances》上发表的研究报道称,国内研究者发表的生物医学论文中,有20%被推断为得到了LLM的帮助。
研究团队分析了从2010年至2024年登记在美国国家医学图书馆(NLM)论文数据库“PubMed”中的1500多万篇生物医学论文摘要,通过考察LLM偏好用词的占比来判断是否使用了LLM。结果显示,在摘要中使用的2万6657个单词中,包括“delves”(调查)、“underscores”(强调)等平时较少使用的词,以及“potential”(可能性)、“findings”(研究结果)等LLM偏好的454个单词,其使用频率在2024年急剧上升。研究团队表示,以这些词汇为基础推算,2024年有13.5%的论文摘要疑似是借助LLM撰写的。
从国家来看,英国、澳大利亚等英语国家的比例约为5%,而韩国、中国、台湾则高达20%左右。对此,研究团队分析称,在韩国等非英语国家,LLM很可能被作为英文校对工具等实用工具来使用;而在英语国家,研究者会对LLM推荐的表述进行润色,从而在形式上留下的痕迹较少。
围绕AI相关伦理监管等的学界讨论尚处起步阶段
从期刊来看,《Nature》《Science》《Cell》等顶级期刊论文的比例约为7%,《Nature》子刊约为10%,相对较低;但被质疑为“可疑期刊”的瑞士出版企业MDPI旗下期刊的论文比例则高达21%。整体上看,所谓期刊“质量”越高,LLM使用频率越低。在国家与期刊的交叉分析中,刊登在MDPI期刊《Sensors》上的韩国论文中,有34%被推断使用了LLM,这一比例属于较高水平之一。
研究团队还表示,LLM对生物医学领域论文的影响甚至大于新冠肺炎出现所带来的影响,鉴于这一趋势,有必要重新评估在科学论文中使用LLM的相关政策和规范。学界在生成式AI出现后,利用LLM撰写论文的趋势正在增加,但围绕相关伦理规范和监管的讨论仍处于初级阶段。
据《Nature》近日对5229名研究者进行的问卷调查结果显示,90%的研究者表示可以接受使用生成式AI对论文进行编辑或翻译,但其中55%认为应当明确标注AI的使用,或需要对翻译进行核实。仅有33%的研究者认为论文摘要中不应使用AI;认为只要明示使用AI即可使用的研究者占45%,认为可以自由使用的研究者为23%。与论文正文的引言或结论等部分相比,针对概括论文内容的摘要部分,更多研究者认为可以允许使用AI。不过,真正表示自己曾在论文写作中实际使用过AI的研究者仅占28%,整体上仍存在较强的使用顾虑。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。