发布全新开发的AI模型开源代码
升级韩语特化大语言模型
以自主模型应对政府“主权AI”方针

KT表示,将于3日通过人工智能开发者平台 Hugging Face 公开其以“韩国式人工智能”哲学自主研发的语言模型“믿:음 2.0”的开源代码。照片为KT技术创新部门研究人员在瑞草区KT牛眠研究中心测试“믿:음 2.0”的场景。照片由KT提供

KT表示,将于3日通过人工智能开发者平台 Hugging Face 公开其以“韩国式人工智能”哲学自主研发的语言模型“믿:음 2.0”的开源代码。照片为KT技术创新部门研究人员在瑞草区KT牛眠研究中心测试“믿:음 2.0”的场景。照片由KT提供

View original image

KT将把自主开发的韩语特化大语言模型(LLM)“믿:음 2.0”以开源形式正式公开。这被视为顺应国内“主权型人工智能(Sovereign AI)”方针的举措。有分析认为,此前一直暗示以与大型信息技术企业(Big Tech)合作为主战略的KT正在修正路线,开始配合近期政府的人工智能独立战略,提高自主开发模型的利用度。


KT于3日宣布,将通过旗下生成式人工智能研究组织Gen AI Lab(젠 AI랩),把新开发的믿:음 2.0发布在全球开源平台HuggingFace上。本次开放的模型任何人都可不受限制地用于商业用途,分为两种规格:参数规模为115亿的“믿:음 2.0 Base”和参数规模为23亿的“믿:음 2.0 Mini”。该模型同时支持韩语和英语。


믿:음 2.0是继KT于2023年推出的1.0版本之后的下一代模型,其特点是在参数规模、训练数据以及韩语处理能力等方面进行了全面升级。KT称,与既有版本相比,新模型的通用性和性能大幅提升。


KT强调,此次公开不仅是单纯的技术共享,更是基于“韩国式人工智能”这一理念,旨在推广能够深刻理解韩语及韩国社会语境的模型。实际上,该模型在与高丽大学共同开发的韩语特化评测指标“Ko-Sovereign(韩语主权指标)”中,展现出优于国内外开源模型的性能。


此举被认为预示着KT人工智能政策方向的变化。近期,政府将主权型人工智能作为核心政策基调,强调在国家层面强化人工智能竞争力,有舆论认为,KT也因此开始重新加大对自主人工智能模型对外扩散和应用的投入。KT此前一直将与微软(Microsoft,MS)等大型科技企业的合作视为重点。据悉,KT内部长期占主导的判断是,“与其自主开发,不如充分利用大型科技企业的技术实力提升附加价值更为现实”。不过,KT也曾推出自主大语言模型믿:음的首个版本,并在HuggingFace上短暂公开过“믿:음 7B(70亿参数)模型”,但数月后又转为非公开。由于这类相对消极的运营方式,业界一直评价其进展“迟缓”。


此次公开的믿:음 2.0学习了文学、法律、专利、辞典等多种韩语特化数据,具备高精度和强语言理解力是其一大特点。KT开发了自主分词器,使其对韩语结构进行了最优化处理,同时对版权问题进行管理,从而提升了模型的伦理性和透明度。此外,在开发阶段,KT与初创企业Rebellions紧密合作,对模型在国产人工智能芯片上的运行进行了优化;并与Friendly AI携手,在限定时间内通过HuggingFace向用户提供无需额外安装即可免费体验的环境。


KT Gen AI Lab负责人、首席人工智能创新官(CAIO)Shin Donghoon表示:“믿:음 2.0是在具备一般生成能力的同时,能够深刻理解韩国语言和文化的高度化模型,将为国内用户提供切实可行的替代方案,并成为获取全球竞争力的跳板。”



KT计划以此次公开为起点,与微软协作,陆续推出反映韩国式思维的GPT-4基础模型等产品。在由民营企业主导构建人工智能生态系统的同时,KT还将与政府在发展方向上进行更为精细的协调。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点