[专访] Kwon Sunil Upstage副社长
“不是只会韩语的AI,而是要打造全球前沿级模型”
从海外大科技公司与研究机构延揽人才
“有99%信心跻身‘最终两支队伍’…瞄准初创与学界联合,引导AI生态良性循环”

Upstage副社长Kwon Sunil表示:“公司创立之初的使命是‘让人工智能广泛造福大众(Making AI beneficial)’。通过这次自主AI基础模型开发项目,我们不仅要推进商业化和产品化,还获得了从公益角度进行此类挑战的机会。” 照片由记者Park Yujin提供

Upstage副社长Kwon Sunil表示:“公司创立之初的使命是‘让人工智能广泛造福大众(Making AI beneficial)’。通过这次自主AI基础模型开发项目,我们不仅要推进商业化和产品化,还获得了从公益角度进行此类挑战的机会。” 照片由记者Park Yujin提供

View original image

被选入政府独立人工智能(AI)基础模型开发项目5个团队之一的Upstage,将着手开发可最终扩展到3000亿参数的新AI模型。与Upstage此前推出的“Solar”大语言模型(LLM)相比,这是一个完全不同层级的新模型,目标是达到全球最强模型性能的99%以上。


Upstage副社长Kwon Sunil 13日在首尔江南区驿三洞办公室接受《亚洲经济》采访时强调:“我们的目标并不是像加拉帕戈斯那样,只做一个在韩语方面表现出色的AI”,“真正的‘主权AI’意义在于打造全球前沿级模型,从而掌握技术主导权。”这意味着,不仅仅是提升韩语流利度或拼写准确度,而是要打造具有全球竞争力的模型。


这种理念也如实体现在联盟(Consortium)的构成中。与其他以大型企业为中心的联盟不同,Upstage选择了“AI原生”的初创企业作为合作伙伴。Kwon副社长解释称:“为了与那些可以‘为AI拼命干下去’的企业合作,我们连‘工作文化’都一并考虑后才做出选择。”


具体来看,Upstage主导模型开发,Flitto负责数据收集,Nota负责模型优化,RabbleUp负责图形处理器(GPU)等基础设施。学界方面,由韩国科学技术院(KAIST)和西江大学参与,提供研究开发(R&D)支持。Kwon副社长解释称:“让生态系统得以持续维系非常重要”,“在组建联盟的过程中,我们提议通过这样的构成来共享经验和诀窍。”


通过这一联盟开发的新模型“Solar World Best LLM(WBL)”将采取与现有Solar完全不同的路径。Kwon副社长表示:“此前为了企业间交易(B2B)业务,模型规模受到限制,但这一次的目标是打造性能最强的模型。”也就是说,以前是在能够产生投资回报率(ROI)的范围内有节制地打造模型,而这次则打破这类限制,向最高性能发起挑战。


新模型将沿三个方向推进开发:在知识与智能领域达到全球前沿水平,加强安全性与可信度,以及提升对各类智能体工具(Agent Tool)的适配能力。计划在年底首次竞赛中,以1000亿(100B)参数模型起步,最终分阶段扩展到3000亿(300B)参数规模。


为实现这一雄心勃勃的目标,Upstage也在积极招募海外人才。在被选中的5个联盟中,Upstage是唯一一个在人才领域也获批支持的团队,这正是上述战略的延伸。Kwon副社长解释称:“为了在海外获取曾有类似经验的人才,以及在国内尚未积累诀窍的领域补齐能力,我们积极物色海外人才。”


公司计划引进3名专家,他们分别出身于大学研究室,并拥有在大型信息技术企业(Big Tech)或知名AI初创公司工作的经历。Kwon副社长介绍说:“他们都是AI社区内颇具知名度的人物,在模型结构和训练领域经验十分丰富。”公司还在同步规划项目,以便让他们的经验和诀窍在内部得到充分扩散。


除模型开发和人才引进之外,Upstage强调的另一点是实用性。Kwon副社长表示:“很多企业反馈说,虽然基准测试分数很好,但真正用于产业现场时并不那么理想”,“我们计划为各个领域打造相应的评估数据集并对外公开。”也就是说,目标不是单纯追求更高的基准测试分数,而是打造真正可在产业中应用的模型。


为此,公司将与金融、制造业、国防、公共领域的联盟企业合作,从各领域最优化的数据收集,到验证、评估,全流程共同推进。Kwon副社长解释称:“只有在产业界被实际使用,才能获得有意义的反馈,而这才会转化为全球竞争力。”


支撑这种战略性布局信心的背景,是对全球AI技术差距正在缩小的判断。对于政府提出的、以达到GPT‑5等最新模型95%以上性能为目标的课题,Kwon副社长分析称:“在技术本身的算法和方法论方面,已经相当趋于同质化”,“现在正是有机会追赶上的时间点。”


他也流露出对Upstage自身实力的自信。Kwon副社长表示,在约140名员工中,有70%是AI研发(R&D)人员,并强调说:“从AI人员总量看,可能少于大型企业,但如果只看专注于这一领域的人力,其实并不少。”他还补充说:“在‘ChatGPT时刻(生成式AI走向大众化、整个AI行业投入大语言模型开发竞争的转折点)’之前,我们就已经在自然语言处理(NLP)、自然语言理解(NLU)领域拥有技术和人才,并且从微调到从零开发,整个过程都亲身经历过。”



在年底中期评估临近之际,谈到最终入选的可能性时,Kwon副社长展现出强烈自信,他表示:“公司内部认为‘有99%的可能性’。”他还说:“项目周期并不长,因此既有的诀窍和资产会被大量反映进来,从这一点看,我们准备得很充分。”


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。