[Power K-Woman]“AI热潮来了……别去追未来,要提前在那儿等着”
AI初创公司Upstage首席科学官 Park Eunjung:
在Naver开发AI敬语翻译,后共同创立Upstage
即使是从未走过的路也要大胆迈步向前
“要描绘的不是以现在为基准,而是1年后、10年后的未来”
“与其追着未来跑,不如先去到未来即将到来的地方。”
在新技术层出不穷的人工智能产业中,Upstage是一家比任何人都行动更快的企业。掀起生成式人工智能热潮的OpenAI一公开ChatGPT开发工具,它立刻将其接入KakaoTalk和LINE提供服务。随着作为ChatGPT对抗力量的开源大规模语言模型崛起,该公司凭借自研模型在全球开源大模型排行榜中夺得第一。去年9月,在组建大模型专门团队仅一个月后,又开发出了自有模型“Solar”。公司的成长速度与技术研发速度一样迅猛。由3名出身Naver的开发者在2020年共同创立的公司,不到3年员工就增至160人。
Park Eunjung是Upstage的首席科学官之一,也是三位联合创始人之一。她谦虚地表示是“未来自己走到了我所在的地方”,但实际上是她先看见了未来并提前做好准备。在围棋人工智能AlphaGo引发热潮之前,她就已从事人工智能起点——数据挖掘研究。如今已成为人工智能主权核心的韩语研究,在无人问津之时,她开发了韩语敬语翻译。即便是无人涉足的道路,她也果断迈出步伐,这一步步足迹将她引向了未来。
着眼未来大胆下注……冷门的韩语数据研究
Park CSO开始数据挖掘研究是在研究生时期。数据挖掘是从数据中发现隐藏的模式和关系,从而获取有价值信息的过程。她被“从数据这一原石中开采出钻石般洞见”这一点深深吸引。她以半导体工艺数据中检测不良晶圆、基于企业公告资料预测股价等课题为对象,运用机器学习进行研究。机器学习是利用海量数据预测下一步将发生什么的技术,是人工智能的一个分支。随着对数据的不断深挖,Park CSO直觉地认为人工智能将撼动世界。通俗来讲,人工智能就是输入数据,构建一个能把某项工作做得很好的函数。虽然原理相对简单,但应用场景却极其广泛。就在她完成博士课程之际,AlphaGo战胜了九段棋手Lee Sedol,她的直觉由此转变为笃定的信念。
Park CSO一向会对自己笃信的事大胆下注。Python开发者的盛会PyCon第一次在韩国举办时,她推出了KoNLPy。这是一款帮助计算机理解韩语数据的分析工具。当时Python还是几乎无人使用的编程语言,韩语也同样是几乎没人关注的非主流语言。Park CSO表示:“用过Python后觉得太方便了,判断它未来一定会成为主流语言。思考问题不能只以现在为基准,而要去想一年后、十年后会变成什么样,只有这样才能身处未来所在之地。”KoNLPy至今仍是人工智能开发者广泛使用的程序。在加入Upstage的开发者当中,甚至有人正是因为这款程序而选择入职。
她对韩语数据的关注在2016年将她带到了Naver。她收到了在Naver负责人工智能翻译的Papago团队负责人的邀请。当时Park CSO正专注于让计算机理解人类语言的自然语言处理(Natural Language Processing)。她也由此投身于自然语言处理领域中被视为“花朵”的翻译服务。即便收到了全球信息技术企业的邀约,她仍选择了Naver,因为她想真正处理一次韩语。
在Naver,她开发了敬语翻译功能。她判断,由于人工智能无法正确处理韩语特有的敬语体系,导致翻译质量下降。最初几年几乎是接连不断的失败。从主语敬语、宾语敬语等语法到“해요体”、“하게体”等等级体系,要用简单函数来表达如此复杂的敬语系统极其困难。Park CSO却在出人意料的简单方法中找到了突破口。她舍弃了复杂的语法和表达,而是像二进制一样划分敬语。她让人工智能学习,只要句子中包含“니다”这一结尾,就判断为敬语,否则就是非敬语。同时,她还在翻译器中增加了一个开关,打开开关就以敬语形式进行翻译。Park CSO表示:“相比复杂炫目的技术,我在简单却有冲击力的技术中找到了答案。我也由此学到,关键不在于产出多么复杂的output,而在于创造出真正有实质价值的outcome。”
“人工智能将改变世界……目标是为所有人提供人工智能”
在Naver站稳脚跟后,她于2020年突然决定挑战创业。当时在Naver总管人工智能开发的Upstage代表Kim Sunghun,以及负责视觉人工智能“CLOVA”的Upstage首席技术官Lee Hwalseok,与她走到了一起。三位开发者如同“桃园结义”般立下誓言,要用人工智能改变世界。他们的目标不再是为Naver的某个特定服务打造技术,而是将人工智能技术本身商业化。Park CSO回忆称:“人工智能对世界产生巨大影响已是板上钉钉。那么我们要做的,就是让更多人能用上人工智能。”
即便集结了“复仇者联盟”级别的开发者,创业也并不轻松。一旦离开了什么都配备齐全的大企业,创业者就必须一人身兼数职。Park CSO负责起人事工作,CTO Lee甚至连财务也一并承担。她作为CSO的本职角色,与在Naver担任技术负责人时已完全不同。她不仅要制定技术战略,还必须从产品和公司经营的角度做出决策。每当遇到问题,只能亲自上阵,在碰撞中学习。在这一过程中,她学会了如何汇总多方意见并设定前进方向。她表示:“我亲身经历了一家公司从零到一的A到Z全过程,(虽然我没有孩子)但也时常想,这大概就是养育孩子的感觉吧。”
与Park CSO一同,公司也步入了成长轨道。他们首先将企业客户作为目标,推出“AI Pack”服务。无论是从文档图片中提取所需信息,还是个性化推荐系统等,企业都可以按需定制人工智能性能和应用范围。公司已将三星生命、韩华生命、浦项制铁等大型企业发展为客户。今年被定为解决方案销售元年,他们的目标是实现盈亏平衡点。上个月,公司推出了自研大模型Solar,仅利用企业内部数据以提升安全性,并尽量将把错误信息当作事实输出的“幻觉”现象降到最低。Park CSO表示:“我们要像微软普及个人电脑那样,成为普及人工智能的公司。从企业客户起步,今后希望打造连奶奶都能使用的人工智能模型。”
Park CSO还认为,人工智能也将为其他女性开发者带来机遇,因为这一领域相对可以在更灵活的工作环境中工作。Upstage自公司创立起就实行100%远程办公。现实中女性开发者比例仍低于男性,但她期待未来会出现更多像Ada Lovelace那样的榜样。Ada Lovelace是1815年出生于英国的女性,被誉为世界上第一位计算机程序员。她建议说:“希望有更多女性进入这一领域。只有从未来视角思考问题,并经历大量失败,才能走向成功。”
▶关于Park Eunjung CSO
2004年,她在首尔大学主修工业工程,并在首尔大学研究生院数据挖掘领域获得硕士和博士学位。从2016年起,她加入Naver Papago团队,开发包括敬语翻译在内的多项功能。2021年,她被全球科技媒体《麻省理工科技评论》评为韩国35岁以下顶尖创新者。2022年,她创立人工智能专业企业Upstage,出任首席科学官。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。