Scale AI联合创始人Alexander Wang
投身数据标注初创企业
20多岁中期缔造个人资产“1万亿韩元”神话

在训练人工智能(AI)时,最重要的要素是数据。但并不是任何数据都能成为“训练用数据”。需要对数据进行筛选和“精炼”,使之真正有利于训练。这一过程通常被称为“数据标注”。


数据标注即便没有特别的AI相关职能能力,也能比较容易上手。相应地,由于需要处理的数据显示量极其庞大,因此对人手的需求非常大。


这也是它被称为计算机产业中的“给玩偶粘眼珠子”的原因。不过,也有在这类“给玩偶粘眼珠子”生意中早早入局,并把个人资产做大到1万亿韩元规模的20多岁青年。


19岁创立数据公司的 Alexander Wang

Scale AI 创始人 Alexander Wang [图片来源=YouTube 截图]

Scale AI 创始人 Alexander Wang [图片来源=YouTube 截图]

View original image

今年5月,硅谷初创企业 Scale AI 获得了10亿美元投资。虽然尚未上市,Scale AI 的企业估值目前被推测为138亿美元,其联合创始人兼首席执行官(CEO)Alexander Wang 的个人资产被认为已接近1万亿韩元。


Wang 在2016年、年仅19岁时创立了 Scale AI。此后仅用8年时间,便成长为掌控全球业务的20多岁亿万富翁,也因此获得了“利用AI积累财富的第一代技术企业家”这一荣耀头衔。


发达国家开发者+发展中国家兼职,拿下标注生意

如前所述,Scale AI 是一家负责处理数据标注业务的公司。Meta、Google、DeepMind、OpenAI 等全球知名AI巨头都与 Scale AI 签署了业务合作谅解备忘录。


尤其是,Scale AI 主攻的领域是与计算机视觉相关的数据标注。这一定位与公司立足行业初期主要面向自动驾驶AI开发企业提供服务的经历有关。


数据标注示例。若要让计算机视觉识别汽车,先在图像中的汽车上进行人工标记会更为便捷。图片来源 Scale AI 官网供图

数据标注示例。若要让计算机视觉识别汽车,先在图像中的汽车上进行人工标记会更为便捷。图片来源 Scale AI 官网供图

View original image

那么,数据标注到底是什么?当下的AI是通过在训练用数据中识别“模式”来进行学习的。若要更清晰地利用这些模式,就必须对数据中的关键部分进行突出标记,使AI能更好地识别。例如,若要让计算机视觉AI更准确地识别“苹果”这一物体,只需在照片中给苹果勾勒出强调边框即可。这类工作就是数据标注。


数据“给玩偶粘眼珠子”仍在进行时

数据标注本身并不需要具备高深知识的专业计算机科学家,任何人都可以完成。相应地,由于成千上万份数据都需要逐一完成标注处理,因此对劳动力的需求大得惊人。


Scale AI 将数据标注工作平台化,并积极利用发展中国家的低成本劳动力,率先实现了具有成本竞争力的标注服务。


如今,Scale AI 虽然在美国硅谷和英国伦敦这两个全球信息技术产业重镇设有核心开发总部,但真正的标注作业则主要由亚洲、非洲等发展中国家的兼职劳动者完成。凭借这一点,公司得以比其他竞争对手以更低的价格提供标注服务,并逐步确立为全球企业的数据标注外包承包商。


自动化只是AI冰山一角……所需人力只会持续增加

Scale AI 的商业模式依赖发展中国家的廉价劳动力。照片与报道中的具体表述无关。AP 联合通讯社供图

Scale AI 的商业模式依赖发展中国家的廉价劳动力。照片与报道中的具体表述无关。AP 联合通讯社供图

View original image

Scale AI 的成功秘诀,令人联想到玩具、纺织等传统制造业的模式:美国、英国的总部只专注于设计或技术开发,而真正的制造人力则在低成本的发展中国家雇用。从这个角度看,将数据标注称为“给玩偶粘眼珠子”,倒也算得上颇为贴切的比喻。


与此同时,这一案例也提醒人们:没有人类之手,AI仍然难以真正落地。利用AI进行业务自动化,只是名为“AI产业”这一巨大冰山的极小一角。



在现实中,AI需要无数被动员参与训练工作的标注员、扩建和维护数据中心的人力,以及负责管理和进行系统集成的信息技术工程师等大量“人类协作者”。再加上目前AI投资只增不减,在这种形势下,对此类人力的需求只会不断攀升。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点