新型概率专用计算机开发,训练与推理方式与AI高度相似
“在AI任务上比英伟达GPU效率高1万倍”
计算机是以0和1这两个数字运作的机器。从最初的计算机到如今的人工智能(AI)半导体,从未脱离这一法则。然而,近期一家美国初创公司声称,他们发明了一种全新的计算机,通过以概率方式生成0和1,直接执行AI模型的计算。这台计算机名为“热力学采样装置(TSU)”,是一种只为实现AI而开发的全新概念计算机。
从事AI研究的物理学家……推出颠覆范式的芯片
TSU由加拿大出身的数学家兼物理学家 Guillaume Verdon 创立的初创公司 Extropic 开发。根据其官方网站介绍,Verdon 是谷歌量子AI技术“TensorFlow Quantum”研究论文的作者之一,并曾亲自创办量子计算机初创公司,一直专注于AI研究。但他意识到,依靠现有的计算机半导体很难真正实现AI,遭遇这一技术瓶颈后,他取消了所有项目,于2022年创立 Extropic,专注于新概念计算机的开发。
Extropic 在沉寂3年后,于本月初公开了TSU。从外观上看,它与中央处理器(CPU)、图形处理器(GPU)等普通计算机芯片十分相似。同其他半导体一样,它以硅为材料,并与其他元件一起封装在电子基板上。然而,Extropic 在技术说明书中声称,“TSU执行AI任务的效率比英伟达的GPU高1万倍”。TSU究竟如何实现这样的性能?
决定论计算机 vs 概率论计算机
人们常说“计算机用0和1思考”。这与计算机的核心部件——半导体晶体管有关。晶体管在有电流通过时被视为开启(1),无电流通过时被视为关闭(0),通过晶体管的状态来实现逻辑。例如,当我们移动鼠标或敲击键盘时,相应指令会被转换成无数个0和1,从而被计算机识别。
只使用0和1的原因,是为了无误接收微弱的电流信号。无论电流强弱,只要有电流就判断为1,没有就判断为0,因此可以将机械误差降到最低,输出与预测完全一致的精确结果。
普通计算机半导体(上)与热力学采样装置(TSU)工作方式的类比示意图。半导体根据电流是否流过晶体管固定输出0或1,而TSU则根据电子波动以概率方式输出0和1。网络社区提供,Extropic Capture提供
View original image与之相反,TSU并非根据电流信号,而是依据电子振动,也就是波动来给出数值。尽管与传统半导体一样只输出0和1,但在两者之中究竟输出哪一个却完全是随机的。Extropic 将TSU的工作方式定义为“概率论算法”。
与AI运行方式极其相似的TSU
传统计算机是基于0和1来执行运算的,如果这些数值是随机得出的,计算机本身就无法运作。实际上,TSU无法运行一般软件。相反,它将随机输出的运算结果视为“样本”,并通过尽可能多地收集这些样本来识别大型模式。
这一特征与神经网络AI极其相似。AI技术的本质,就是对海量数据进行训练,并从中提取合适的模式。当我们向AI聊天机器人提出特定问题时,聊天机器人会从事先学习到的模式中,选取与之最匹配概率最高的词语或图像进行组合,然后呈现在我们面前。
如果说传统计算机在训练AI模型时,需要把数据转化为天文数量级的矩阵乘法并逐一计算,那么实现概率模式的计算机则可以跳过复杂的计算过程,直接输出结果。对此,Verdon 表示:“AI算法归根结底不过是概率分布下的矩阵乘法”,“传统计算机需要直接执行大量矩阵乘法,而TSU则省略矩阵乘法本身,改为对概率分布进行采样。”也就是说,它“可以在每1瓦特(W)功耗下实现最优的AI性能”。
要成主流仍需构建运行环境
那么,TSU未来是否会超越英伟达GPU,成为AI半导体的主流?目前这一切仍停留在可能性层面。即便TSU在AI、核模拟、能源管理等需要概率论算法的任务上展现出优势,但由于尚未建立完善的运行环境,可用领域十分有限,难以超越GPU在AI市场中多年积累的生态和通用性。
Verdon 也坦言:“我们虽然已经成功开发出TSU,但要达到实用阶段还需要更多帮助。”Extropic 目前正面向从事物理学、生物学、AI、能源等概率运算研究的科研人员,寻求在构建运行环境方面的合作。近期,其官方网站上发布提案称,“希望与想要执行大规模概率任务的企业合作,开发系统应用程序(App)”。
回顾过去,英伟达推出全球首款GPU“GeForce 256”时,也并非一开始就一帆风顺。首席执行官黄仁勋亲自奔走于市场一线,主导营销和销售,并在数十年间不断研究可在GPU上运行的各类程序,最终才夺得AI时代“赢家”的桂冠。概率计算机将如何改变未来,很大程度上取决于Extropic接下来的行动。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。