专家称:“需从服务器、冷却系统、人力等多方面提升竞争力”
随着全球超级计算产业迈入以人工智能(AI)为基础的数据中心时代,有观点指出,我国在争取图形处理器(GPU)供给之外,还必须同步提升包括服务器与存储、网络、冷却系统以及运维软件在内的整套系统的运营能力。舆论认为,科学技术信息通信部不能因为从英伟达获得了26万块GPU的供货承诺就自满止步。
出席在美国圣路易斯举行的“SC25”活动的 RableUp 首席执行官 Shin Jeonggyu 表示:“AI正在以原有超级计算约1/100到1/1000水平的运算量,替代传统超级计算的案例接连出现。这种变化正在撼动超级计算本身的结构。”他解释称,虽然精度较低,但通过获取高速计算能力并多次重复计算来修正精度的技术已逐步成熟,全球超级计算机正自然而然地重组为以AI为中心的集群。
目前,全球新建超级计算机大多以“AI超级计算机”之名采用GPU为基础的架构。在TOP500排行榜上,超过75%的超级计算机都是基于英伟达GPU的系统。韩国科学技术信息研究院(KISTI)正在引进的国家超级计算机6号机同样基于英伟达系统。大型科技企业建设的超大型数据中心虽然并未纳入该排行榜,但其与超级计算机之间的界限正日益模糊。
在此背景下,为解决超级计算机大量耗电的问题,从冷却、电力到线缆等在内的整个数据中心重新设计的趋势正全面展开。参加SC25的众多冷却相关企业的迅速崛起正是这一趋势的缩影。惠普(HP)、戴尔(Dell)、Supermicro 等系统厂商则集中展示了集成冷却技术的各类系统。
作为领跑者的英伟达甚至大力宣传连接超级计算机与量子计算机的技术,以此证明其对未来持续加大投资。
问题在于,韩国尚未为这类变化准备好应对方案。西江大学计算机工学系教授 Kim Youngjae 表示:“今年SC25上服务器企业的亮相格外醒目,而韩国整体产业结构却十分薄弱。”他对韩国在服务器、存储、网络、冷却、软件等多个领域的脆弱产业结构表示警惕。
本次活动中,韩国企业仍以存储半导体等为主参与展出,但无论在规模还是参展领域上,都未能摆脱参与企业数量有限的局面。相较之下,以台积电(TSMC)为核心进行半导体生产,并利用这些芯片生产超级计算机和服务器的台湾企业正高速成长。在本届SC25上,技嘉(GIGABYTE)、Pegasus 等台湾企业展出了其自主开发的英伟达服务器,吸引了大量参观者的目光。
Kim 教授解释称:“缺乏涵盖软件、存储、网络等在内的全栈生态系统,因此很难真正获得运营层面的竞争力。”MangoBoost 首席执行官 Kim Jangwoo 也表示:“如果对系统缺乏理解,就很难形成完整的生态。”Shin 代表指出:“韩国目前忽视的竞争力本质,并不在于GPU的数量,而在于数据中心的运营能力。”
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。