AI模型Gemini在首尔区域上线
支持最新TPU算力
Google Cloud将在韩国本地服务器上处理其最新大规模语言模型(LLM)Gemini 2.5的运算任务。通过自主研发的张量处理单元(TPU),还将支持民间和公共部门的人工智能转型(AX)。
Google Cloud于8日在首尔江南区COEX会展中心举办“Google Cloud Day Seoul”活动,介绍了其人工智能(AI)愿景。
Jikiseong Google Cloud Korea 社长8日在首尔江南区 COEX 会展中心举行的“Google Cloud Day Seoul”媒体吹风会上发表演讲。Google Cloud 提供
View original imageGoogle Cloud Korea总裁 Ji Gisung表示:“我们已经在首尔区域推出了Gemini 2.5模型”,并解释称:“不仅是数据存放在首尔区域,而是将机器学习流程本身也应用在首尔区域。”以往,为了提供Gemini服务,用户输入的数据会被发送到海外区域(数据中心)进行AI运算,而现在则意味着这一流程将在韩国国内完成。
Google Cloud于2020年设立了首尔区域。具备大容量基础设施的首尔区域配备了服务器、硅芯片、存储设备、网络设备等,并与覆盖200多个国家的Google专用网络相连。
对AI服务运行至关重要的TPU也通过Google Cloud的服务提供。TPU是Google自主开发的运算装置,专门用于大规模数据分析和深度学习。此前,Google Cloud在今年4月举行的Google Cloud Next大会上发布了Google第7代张量处理单元(TPU)Ironwood。Ironwood专为大规模AI推理而设计,即将以正式版本推出。
Ji总裁谈到Ironwood时表示:“我们正在迎来推理时代,模型正从在响应式AI中向人类提供需解读信息,转变为能够主动生成解读和洞见的模型”,并指出:“已经进入了这样一个时代:不仅仅是处理简单数据,而是由AI代理彼此协作,先行检索并生成包含洞见的答案。”
Google的大规模语言模型Gemini 2.5以及蛋白质结构预测模型“AlphaFold”等模型也都经过TPU运算。他表示:“通过Ironwood,包括韩国本地开发者在内的民间和公共部门组织将实现怎样的创新,令人期待。”
在Ji总裁之后进行演讲的 Ryu Youngjun Ruitn Technologies首席运营官(COO)表示:“用于新服务的大规模语言模型必须在优良性能、合理价格、高稳定性等多项标准上同时达标”,“Gemini 2.5模型系列在Ruitn的自有测试中满足了这些标准,目前正与多种大规模语言模型一道,在服务中被部署在最合适的位置加以利用。”
当天活动现场,Nol Universe、LG Uplus、NC AI、Kakao Mobility等企业在Gemini Playground中设立展台,展示了利用Google模型开发的AI基础服务。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。