

【环球网科技报说念 记者 林梦雪】当大模子从“被迫回应”进化为省略自主所在、调用器具并履行多步任务的“智能体(Agent)”真实刺激交换娇妻13篇,AI数据中心的底层架构正在资格一场颠簸。
面对活跃智能体数目超200%的激增预期,以及随之而来的“内存与闪存心焦”,数据中心该怎么重构?翌日的AI算力又将怎么委用?近日,在英特尔至强6+新品发布会暨数据中心改变日历间,多位与会者谈到,在Agentic AI期间,CPU不再是GPU的“破碎”,而是再行回到了智算中心的C位。
算力结构之变:从“GPU独奏”到“CPU指引的交响乐”
往时两年,AI数据中心的都备主角是GPU。但在Agentic AI期间,这一场所正在被颠覆。
“前沿AI模子的锻真金不怕火就像是一场GPU独奏协奏曲,但跟着智能体AI的兴起,咱们需要通研讨计平台协同作战。这是一场涵盖多种责任负载的果真‘交响乐’。”英特尔公司内行副总裁兼首席市集营销官Brett Hannath在开场致辞中打了个譬如,“CPU的变装,等于这场交响乐团的指引。”
这种“指引”作用的突显,源于智能体责任负载的实质变化。金山云臆度研发负责东说念主杨峰冷漠:“在Agent架构中,CPU践诺上形成了指引者和大脑。它要想考任务何如编排、学问库何如检索、器具何如调用。这些Agent运转的任务,践诺上是通盘GPU申请的独霸者。”
算力配比数据也发生了回转。英特尔市集营销集团副总裁、中国区总司理郭威裸露,现在数据中心内CPU与GPU的比例也曾从客岁的1:8、1:4,回升到了1:2真实刺激交换娇妻13篇,翌日以致可能达到1:1。
但这并非简单的单机硬件堆叠。腾讯云臆度居品运营总监周驰说说念:“不要把它看作是单台工作器里面的比例,应该从内行的业务量去比。”周驰指出,面前AI诈欺出现了浓烈的“破圈”时局,从成就者延长到了讼师、农民以致10岁的小一又友。“这种破圈导致无数正本ROI隔离算的闲居琐碎业务被自动化。这些海量、高并发的小剧本不需要好多GPU,但特地依赖CPU的改变才能。从内行装机量来看,CPU的需求正迎来爆发式增长。”
破解“存储心焦”:QAT与IAA成为普及智能体的“金钥匙”
智能体在运转中需要看护长周期的高下文缅想,这平直导致了KV Cache(键值缓存)容量的指数级爆发。
“以100万Token高下文为例,1个用户的KV Cache就需要近10GB,且随用户数线性增长。”新华三集团存储居品线首席居品司理王其勇指出,KV Cache正在驱动存储行业迎来新范式,对高端SSD和内存的需求呈现出“奇货可居”的情状。
面对崇高的闪存和内存,色翁荡息又大又硬又粗又爽怎么裁减Token的坐褥老本?英特尔数据中心集团副总裁兼中国区总司理陈葆立给出了破局想路:“契机是留给有准备的东说念主的。咱们多年前布局的QAT(压缩加快)和IAA(内存分析加快)期间,正值成了今天怒放Agentic AI普及大门的两把‘金钥匙’。”
英特尔中国区期间部总司理高宇进一步评释了这两项期间:“QAT不错在KV Cache存入SSD前进行硬件级压缩,压缩比至少达到50%,平直砍掉一半的闪存支出;而IAA则对内存数据进行及时硬件级压缩与解压,在不加多加载延迟的前提下,大幅省俭稳固的内存资源。”
这一期间红利已在头部云厂商中落地。阿里云智能集团块存储研发总监谷跃胜共享说念:“在协同优化后,咱们使用新的QAT引擎替换了过往的软件压缩,压缩带宽晋升了400%,同期减少了75%的通用CPU核数占用。”新华三也趁势推出了AI原生计储X20000,通过自研X Cache推理加快软件,将Token坐褥成果最高晋升了10倍。
交易容貌走向“Agent as a Service”
当底层算力被重构,云厂商向客户委用AI才能的姿首也在发生根人道改变。
周驰提到,腾讯云正在践行的全新交易容貌:“翌日客户不需要珍摄需要多大的内存、些许核的CPU。咱们推出了to B的ClawPro和to C的LightVela,对企业而言,职工不错一键认领一个Agent;对个东说念主而言,等于领养一只‘虾’。咱们屏蔽了底层虚构机的见地,提供的是包含安全、审计、系统买通在内的圆善智能体运转环境。”
这种“Agent as a Service”的容貌,对数据安全冷漠了极高条件。火山引擎AICC居品研发负责东说念主义尧指出,大模子向云扮演进是势必趋势,但隐秘数据上云面对合规挑战。为此,火山引擎依托英特尔至强惩办器的TDX(确切域膨胀)巧妙臆度期间,构筑了公有云AI安全底座。“TDX在CPU层面创建受保护的信任域,确保模子权重与用户明锐数据在推理经过中免受窃取,果真终了数据‘可用而不成见’。”
从288核的至强6+能效核惩办器,到Crescent Island数据中心GPU,再到E835以太网范畴器,英特尔在发布会上展示的不仅是单一芯片的升级,而是涵盖“算力、存力、贯穿力、保险力”的系统级重塑。
“淌若把AI数据中心算作未下寰宇的超等工场真实刺激交换娇妻13篇,它的产出是Token,驱动GPU集群、CPU集群和高性能存储集群这三台机器的,都不错是英特尔至强惩办器。”高宇说说念。