

新闻资讯
哈希游戏| 哈希游戏平台| 哈希游戏APP哈希游戏- 哈希游戏平台- 哈希游戏官方网站
人工智能正在经历一场静默而深刻的范式转移——从“回答问题”的大模型(LLM),迈向能“自主行动”的智能体(Agent)。这一转变不仅改变了AI的能力边界,也正在重塑底层算力的供需格局。在这场变革中,一个长期被视为“基础设施底座”的“关键先生”正在被重新定义——它并非风光无限的GPU,而是始终支撑数据中心运行的CPU。这不是一次简单的周期轮动,而是一场由工作负载特性驱动的、对CPU核心价值的深度回归与重估。
为了实现极致的轻量化和快速启动,业界普遍采用微虚拟机(MicroVM)技术,包括亚马逊的Firecracker,腾讯的Cube和阿里巴巴的ACS Agent Sandbox等。与传统的虚拟机相比,MicroVM剥离了所有非必要的设备模拟和内核模块,隔离性高,开销极小,启动时间可缩短至毫秒级。然而,这种极致的优化也意味着几乎所有的系统调用和硬件交互都必须由CPU来处理,这对CPU的调度能力、设备访问带宽等提出了前所未有的挑战。
在HaystackRAG任务中,CPU处理占总延迟的90%以上,而GPU推理占总延迟的10%左右,在其他任务中,CPU环节占比普遍在40%–90%之间——用户感知的是端到端体验,而这个体验的“拖油瓶”正是CPU。这个数据的背后,是用户耐心的流失。研究表明,当AI应用的响应时间超过5秒,用户的满意度会急剧下降。如果CPU处理环节占据了绝大部分时间,那么无论GPU有多快,都无法挽回糟糕的用户体验。这迫使开发者和云厂商必须重新审视其算力配置策略,不能再一味地堆砌GPU。
首先,Arm架构能效比优势显著。AI Agent的典型负载由海量轻量级沙箱任务构成,对单线程峰值性能要求不高,但对单位功耗下的并发处理能力极为敏感。Arm处理器凭借更小的核心面积与更低的功耗,在同等TDP下可集成更多核心,从而在吞吐效率上超越传统x86方案。其次,云原生友好与可定制性强。Arm的开放授权模式允许芯片厂商根据特定场景灵活集成各类专用模块,打造“场景定义芯片”(Scenario-Defined Chip),这正是构建高效Agent执行环境的关键。
AWS Graviton系列已迭代至第五代,广泛用于EC2实例;Microsoft Cobalt与Google Axion均基于Arm Neoverse平台,进入第二代产品的量产阶段;NVIDIA在其AI解决方案中采用的则是自研的Arm架构CPU,初代代号为Grace,第二代代号则为Vera;而据行业消息,Meta也即将在其数据中心部署代号为Phoenix的Arm架构CPU。Arm基础设施业务高级副总裁Mohamed Awad之前公开表示,到2025年底,Arm在数据中心CPU市场的份额将从15%提升至50%,其预测虽过于乐观,不过我们也看到,截止2025年第二季度,Arm处理器在服务器CPU市场的占比已达25%,AWS新部署的实例中有一半是基于Arm架构。
鸿钧微电子作为国内Arm服务器CPU的引领者,其首款产品鸿旻91系列服务器CPU展现出鲜明的前瞻性设计,基于Armv9授权、单Die集成了128个高性能核心,最高工作主频3.3GHz,支持DDR5-6400MT/s内存,同时产品功耗可圈可点,不但可应用于云计算场景,而且满足于高并发、轻线程的Agent沙箱负载场景。据业界人士透露,鸿旻91系列芯片已经规模量产,且公司于2026年初完成了一轮由国际知名投资机构领投的10亿元人民币融资。
熠知的TF7000系列芯片基于Armv8授权,单Die集成40核,通过合封支持单芯片80核,最高工作主频3.0GHz,支持DDR4 3200,TF7000当前主要聚焦于边缘计算等场景;同时熠知电子也于近日完成一轮新的融资,发布了第三代熠知AI CPU TF9000系列产品,并向业界正式发布成为“全球领先的XPU科技公司”的新愿景,通过“inside”产品策略,以芯片为核心延伸至设备及多行业AI解决方案,兼顾“灯塔用户标杆打造+生态共建广度覆盖”的市场布局。
诚然,作为一款开放、免费、无授权限制的指令集架构,RISC-V在理论层面展现出诱人的独特性,其具有独特的模块化与场景定义能力,开放的架构允许用户灵活添加自定义扩展,国内不少企业,包括算能、达摩院等也已推出相应的RISC-V解决方案。然而,理论的完美无法掩盖现实的鸿沟。AI Agent所需的CPU并非简单的嵌入式CPU,而是必须承载高并发、高可靠、强兼容性的企业级服务器CPU。在这个战场上,RISC-V面临着严峻的“时间和生态拷问”:究竟还要多久才能落地?业界对于RISC-V何时能在服务器场景实现大规模平滑应用,预期分化,乐观者预言“三年可见”,谨慎者认为“五年方成”,而更有甚者则直言“八年难期”。这种巨大的不确定性,恰恰反映了其在软件生态、工具链成熟度上的短板——回望Arm的崛起之路,2008年Arm从IoT领域开始切入服务器领域,历经15年的生态打磨、巨头押注和软件适配,才得以叩开服务器市场的大门。RISC-V注定要重复这段漫长而艰辛的旅程,甚至可能更加坎坷——服务器上部署的大量软件均需要在RISC-V上进行适配优化,才能进入企业的生产现场,而目前我们并没有看到国内外的巨头在RISC-V生态层面的巨大投入;同时,也正如唐志敏老师在最近一次讲座中提及的:RISC-V在硬件生态上还不成熟,目前还缺少有竞争优势的处理器核,同时缺乏支持多核互连的高性能片上网络(NoC),目前大部分还在用Arm的NoC方案。
CPU的价值不仅体现在支撑智能体的高并发沙箱与逻辑编排上,更在于它是云计算体系的绝对基石。在云计算架构下,CPU承载着虚拟化、容器调度、网络转发及存储I/O等核心功能,直接决定了云资源的利用率与弹性伸缩能力,而Agent时代“长在线、高交互”的特性,使得CPU成为连接云端资源与智能应用的枢纽,其能效与吞吐能力直接定义了云服务的成本底线与体验上限。对于中国CPU产业而言,这是一场“场景驱动”历史机遇——从成熟领军企业到创新力量的商业化突围,国内的CPU需要凭借对本土场景的深刻洞察,从“技术追随”转向“需求定义”。若能紧扣Agent时代,我们有望构建起在全球格局中占据重要一席的算力新赛道!