在2026云网智联大会上,中国工程院院士邬贺铨指出,人工智能与大模型技术的迅猛发展正推动智能体成为行业焦点。到2026年,全球推理算力预计将占AI算力总负载的70%至80%,而中国的推理需求更是达到训练需求的8倍。算力的应用模式正从以训练为主转向以推理和智能体为主导,这一转变引发了算力架构、应用场景和商业模式的深刻变革。智能体的发展使得算力架构从注意力经济向生产力经济转型,部署形态从纯云端扩展至“云—边—端”协同,商业模式也从成本中心转变为价值引擎。
邬贺铨解释,智能体并非单一主机,而是一种基于大模型的能力和资源。单个智能体通过感知、记忆、规划、工具调用和行动执行形成闭环,能够独立完成特定任务的决策和操作。然而,这种单一智能体的应用边界和能力上限较为有限,缺乏跨智能体协作能力。为突破这一局限,多智能体协同系统应运而生。在统一协调器的调度下,相关智能体被组织起来,通过共享记忆和高级规划实现集体智能,从而处理复杂目标。
多智能体在开放网络中的规模化互联形成了智能体互联网(IoA)。与传统互联网的主机互联和信息互联不同,IoA扩展为智能体互联和能力互联。它以IPv6+为基础,叠加新应用层协议,实现智能体的唯一标识、自主发现、可信交互、协同执行和按需组网。智能体互联网支撑着智能体即服务(AaaS),将智能体和智能体群能力云化封装,通过API、SDK和低代码平台对外提供服务,支持租户化、弹性调度、托管运维和按需计费。
邬贺铨将AaaS比作智能体超市,企业用户无需自行开发智能体或自建算力,只需通过订阅模式从云上调用封装好的智能体功能组合,集成到自身业务系统中,即可以SaaS的成本获得自动化和智能化的双重收益。这种模式大大降低了中小企业使用智能体的门槛,推动了技术的普及。
面向消费者的智能体(To C)主要有三种应用模式。第一种是云上APP寄生智能体,它强依赖微信、钉钉等宿主APP,依托云端算力运行,断网不可用。这种模式将聊天工具升级为能“思考、写作、读文件、控设备”的智能助手,但用户无模型选择权。第二种是终端OS原生智能体,预装于手机操作系统,如中兴通讯与字节跳动联合推出的豆包手机,端云协同,可按用户意图调度APP并自动执行业务流程。其优势是用户可控性强,但可能弱化APP界面,引发应用厂商抵制。第三种是本地自治+云端辅助的智能体,不依赖APP,但需手动安装独立PC软件,如“龙虾”AI私人管家,决策与权限管理本地化,通过云上AaaS协同其他智能体。
面向企业的智能体(To B)则有四大应用模式。流程自动化智能体复刻人工逻辑,替代生产、运维等标准化流程,提升效率。行业专家智能体依托行业知识库和知识图谱,提供决策参谋方案。多智能体协同整合供应链、生产、物流等多领域智能体,实现跨环节协同。具身智能支撑工业机器人等实体设备,完成感知、推理和物理执行的闭环。邬贺铨指出,针对中小企业自建算力不足和数据隐私风险高的痛点,本地初算+云端精算成为最优解,平衡了成本与安全。
智能体业务对算力、云和网络提出了颠覆性要求。与传统互联网业务相比,智能体业务的驱动主体从人工操作变为机器自主循环,时间节律从昼夜分明变为7×24小时不间断运行,空间分布从集中式变为多点网状、多并发级联调用。智能体对算力的需求激增,单智能体Token消耗可达普通用户的10至1000倍。尽管Token流量年增速高达330%,但通过小模型普及、极致压缩和长上下文优化,未来5年算力增速可控制在41%左右,实现效率与成本的平衡。
智能体时代也重构了云服务。传统云以资源提供为核心,而智能体时代要求智能体原生云,优先布局智能体原生架构,构建全局智能调度,搭建分布式记忆与向量引擎,深化“云—边—端”协同,强化算力与网络优化。这一变革正加速重塑中国云服务格局,AI云全栈服务迎来爆发,市场向智算融合、绿色低碳和国产深化升级,覆盖智算基础设施、模型训练/推理、智能体编排与运维。
网络升级同样迫在眉睫。智能体的长会话持续交互、多智能体协同通信、大模型推理/检索高频小包+大流量混合等特征,使网络流量从南北向为主转为东西向占比80%,QPS提升10至100倍。网络需从行政区组网转向智算中心—区域云—边缘—终端四级架构,采用SRv6、云网虚拟化与编排技术、流量AI预测与调度等技术,保障确定性与高可靠性。












