PCDaily手机网站站内搜索

提供便携式设备、创新应用和趋势洞察的深度报道，帮助您在快速发展的科技世界中保持前沿！

滚动资讯

当前位置：智能日报 > 耳机音频 > 正文内容

DeepSeek联合顶尖高校发布新论文，DualPath架构破解LLM推理性能瓶颈

时间：2026-02-28 01:07 来源：互联网作者：唐云泽

研究团队通过实证分析发现，在典型编程任务场景中，智能体平均需要完成157轮交互，上下文长度累计达32.7K个语言单元，但每轮新增内容仅429个单元。这种"长上下文、短增量"的特性，使得键值缓存（KV-Cache）的加载效率成为决定系统性能的关键因素。实验数据显示，现有架构中存储带宽利用率存在严重失衡——预填充引擎的带宽资源长期处于满负荷状态，而解码引擎的带宽资源却有90%以上处于闲置状态。

硬件发展趋势进一步加剧了这种矛盾。以英伟达GPU架构演进为例，从Ampere到Blackwell架构，计算性能提升了14.4倍，但存储带宽和显存容量的增长幅度不足3倍。这种计算与存储能力发展的非对称性，导致传统预填充-解码分离架构的吞吐量提升遭遇天花板。

该架构的实现面临三大技术挑战：首先是数据传输粒度控制，研究团队设计了分层块传输机制，将缓存数据切割为不同粒度的传输单元，使网络开销降低60%；其次是流量隔离技术，通过引入中心化网络控制器和InfiniBand虚拟通道，确保关键计算任务不受数据加载影响；最后是动态调度算法，系统实时监测GPU负载、网络状态和任务特征，自动调整预填充与解码模块的资源分配比例。

性能评估显示，在包含6600亿参数的DeepSeek-V3.2模型测试中，新架构在离线批处理场景下实现1.87倍吞吐量提升，在线服务场景的智能体处理能力提升近2倍。更值得关注的是其扩展性表现：在由1152块GPU组成的集群测试中，系统从8节点扩展到144节点时，性能提升幅度达到理论值的92%，且延迟波动控制在5%以内。在44个预填充引擎+88个解码引擎的配置下，系统吞吐量较基线系统提升22倍。

更多>同类内容

光本位科技携手百度智能云：AI赋能光计算芯片研发共筑国产算力新生态

双方战略合作将以 Comate 为技术底座，由光本位科技将芯片设计领域专家经验转化为光电设计 Skills 与行业专属 Agent，依托 AIAgent 技术解决通用模型在光电芯片研发领域的适配难题，实现…

02-27

寄大件物流怎么选？不同重量跨省搬家家电运输省钱攻略大公开

寄大件物流的核心并非单纯去寻找最便宜的公司，而是去寻找能够匹配你需求的那一家。寄行李或者家电，要是重量在60公斤之上，首先选取的并非传统快递，而是德邦精准卡航、京东重货这类大件物流，它们的计费办法更贴近物…

02-27

百度2025年业绩：AI新业务成增长引擎广告业务下滑转型承压

从2025年第四季度开始，百度将“百度核心”重新定义为“百度一般性业务”，而百度一般性业务包括三个板块：百度核心AI新业务、传统业务及其他。据财报披露，2025年第四季度，被归入“传统业务”的广告业务仍为百…

02-27

DeepSeek V4预览版闭门内测开启：百万tokens上下文与多模态能力引期待

【太平洋科技】2月26日消息，随着发布临近，DeepSeek V4更多技术细节曝光。据消息源@Legit透露，DeepSeek已开始对其代号为“sealion-lite”的V4预览版进行闭门内测，参与方均…

02-27

AMD发布Adrenalin Edition 26.2.2版驱动，支持新游并修复RX 7000系列显卡问题

IT之家 2 月 27 日消息，AMD 昨日（2 月 26 日）发布 Adrenalin Edition 26.2.2版显卡驱动，新增支持《生化危机：安魂曲》和《失落星船：马拉松》游戏。针对卡普空的恐怖生…

02-27

华为余承东官宣问界M6全色系登场，智慧SUV即将春天发布引期待

IT之家2月27日消息，今日，华为终端BG董事长余承东宣布问界M6全色系登场，并在视频中展示了橙、白、黑、银、青、紫、蓝等多款车色。IT之家注意到，鸿蒙智行问界M6汽车已登陆华为商城，并开放预约。相关页面显示…

02-27

数字芯片设计公司业绩亮眼，国产AI芯片赛道迎来发展新机遇

02-27

《狂飙》余波未平：爱奇艺营收净利双降，线上线下破局路在何方？

经历了前几年的断臂求生与降本增效，长视频行业本以为已经迎来了春暖花开，但爱奇艺刚刚交出的2025年成绩单，却再次让市场感受到了一丝倒春寒的凉意。在最新的财报电话会上，创始人兼CEO龚宇虽然描绘了2026年…

02-27

蚂蚁集团注册“ROBBYANT”商标，旗下首款人形机器人已试点应用

企查查APP显示，近日，蚂蚁科技集团股份有限公司成功注册数枚“ROBBYANT”商标，国际分类涉及通讯服务、教育娱乐、金融物管等。公开信息显示，蚂蚁灵波科技（Robbyant）是蚂蚁集团旗下公司，专注于具身…

02-27

魅族战略转型暂停自研硬件项目，CEO黄质潘：23载热爱以Flyme之名新生

02-27

魅族战略大调整：暂停国内手机自研硬件

今日，魅族科技正式对外宣布了一项重大战略调整，决定暂停国内手机新产品的自主研发硬件项目，并针对近期网络上流传的“破产重组、业务全面停摆、手机退市”等不实言论进行了明确辟谣。

02-27

爱奇艺2025年业绩承压：会员广告双降，线下乐园能否成破局新引擎？

总的来说，对于爱奇艺而言，2025年是承压调整与战略探索并存的一年：营收连续两年下滑、盈利大幅回调，反映出长视频行业的残酷竞争与发展困境；而剧集赛道的持续优势以及线下IP新业务的落地，则彰显出其核心竞争力与…

02-27

广汽孵化慧仑科技进军具身智能机器人领域今年试产2027年将规模化量产

02-27

2026开年新车潮来袭！小米问界比亚迪理想零跑多款重磅车型蓄势待发

02-27

阿斯麦新一代EUV光刻机达量产条件助力芯片升级单台成本近27.41亿人民币

02-27

点击查看更多 +

全站最新

蚂蚁集团注册“ROBBYANT”商标，旗下首款人形机器人已在多场景试点应用

光本位科技携手百度智能云：AI赋能光计算芯片研发共筑国产算力新生态

寄大件物流怎么选？不同重量跨省搬家家电运输省钱攻略大公开

百度2025年业绩：AI新业务成增长引擎广告业务下滑转型承压

华为余承东官宣问界M6全色系登场，智慧SUV即将春天发布引期待

石头科技2025年营收大增55.85%达186.16亿，净利润却下滑31.19%为13.6亿

热门内容

本栏最新

光本位科技携手百度智能云：AI赋能光计算芯片研发共筑国产算力新生态

寄大件物流怎么选？不同重量跨省搬家家电运输省钱攻略大公开

百度2025年业绩：AI新业务成增长引擎广告业务下滑转型承压

华为余承东官宣问界M6全色系登场，智慧SUV即将春天发布引期待

《狂飙》余波未平：爱奇艺营收净利双降，线上线下破局路在何方？

蚂蚁集团注册“ROBBYANT”商标，旗下首款人形机器人已试点应用

PCDaliy智能日报 - 每日更新世界智能科技的最新进展、产品评测和行业动态，为您提供全面而深入的视角，让您在这个日新月异的智能时代始终领先一步。
PC Daily（www.pcd.com.cn）所有稿件免费开放转载，转载请务必保留版权，并注明来源网址。
合作微信：netspread（注明:智能日报）
Copyright © PCD 2012-2023 www.pcd.com.cn All rights reserved. 鲁ICP备2022032383号-10 鲁公网安备37010202700527号