小米开源MiMo-V2.5系列模型,首日适配七家芯片,测评成绩超越DeepSeek-V4

   时间:2026-04-28 15:15 来源:快讯作者:沈瑾瑜

小米近日宣布开源其最新研发的MiMo-V2.5系列大模型,采用MIT协议,允许商业推理部署和二次训练,无需额外授权。这一举措标志着小米在人工智能领域迈出重要一步,为全球开发者提供了更强大的工具和资源。

MiMo-V2.5系列包含两款模型:MiMo-V2.5-Pro和MiMo-V2.5。其中,MiMo-V2.5-Pro是小米迄今为止最强大的模型,拥有1.02万亿个参数,激活参数达420亿个。该模型基于混合注意力架构,在通用智能能力、复杂软件工程和长时域任务处理方面均有显著提升。MiMo-V2.5则是一个3100亿参数的稀疏MoE模型,激活参数为150亿个,支持多模态数据处理。

最新公布的基准测试结果显示,MiMo-V2.5-Pro在GDPVal-AA(Elo)、Claw-eval(pass³)等多项测评中超越了DeepSeek最新开源的DeepSeek-V4-Pro模型,以及近期发布的Kimi K2.6等主流闭源模型,整体表现达到行业领先水平。这一成绩表明,小米在人工智能领域的技术实力已跻身全球前列。

在技术架构方面,MiMo-V2.5-Pro继承了MiMo-V2-Flash的混合注意力机制和多标记预测(MTP)设计。局部滑动窗口注意力(SWA)和全局注意力(GA)以6:1的比例交错使用,窗口大小为128个Token,有效减少了键值缓存存储空间,同时保持了模型性能。MTP模块采用密集前馈神经网络(FFN),显著提升了输出吞吐量,并加速了强化学习(RL)的部署。

MiMo-V2.5的训练过程分为五个阶段,包括文本预训练、投影层预热训练、多模态预训练、监督微调与智能体后训练,以及强化学习与多目标偏好蒸馏。通过这些步骤,模型逐步扩展上下文窗口至100万Token,并显著提升了感知、逻辑推理与智能体执行能力。测试数据显示,MiMo-V2.5在Claw-eval Text、Terminal-Bench 2.0、SWE-Bench Pro等多项测评中大幅超越了DeepSeek最新发布的DeepSeek-V4-Flash。

在生态建设方面,小米宣布MiMo-V2.5-Pro在开源首日已完成与阿里平头哥、亚马逊云科技、AMD、百度昆仑芯、燧原科技、沐曦、天数智芯等七家芯片厂商的接入适配。该系列模型还同步完成了SGLang和vLLM主流推理框架的Day 0适配,为开发者提供了更便捷的部署方案。

为推动人工智能技术的广泛应用,小米同步推出了MiMo Orbit计划,包含“百万亿Token创造者激励计划”和“Agent生态共建计划”。前者将在30天内免费发放总计100万亿Token权益,最高可获得16亿Credits(价值659元);后者则面向全球Agent框架团队提供专项支持,包括MiMo Token限免和AI Hackathon等共创活动。目前,小米已与OpenCode、Hermes Agent、KiloCode等Agent框架厂商展开深度合作。

此次开源和生态计划的推出,反映了人工智能行业正从“拼参数”转向“拼应用”的趋势。随着推理效率和部署成本成为竞争核心,小米的举措有望推动行业进一步降低推理成本,提升Agent真实任务完成率,为全球开发者创造更多价值。

 
 
更多>同类内容
全站最新
热门内容