小米旗下MiMo大模型团队近日宣布,对V2.5系列模型API实施永久性降价策略,最高降幅达到99%,同时取消上下文窗口长度的差异化定价。此次调整还优化了Token Plan计费体系,在保持价格不变的前提下,用户可获得的使用量提升至原有水平的5至8倍。消息发布后,小米集团创始人雷军通过个人账号转发了相关公告。
据小米技术官方微博披露,此次价格调整得益于团队在推理系统层面的技术突破。通过引入SGLang HiCache架构并完整支持SWA(滑动窗口注意力机制),系统将KV Cache在GPU显存、CPU内存及SSD之间的数据传输量压缩至优化前的七分之一,同时将可缓存token数量扩大至近5倍。这一改进显著提升了缓存命中率,使模型推理效率得到质的飞跃。
在降价消息公布前一日,小米集团同步披露了2024年第一季度财务数据。报告显示,该季度集团实现营收991亿元,经调整后净利润达61亿元。其中智能电动汽车及AI等创新业务贡献收入199亿元,期间新车交付量突破8万辆。值得关注的是,小米当季研发投入同比增长33.4%至90亿元,雷军在业绩说明会上进一步宣布,未来三年将在AI领域投入600亿元,预计全年研发投入将突破400亿元大关。
技术实力方面,MiMo-V2.5-Pro模型已在国际权威评测平台Artificial Analysis的榜单中取得突破性成绩。该模型在综合智能指数与Agent指数两项核心指标上,与全球其他开源模型并列首位,标志着小米在人工智能领域的技术积累获得国际认可。











