黄仁勋深度对话MiniMax创始人,探讨AI未来与技术创新

   时间:2025-07-21 11:56 来源:ITBEAR作者:赵云飞

近日,英伟达(NVIDIA)的掌舵人黄仁勋与一家备受瞩目的中国AI初创企业——MiniMax(希宇科技)的创始人闫俊杰进行了一场长达两小时的私密会晤。据悉,闫俊杰是唯一获此殊荣的中国AI创业公司创始人,与黄仁勋共同探讨了中美AI行业的现状与未来趋势。

MiniMax由闫俊杰于2021年创立,他此前曾任商汤科技的高管职位。这家新兴企业在AI领域迅速崭露头角,特别是在大规模混合架构推理模型方面取得了显著成就。

今年6月,MiniMax震撼发布了全球首个开源的大规模混合架构推理模型M1。该模型不仅在性能上超越了国内的闭源模型,逼近了DeepSeek R1及海外顶尖模型的水平,更以卓越的效率和高性价比赢得了业界的广泛关注。

MiniMax的M1模型得益于其独创的Lightning Attention机制,这一机制在计算注意力矩阵时表现出色,大幅提升了训练和推理效率。因此,M1模型在处理长上下文输入和深度推理任务时具有显著优势,支持业内最高的100万上下文输入,以及长达8万Token的推理输出。

在算力使用方面,M1模型同样表现出色。在进行8万Token深度推理时,其算力需求仅为DeepSeek R1的约30%。这一特性使得MiniMax在训练和推理阶段都拥有巨大的算力效率优势。

MiniMax还提出了创新的强化学习算法CISPO,通过裁剪重要性采样权重来提升学习效率。在AIME实验中,CISPO的收敛性能显著优于包括字节近期提出的DAPO在内的多种强化学习算法,甚至超越了DeepSeek早期使用的GRPO。

得益于这些技术创新,MiniMax的强化训练过程异常高效,远远超出了预期。整个强化学习阶段仅使用了512块H800 GPU,耗时三周,租赁成本仅为53.47万美金,比最初预算少了一个数量级。

在业内主流的17个评测集上,MiniMax对M1进行了详细评测。结果显示,M1在长上下文理解任务中表现出色,仅以微弱差距落后于Google的Gemini 2.5 Pro,但在代理工具使用场景(TAU-bench)中却战胜了后者。

鉴于M1模型的高效训练和推理算力使用,MiniMax宣布在MiniMax APP和Web平台上提供不限量免费使用服务。同时,公司还以业内最低价格在官网上提供API服务,价格根据输入长度的不同而有所差异,但均比DeepSeek-R1更具性价比。

 
 
更多>同类内容
全站最新
热门内容