PCDaily手机网站站内搜索

提供便携式设备、创新应用和趋势洞察的深度报道，帮助您在快速发展的科技世界中保持前沿！

滚动资讯

当前位置：智能日报 > 智能手机 > 正文内容

字节跳动推出Seed Prover 1.5 模型数学推理能力与效率显著提升

时间：2025-12-24 19:47 来源：快讯作者：唐云泽

字节跳动旗下Seed团队近日正式发布新一代形式化数学推理专用模型——Seed Prover 1.5。该模型通过大规模Agentic强化学习（RL）训练，在数学推理能力与效率方面实现突破性提升，成为形式化数学推理领域的重要进展。

在针对国际数学奥林匹克竞赛（IMO）的测试中，Seed Prover 1.5展现出强劲实力。仅用16.5小时，该模型便为IMO 2025前5道题目生成完整可编译验证的Lean证明代码，按竞赛评分标准换算后取得35分的成绩，达到金牌分数线（满分42分）。这一表现较前代模型有显著提升，标志着自动化数学推理向人类顶尖水平迈进一步。

面向北美本科数学竞赛Putnam的测试同样验证了模型的泛化能力。在9小时内，Seed Prover 1.5成功为Putnam 2025的12道赛题中的11道生成可验证的Lean代码，解题效率与准确性均达到竞赛级标准。更全面的评估显示，该模型在完整的Putnam历史题库中解决了88%的问题，在代表硕士数学难度的Fate-H评估集和博士生数学难度的Fate-X评估集中，分别攻克了80%和33%的题目，刷新了形式化数学推理模型在多项权威评测中的最优表现（SOTA）。

技术层面，Seed Prover 1.5通过创新的Agentic RL训练框架，实现了推理路径的自主规划与优化。其核心突破在于将形式化证明过程分解为可动态调整的子任务链，使模型能够根据问题特征灵活选择策略，显著提升了复杂数学问题的求解效率。团队公开的技术报告详细披露了模型架构与训练方法，为学术界与工业界提供了可复现的研究范式。

目前，Seed Prover 1.5的技术报告已对外发布，相关代码库与演示接口即将陆续开放。开发者可通过官方渠道获取Lean证明代码示例，体验模型在自动化数学推理领域的实际应用能力。这一进展不仅为数学研究提供新型辅助工具，也为人工智能在科学推理领域的拓展奠定了技术基础。

在实际体验中，我们围绕人物一致性、LoRA光照、材质替换、文字渲染以及几何推理等能力，对Qwen-Image-Edit-2511进行了多组测试。综合来看，内置LoRA的集成设计提升了Qwen-Image-…

12-24

荣耀特训营：一笔投入，收获体能意志技能三重成长与长期财富

花一笔钱，能收获体能、意志、技能三重成长，荣耀特训营的性价比藏在细节里。专业教官团队不用额外付费，科学训练体系拒绝无效消耗，7天/14天方案满足不同需求。这里没有隐形消费：食宿包含在内，服装器材统一配备，结营…

12-24

苹果iPhone Fold 5.3英寸小外屏：以阔折叠重塑折叠屏使用逻辑

12-24

百元价位也能享高端体验！西圣Pencil X成孩子绘画平板最佳搭档

总结显然，这款百元档的西圣Pencil X实际体验下来确实是超乎自己的想象；现在回想一下，原装笔已经不香了，流畅度高、倾斜压感、防误触、低延迟、长续航…这些都是完美平替苹果Pencil的基础，更是优于其他杂…

12-24

存量时代美妆集合店如何破局？Beauty Choice王恺：以“内容”驱动盈利扩张

12-24

优化调整与设备周期致进度延后安宁股份钛材料项目预计延期至明年6月底

12-24

三星全球首发2nm芯片Exynos 2600：未集成5G基带需外挂方案

不过三星未在Exynos 2600芯片中集成5G基带，这引发了外界对该芯片综合能效的质疑。虽然外挂基带方案简化了Exynos 2600的整体制造流程，有助于提升芯片的良率，但是其能效表现如何还要看真机实测…

12-24

2025年4G手机卡仍是宝藏？便宜够用覆盖广，选对套餐省钱又省心

运营商所说的“无限”通常分两种：一种是真·无限但会限速，比如你用完了200GB的高速流量后，网速可能会直接降到128kbps，这速度可能连刷个文字新闻都费劲。另一种则是定向流量无限，但通用流量限量，比如对特定…

12-24

环球园艺冲刺“花盆第一股”：20年深耕北美，60%毛利率背后的全球征途

12-24

钉钉加速AI化：半年百次迭代，重构未来工作新生态

12月23日上午，钉钉一口气发布了20多个AI产品，这是自8月底AI原生的钉钉1.0发布四个月后，钉钉的又一次重大版本升级。但让他自己都感觉夸张的是，从无招与他在与用户沟通之后到12月23日发布的版本，钉…

12-24

郑州二七区一宗涉宅用地成功出让亚星置业旗下企业溢价11.99%摘得

12-24

荣耀WIN系列携10000mAh电池登场，性能续航双王炸，电竞玩家新宠来了

除了荣耀 WIN，荣耀 WIN RT的续航成绩也经过多家媒体测试，同样“夯到顶”，彻底解决了电竞玩家的“续航焦虑”，让“两天一充”在高性能手机上成为基础。随后，在 2024 年 1月发布的荣耀 Magic…

12-23

小米17 Ultra将首发2亿像素连续光变技术 2026年或成独家拥有者

IT之家 12 月 23 日消息，博主 @数码闲聊站今日发文透露，小米 17 Ultra 手机将行业首发 2 亿像素连续光变：采用 200Mp1/1.4" 大底传感器、3G+5P 双浮动镜组设计，支持 7…

12-23

《数字市场法案》下苹果新动作：iOS 26.3为欧盟第三方配件解锁便捷新体验

在即将推出的 iOS 26.3系统中，欧盟可穿戴设备制造商迎来利好，现已可以测试近距离配对和改进的通知功能。这一功能的实现，将极大提升第三方设备与 iOS设备配对的便捷性，为用户节省大量时间和精力。需要…

12-23

3000-4000元手机怎么选？四款高性价比机型性能影像续航全解析

如果你正打算在这个价格区间入手一部新机，那么荣耀500Pro、vivo S50 Pro mini、OPPO Reno15 Pro、REDMI K90这四款机型值得关注。影像系统上，荣耀500Pro配备了一颗2…

12-23

点击查看更多 +

全站最新

12.98万起售的锐胜M8：大空间高配置，家庭商用皆宜的MPV新选择

环球园艺冲刺港交所：小花盆“盆”出大生意，60%毛利率能否撑起全球梦？

冰雪世界无畏驰骋：2026款越野炮解锁冬日越野的硬核新体验

AI数字人“入驻”大屏多场景，魔珐科技引领全空间智能交互新潮流

从“自嘲”到“爱己”：年轻人如何在和解中拥抱自我？

永州建材拥抱互联网：平台赋能，开启产业升级新篇章

热门内容

本栏最新

钉钉加速AI化：半年百次迭代，重构未来工作新生态

万宁莎莎国际相继撤离内地市场，香港美妆零售企业如何破局突围？

2025年科大讯飞智能录音笔怎么选？这三款性能出众，满足多样录音需求！

从“作坊”到“工程化”：解锁统一研发管理规范高效落地之道

线上产品控价难题如何破？四大策略构建品牌价格防护网

央视聚焦海尔卡奥斯：赋能中小企业数智跃升激活制造业新动能

PCDaliy智能日报 - 每日更新世界智能科技的最新进展、产品评测和行业动态，为您提供全面而深入的视角，让您在这个日新月异的智能时代始终领先一步。
PC Daily（www.pcd.com.cn）所有稿件免费开放转载，转载请务必保留版权，并注明来源网址。
合作微信：netspread（注明:智能日报）
Copyright © PCD 2012-2023 www.pcd.com.cn All rights reserved. 鲁ICP备2022032383号-10

字节跳动推出Seed Prover 1.5 模型 数学推理能力与效率显著提升

字节跳动推出Seed Prover 1.5 模型数学推理能力与效率显著提升