阿里发布首个原生语言世界模型Qwen-AgentWorld，开启智能体环境模拟新篇章-智能手机-智能日报

阿里近日在人工智能领域取得重要进展，正式推出首个原生语言世界模型（LWM）Qwen-AgentWorld。该模型专为AI智能体研发设计，提供35B-A3B与397B-A17B两种参数规模版本，旨在通过内部环境模拟增强智能体的决策能力，而非替代真实交互场景。

与传统训练方式不同，Qwen-AgentWorld在预训练阶段即引入环境建模目标，贯穿CPT→SFT→RL全流程。此前通用模型通常在训练后期才加入环境理解模块，而新模型通过早期整合实现更高效的能力迁移。其核心突破在于单模型覆盖文本类（MCP、Search、Terminal、SWE）与GUI类（Web、OS、Android）共七大交互环境，支持跨领域知识共享。例如在模拟手机系统时，模型能准确预测点击删除图标后的界面变化；在电脑系统模拟中，可完整呈现从菜单栏选择"文件-打印"的操作路径。

研究团队同步发布配套评测基准AgentWorldBench，该基准基于5个前沿模型在9个成熟评测集上的真实交互数据构建，采用开放式评分体系从格式、事实性、一致性等五个维度评估模型表现。测试结果显示，397B-A17B版本以58.71分的综合得分超越GPT-5.4（58.25分）、Claude Opus 4.8及Gemini 3.1 Pro，在代码执行（Terminal）和工具调用（SWE）领域优势尤为显著。35B-A3B版本通过三阶段训练流水线提升8.66分，性能超越Claude Sonnet 4.6。

深入分析129条文本类交互数据后，研究人员发现模型涌现出三种独特推理模式：在自我修正方面，模型通过"Wait!"信号触发中止，平均每轮交互修正10.4次错误；信息防护机制可防止搜索场景中的答案泄露，当查询与预设答案无关时自动屏蔽敏感信息；多步因果推理能力体现在复杂命令模拟中，如预测"curl -s localhost:3000 | python3 -m json.tool"需构建包含服务器状态、端口监听等6个环节的推理链。

该模型已通过GitHub、ModelScope和Hugging Face平台开源，包含模型权重与评估基准。研究团队强调，语言世界建模并非要取代真实环境交互，而是通过可控性、可扩展性及内化预测能力，为智能体训练提供互补路径。这种技术路线有望突破现有智能体在复杂场景中的能力边界，为构建更强大的通用AI系统奠定基础。

快科技6月24日消息，芯联集成近日发布对外投资进展公告，公司与芯联先进集成电路制造（绍兴）有限公司（简称“芯联先进”）、绍兴柯桥芯合先进集成创业投资基金合伙企业（有限合伙）（简称“产业基金”）共同签署《增资及…

智东西6月24日报道，今天下午，联想集团在自家算力生态大会上正式发布了联想问天超节点解决方案，联想万全异构智算方案升级至5.0大版本，其重点通过集群训推加速、芯模编译优化两个关键技术升级，提升了方案的场景自…

IT之家 6 月 24 日消息，红魔游戏手机产品总经理姜超今日开箱了红魔游戏平板 5 Pro。据介绍，红魔游戏平板 5 Pro 正面配备一块9.06 英寸 OLED 屏幕，采用 4.9mm 极窄四等边设计…

按照方飞在演讲中公开透露的最新信息，荣耀完全以人为核心打造的下一代终端操作系统AgenticOS，确定将会在下个月正式和公众见面。系统以AI Agent作为原生内核支撑，具备全场景主动智能能力，可以主动预…

2026年6月5日，奥地利维也纳 —— 在全球高端音响行业盛会 HIGH END Vienna 现场，Questyle（旷世之声）正式发布全新easyHiFi 无线一体化高保真音响系统 E5，并宣布与全球…

从目前的情况来看，Xiaomi智能存储可能是这两年最生不逢时的产品，几乎没有之一。作为苹果用户，随着照片和视频的不断增加，iCloud的使用费用越来越高，这也是小编期待小米智能存储的主要原因之一，毕竟目前家…

在AI（人工智能）领域，字节跳动是最受关注的公司之一，谭待回应了关于国产算力替代、MaaS出海、字节AI Coding进展等行业关心的疑问。除了Seedance，字节的大语言在海外也有案例，如在Coding…

这次不是在什么国际峰会、高端论坛，而是在杭州郊外的一片水田里，光着脚丫子，裤腿卷到膝盖，弯腰下去，手里攥着一把秧苗，踩得满腿泥浆。在大炮看来，阿里的这场插秧大戏，本质上是一场精心编排的公关行为艺术，至少…

周鸿祎表示，AI正从"能回答问题"走向"能上手干活"，纳米Work要让智能体真正进入人们的工作流程把活干完，把成品交到用户手上。据周鸿祎介绍，360对这款产品进行了深度优化，把它变得好用、省钱、更具确定性，…

证券之星消息，截至2026年6月23日收盘，石头科技(688169)报收于94.96元，下跌3.56%，换手率2.32%，成交量6.02万手，成交额5.8亿元。 6月23日的资金流向数据方面，主力资金净流出5…

快科技6月23日消息，REDMI产品经理胡馨心暗示，REDMI K90至尊版预计将在明天正式官宣发布时间。小米集团总裁卢伟冰表示，2026年行业普遍涨价，2-3K价位段的性能机变得愈发稀缺。REDMI深知行…

PCDaliy智能日报 - 每日更新世界智能科技的最新进展、产品评测和行业动态，为您提供全面而深入的视角，让您在这个日新月异的智能时代始终领先一步。
PC Daily（www.pcd.com.cn）所有稿件免费开放转载，转载请务必保留版权，并注明来源网址。
合作微信：netspread（注明:智能日报）
Copyright © PCD 2012-2023 www.pcd.com.cn All rights reserved. 鲁ICP备2022032383号-10 鲁公网安备37010202700527号