OpenAI推出GPT-5.4模型:具备原生计算机操作能力 开启智能体新篇章

   时间:2026-03-07 19:27 来源:快讯作者:任飞扬

人工智能领域迎来重要进展,OpenAI宣布推出新一代AI模型GPT-5.4。这款模型在计算机操作能力上实现突破性进展,成为该公司首个具备原生计算机交互能力的产品。用户可通过模型授权其代为操作计算机,实现跨应用程序的任务执行,标志着AI技术向实用化方向迈出关键一步。

新模型在专业领域展现出显著优势,特别是在电子表格处理、文档编辑和演示文稿制作等办公场景中表现突出。研发团队特别强化了其编程能力,模型不仅能自动生成代码,还能通过分析屏幕截图理解用户意图,精准执行键盘和鼠标操作。网络浏览器使用体验也得到优化,工具调用和API接口对接的准确率大幅提升。

针对复杂信息处理场景,GPT-5.4开发了多轮搜索机制。当面对需要整合多个信息源的"大海捞针"类问题时,模型能持续进行深度检索,自动筛选最相关内容并生成结构化答案。官方测试数据显示,与前代GPT-5.2相比,新模型在事实陈述准确性上提升33%,错误率显著降低。

在交互设计方面,ChatGPT平台新增的Thinking功能引发关注。该功能为复杂查询提供可视化工作框架,用户可在响应过程中实时调整需求方向,避免重复交互。这项改进特别适用于需要多步骤推导的专业咨询场景,有效提升了人机协作效率。

产品部署采用分层策略:基础版GPT-5.4通过API和编程工具Codex开放使用;Thinking功能面向Plus会员、企业团队和专业用户提供;针对高强度计算需求推出的Pro版本,则在企业版和教育版平台独家上线。移动端适配工作正在推进,Android用户已可体验完整功能,iOS版本预计近期发布。

技术团队透露,新模型通过强化学习框架实现了计算机操作能力的突破。在模拟环境中完成的数十亿次交互训练,使其掌握了主流操作系统的使用逻辑。这种技术路径为AI从信息处理向行动执行转型提供了新范式,可能引发智能助手领域的范式变革。

 
 
更多>同类内容
全站最新
热门内容