PCDaily手机网站站内搜索

提供便携式设备、创新应用和趋势洞察的深度报道，帮助您在快速发展的科技世界中保持前沿！

滚动资讯

当前位置：智能日报 > 业界资讯 > 正文内容

苹果UniGen 1.5模型：图像理解生成编辑一肩挑，创新突破引关注

时间：2025-12-20 15:38 来源：快讯作者：冯璃月

苹果公司研究团队近期在人工智能领域取得重要进展，正式推出多模态AI模型UniGen 1.5。该模型突破传统架构设计，首次在单一系统中整合图像理解、生成与编辑三大核心功能，为视觉任务处理提供了全新解决方案。相较于依赖多个独立模型分工协作的传统方案，统一架构设计使模型能够通过深度理解图像内容优化生成效果，实现更精准的视觉输出。

针对图像编辑任务中普遍存在的指令理解难题，研究团队创新开发"编辑指令对齐"技术。该方案通过引入中间预测环节，要求模型先根据原始图像和用户指令生成目标图像的详细文本描述，再执行具体编辑操作。这种"先构思后执行"的机制迫使模型深度解析编辑意图，有效解决了传统模型对复杂指令捕捉不精准的问题。实验数据显示，该技术使编辑准确度获得显著提升。

在强化学习机制方面，研究团队突破性地设计出统一奖励系统，首次实现图像生成与编辑任务的协同优化。由于编辑任务涵盖从细微调整到结构重构的广泛需求，此前统一质量评估标准始终难以建立。新系统通过量化不同任务的质量指标，使模型在处理各类视觉任务时能保持稳定表现，增强了系统对复杂场景的适应能力。

尽管取得突破性进展，研究团队在论文中坦承模型仍存在改进空间。受离散去标记器技术限制，模型在生成图像中的文字内容时易出现错误。在特定编辑场景下，模型偶尔会发生主体特征偏移现象，例如动物毛发纹理或羽毛颜色的异常变化。这些技术瓶颈将成为后续优化的重点方向。

更多>同类内容

摩尔线程“长江”智能SoC芯片亮相：8核全大核，多场景应用性能强劲

IT之家 12 月 20 日消息，摩尔线程今天举办首届 MUSA 开发者大会，发布新一代 GPU 架构“花港”，同时还带来了“长江”智能 SoC芯片。据摩尔线程创始人、董事长兼 CEO 张建中现场介绍，这…

12-20

小米汽车获L3级道路测试牌照，常态化测试探索未来智能出行新可能

12-20

深圳跨境电商创新引领：“一站式”服务助力产业带，“新国货”扬帆全球市场

12-20

AI视频生成：从技术突破到重塑创作生态，开启全民创作新纪元

因此，最近这一年，国内外涌现出大量围绕AI视频生成的产业链上下游的创业公司：有的从视频生成能力本身出发，重构视频制作的起点；有的围绕创作者工作流，将AI融入脚本、分镜与剪辑；还有的面向企业与行业场景，强调稳…

12-20

HMD Terra M三防手机谍照流出 2.8英寸屏+双卡eSIM 续航长达10天

IT之家 12 月 19 日消息，HMD Global 在今年 11 月推出了 Terra M 三防功能机，该机将于明年第一季度上市。目前消息源 Hikari_Calyx（光卡）在诺记吧公布了这款手机的真机谍…

12-20

2000元档拍照手机大比拼，荣耀500凭2亿像素领跑影像性价比之选

三颗5000万像素镜头覆盖主摄、超广角和3X长焦，其中长焦镜头同样具备OIS防抖。综合影像硬件、算法调校和性价比，荣耀500以2亿像素主摄+全能实况功能为核心卖点，配合8000mAh续航组合，成为2000元…

12-20

从传统到创新：我军兵棋推演系统在智能赋能下开启人机协同新篇章

“一战一棋”就是在通用标准下，为每一场特定战事细化交战规则、搭建对抗环境，有针对性地让官兵们直面战场。无论是哪种兵棋，都和游戏有相似之处，这也体现了兵棋的趣味性，但事实上兵棋是最贴近实际的战争模拟工具，被…

12-20

指南针子公司麦高证券获上交所认可拟非公开发行4.8亿次级债券

12-20

万科泊寓深圳清退10余家非核心区门店聚焦优质资产提升运营效率

12-20

阿里千问“干死豆包”标语引关注内部人士辟谣竞品争夺AI入口成焦点

内部人士表示，该图片为假，“完全就是编造的，Logo也是错的，工牌也是错的，两边的标语一看就是故意造谣的”。2025年11月，阿里正式启动了千问App公测，其在AI超级入口竞争中迈出关键一步。在技术层面，…

12-19

好特卖多地闭店、新加盟放缓？曾引折扣零售热潮，官方回应与背后原因揭秘

有媒体报道，多地消费者在社交平台发信息称，好特卖正在陆续关闭其在核心城市的门店，涉及广州、长沙、杭州、北京等城市热门商圈。有工作人员称，目前只开放上海、南京、广州等7个城市的加盟，因为好特卖核心店铺基本都在…

12-19

中国中免A股午后涨停成交超52亿获上海机场免税店项目中标通知

12-19

OpenAI拟募资千亿美元，估值或达8300亿，AI竞争再升温

12-19

vivo S50 Pro mini深度体验：小屏旗舰的精致美学与全能实力

12-19

中科曙光全球首发scaleX万卡超集群，多项技术突破引领AI计算新高度

通过“超级隧道”、AI数据加速等设计，实现从芯片级、系统级到应用级的三级数据传输协同优化，使存力平台高效应对大模型训练时万卡并发读写带宽极致需求挑战，提升高通量AI推理时的响应速度与结果精准度，并可将AI加速…

12-19

点击查看更多 +

全站最新

华为乾崑赋能猛士M817，靳玉志亲选，开启豪华智能越野新征程！

客易云数字人：以创新科技赋能，开启跨境电商直播全新篇章

阿里千问辟谣“被AI恶搞”：网络流传全员会吃豆包图系AI伪造

京东七鲜石家庄首店引抢购；拼多多锚定中国供应链；多品牌出海与行业新动态

智元机器人引领变革：上海数采中心助力 5万元家用机器人未来可期

销量低迷的飞度迎来改款，外观运动配置升级，能否在新能源浪潮中逆袭？

热门内容

本栏最新

从传统到创新：我军兵棋推演系统在智能赋能下开启人机协同新篇章

阿里千问“干死豆包”标语引关注内部人士辟谣竞品争夺AI入口成焦点

好特卖多地闭店、新加盟放缓？曾引折扣零售热潮，官方回应与背后原因揭秘

周受资内部信揭TikTok美国新布局：字节留商业核心，新合资保数据安全

AI浪潮下蚂蚁阿福崛起，百度医疗广告基本盘或遭根本性撼动

小店遍地开花，旗舰店重金打造，品牌双线布局背后的消费新逻辑

PCDaliy智能日报 - 每日更新世界智能科技的最新进展、产品评测和行业动态，为您提供全面而深入的视角，让您在这个日新月异的智能时代始终领先一步。
PC Daily（www.pcd.com.cn）所有稿件免费开放转载，转载请务必保留版权，并注明来源网址。
合作微信：netspread（注明:智能日报）
Copyright © PCD 2012-2023 www.pcd.com.cn All rights reserved. 鲁ICP备2022032383号-10