OpenAI近日正式发布了新一代图像生成模型gpt-image-1.5,此举被视为对Google Gemini体系下热门产品Nano Banana系列的直接回应。新模型不仅面向开发者开放,还全面接管了ChatGPT的图像生成功能,旨在巩固其在AI图像生成领域的领先地位。这一升级标志着OpenAI在图像生成技术领域的又一次重要突破。
今年早些时候,OpenAI曾为ChatGPT的图像生成功能带来重大升级,新模型上线后迅速获得用户青睐,一周内生成图片数量突破7亿张。随后在4月,OpenAI通过推出gpt-image-1接口,将这项技术开放给开发者,使其能够在各种应用和服务中集成图像生成能力,进一步扩大了技术影响力。
与此同时,Google在9月推出的Gemini Nano Banana模型凭借其卓越的图像生成和编辑性能,迅速成为市场焦点。该模型在画面质量和编辑灵活性方面表现突出,被认为全面超越了OpenAI的gpt-image-1,并获得了全球开发者的广泛认可。上个月,Google又推出了Gemini 3 Pro Image(代号Nano Banana Pro),进一步提升了生成图像的准确性和一致性,巩固了其在图像生成领域的优势。
面对Google的强劲挑战,OpenAI推出的gpt-image-1.5被寄予厚望。新模型在图像编辑的精细度、品牌Logo和人脸等关键元素的保真度方面均有显著提升,同时能够更精准地理解和执行用户指令。特别是在处理图像中的文字时,新模型在密集文本和小字号文本的清晰度与正确性上表现尤为出色,满足了用户对高质量图像生成的更高需求。
对于开发者而言,gpt-image-1.5的另一大亮点是成本优化。与上一代模型相比,新模型在图像输入与输出的计费上降低了约20%,同时开发者仍可通过quality参数灵活控制生成成本。OpenAI表示,即使在较低质量设置下,新模型仍能保持强大的生成效果,为开发者提供了更具性价比的选择。
对于普通用户来说,gpt-image-1.5已经成为ChatGPT内置图像生成体验的核心引擎。新模型能够在保持光线、构图和人物特征等细节基本不变的前提下,实现精准编辑,性能提升最多可达4倍,生成与编辑响应速度更快,为用户带来了更加流畅和高效的图像生成体验。













