GPT Image 1.5 是 OpenAI 最新的图像生成模型,于 2025 年 12 月 16 日发布。与使用独立扩散系统的早期图像模型不同,GPT Image 1.5 直接内置于 GPT-5 架构中。处理文本的同一神经网络也生成图像,从而实现更好的理解和更精确的控制。它的图像生成速度比以前的版本快 4 倍,同时更准确地遵循提示词。
修改图像的特定部分,同时保持其他所有内容不变。确定性编辑工作流,理解针对性更改与完全重新生成之间的区别。
在图像中生成可读文字,包括小文字、密集段落和复杂布局。OCR 感知生成,具有正确的拼写、对齐、字距和字重。
同一神经网络处理文本并生成图像。更好地理解意图、更强的世界知识以及与对话工作流的无缝集成。
根据复杂性和质量设置,在 15-45 秒内生成图像。比以前的版本快得多,适合快速迭代和生产工作流。
GPT Image 1.5 通过基础架构改进解决了早期图像生成器的特定问题。
识别哪些像素应该改变,哪些应该保持不变。在不丢失原始构图的情况下连续进行多次编辑。请求小更改时不再完全重新解释。
理解包含构图、光照、风格和元素详细规格的多步指令。系统地处理指令,而不是关键词猜测。在多次编辑中保持上下文。
从上下文信息推断相关细节。当给出 '1969 年 8 月纽约贝塞尔' 等上下文时,生成上下文适当的图像,无需明确说明每个元素。
三种质量设置优化速度或细节。低质量用于快速迭代,中等质量用于平衡用例,高质量用于生产工作。灵活的成本性能权衡。
带有特定文案的营销材料、带有准确标签的教育信息图表、带有真实界面文字的 UI 模型、带有详细内容的演示幻灯片。文字可读,而非装饰性。
进行更改时记住先前状态。无需重新开始的实用迭代完善。在编辑会话中保持一致性。
GPT Image 1.5 能力和输出格式:
三种尺寸可用:1024×1024(方形)、1024×1536(纵向)和 1536×1024(横向)。针对不同用例和宽高比进行优化。
根据复杂性和质量设置,每张图像 15-45 秒。比以前的版本快 4 倍。支持快速迭代和生产工作流。
低质量用于草稿和快速迭代。中等质量用于平衡速度和细节。高质量用于最终生产工作。根据具体需求选择。
在我们的平台上轻松使用,简单的操作界面让所有用户都能快速上手。
精确控制地创建和编辑图像:
提供包含构图、光照、风格和元素规格的详细文本描述。模型系统地处理指令以获得准确结果。
请求对图像部分进行特定更改。模型识别目标区域并仅修改这些区域,同时保留其他所有内容。连续进行多次编辑。
生成带有可读文字的营销材料、信息图表、UI 模型和演示文稿。指定文案、标签和界面文字以进行准确渲染。
从低质量开始快速探索。使用中等质量完善以获得平衡结果。使用高质量完成生产。模型在编辑中保持上下文。
GPT Image 1.5 专为需要精确性、文字准确性和迭代控制的专业工作流设计。
关于 GPT Image 1.5 AI 图像生成模型的常见问题。