GPT Image 2 提示词指南:产品图、海报、UI 和图生视频写法

2026/04/25

如果 GPT Image 2 生成的图片经常跑偏,问题通常不是提示词不够长,而是提示词没有把关键决策讲清楚。模型会自动补全缺失信息,所以你没有写清楚的主体、角度、背景、文字和限制,都可能被随机生成。

这篇指南给你一套可复用结构,适合产品图、广告海报、UI mockup、头像、参考图编辑和图生视频第一帧。

GPT Image 2 提示词公式示意图,包含任务、主体、构图、光线和限制

这篇指南怎么整理出来的

这篇指南来自我们对产品白底图、生活方式广告、UI mockup、海报文字、参考图编辑和图生视频第一帧的提示词测试。我们保留的是更容易稳定主体、构图、文字和限制条件的写法,再把它们整理成可以直接复制和改写的模板。

通用提示词公式

可以先用这个结构:

生成一张 [图片格式],用于 [使用场景]。
主体:[必须准确的主体细节]。
构图:[镜头、角度、主体位置、画幅、留白]。
场景和光线:[背景、环境、光线、氛围]。
风格:[真实感、材质、设计风格]。
文字:[引号里的准确文字、位置、不要额外文字]。
限制:[不要出现什么、哪些细节必须保持不变]。

这个结构比“生成一张高级好看的图”更有效,因为它把图片任务拆成模型可以执行的视觉决策。

差提示词和好提示词的区别

差提示词通常只说想要什么结果:

给这个水杯做一张高级产品广告图。

这句话的问题是:没有说明广告尺寸、产品角度、背景、光线、文字、哪些细节不能变。模型只能自己猜。

更好的写法是:

生成一张竖版 4:5 产品广告图,主体是一只磨砂黑色保温杯。水杯正面居中,保持圆柱形杯身、杯盖结构和干净标签区域。使用深石墨色背景,一束冷色边缘光,底部有自然接触阴影。顶部添加一个大标题,文字为 "STAYS COLD ALL DAY"。不要添加其他文字、手、假 logo、水印或无关道具。

好提示词不是更长,而是更明确。它告诉模型三件事:

  • 这张图要用在哪里。
  • 哪些主体细节必须准确。
  • 哪些常见错误不要出现。

先判断搜索意图和使用场景

不同图片的提示词重点不同:

使用场景提示词重点
电商白底图产品形状、干净背景、真实阴影、不要道具
广告海报主体层级、标题文字、留白、活动氛围
UI mockup屏幕比例、模块结构、真实间距、可读标签
人物头像身份一致、姿势、服装、光线、背景
参考图编辑保持什么、替换什么、哪些细节不能变
图生视频第一帧清晰主体、稳定构图、无运动模糊、可运动空间

不要先堆风格词。先确定这张图要解决什么问题。

什么时候一定要用参考图

如果你只是在探索风格,纯文字提示词就够了。如果你需要保持具体对象,参考图会更稳。

建议上传参考图的场景:

  • 产品形状、颜色、logo 和包装比例必须准确。
  • 人物身份、发型、脸型、服装需要保持一致。
  • 房间结构、家具位置、镜头角度不能大改。
  • UI 页面布局需要接近已有设计。
  • 多张图或视频分镜需要同一个角色或同一个产品。

上传参考图以后,提示词里也要明确说明“保持什么”。不要只写“参考这张图”,而要写:

以上传图片为准,保持产品形状、颜色、logo 位置、标签文字和包装比例不变。只优化背景、光线、阴影和整体清洁度。

模板 1:电商白底产品图

生成一张方形电商产品图,主体是一只磨砂黑色保温杯。产品正面居中,完整可见,形状准确。使用纯白背景、柔和棚拍光、清晰边缘,底部有自然接触阴影。保持杯盖形状、杯身比例和标签区域干净可读。不要添加道具、手、额外包装、随机文字或水印。

这个模板适合商品列表页、产品详情页和 marketplace 图片。

关键点:

  • 开头就说明“方形电商产品图”。
  • 明确产品角度和位置。
  • 限制背景,避免画面杂乱。
  • 写清楚必须保持的产品细节。

更多产品类示例可以看 GPT Image 2 产品提示词库,也可以参考更细的 GPT Image 2 产品图 Prompt 工作流

模板 2:生活方式产品主图

生成一张横向生活方式产品主图,主体是一只陶瓷咖啡杯,放在温暖木质桌面左侧,旁边有一本合上的笔记本和一块浅色亚麻布。使用清晨窗边自然光、柔和阴影和高级但克制的工作空间氛围。右侧保留干净留白,方便放网页文案。保持杯子形状准确,不要让背景抢走主体。

生活方式图最常见的问题是背景比产品更显眼,所以要明确“主体是谁”和“留白在哪”。

模板 3:带文字的广告海报

生成一张竖版 4:5 产品广告海报,主体是一副无线耳机,悬浮在深石墨色台面上,有蓝色边缘光和干净反射。整体是现代科技广告风格。顶部只添加一个大标题,文字为 "SOUND WITHOUT LIMITS"。不要添加其他文字、假 logo、乱码或水印。下方三分之一区域留给按钮。

图片里的文字越多,出错概率越高。建议只放一个标题或一个短副标题,长文案应该放在网页里。

模板 4:UI mockup

生成一张真实的移动端 AI 图片生成器界面 mockup,画幅 9:16。界面包含顶部导航、提示词输入框、图片预览卡片、模型选择器、画幅比例控制和一个写着 "Generate" 的主按钮。使用干净现代的 SaaS 界面风格,标签清晰可读,间距真实。不要添加虚假品牌 logo 或不可读占位文字。

UI 图不要只写“科技感界面”。应该说明屏幕类型、模块结构、主要按钮和信息密度。

模板 5:参考图编辑

基于上传的产品参考图进行编辑。保持产品形状、拍摄角度、logo 位置、标签文字、包装比例和主体颜色不变。只优化背景、光线、台面质感和整体清洁度。将背景替换为浅灰色棚拍环境,增加柔和自然阴影。不要改动产品文字、尺寸或品牌标识。

参考图编辑的核心不是“变好看”,而是明确哪些东西绝对不能变。

什么时候不要只靠 AI 图片

GPT Image 2 适合快速生成方向、测试创意、做产品图变体、准备广告素材和图生视频第一帧。但有些场景不应该只靠 AI 图:

  • 商品颜色必须和实物完全一致。
  • 包装上有法律声明、成分表、医疗或安全信息。
  • 图片会直接影响用户购买决策,且不能有任何形状误差。
  • 你需要可编辑图层、精确字体、品牌规范或印刷文件。

这种情况下,可以先用 GPT Image 2 做概念图,再交给真实摄影、设计或后期流程完成最终版本。这样更安全,也更符合用户预期。

模板 6:图生视频第一帧

生成一张 AI 视频第一帧:一位年轻产品设计师站在明亮工作室的桌前,看向墙上的产品草图。宽镜头,主体轮廓清楚,柔和日光,比例真实,构图稳定,无运动模糊,无文字,无多余人物。

第一帧越清楚,后续图生视频越容易稳定。不要在第一帧里塞太多小物件。完整流程可以看 GPT Image 2 图生视频工作流

迭代时不要一次改太多

建议这样测试:

  1. 写一条基础提示词。
  2. 生成一到两张图。
  3. 选出最接近目标的一张。
  4. 找出最大的一个问题。
  5. 每次只改一个变量,比如背景、角度、光线或文字。
  6. 保存效果好的提示词模块。

如果一次同时改主体、背景、风格、画幅和文字,你很难判断到底是哪一部分产生了效果。

常见问题和修正方法

问题可能原因修正方法
产品形状变了没有说明要保持形状上传参考图,并写明保持形状和比例
文字乱码文字太多或位置不明确只保留一个短句,放进引号
画面太乱道具和风格太多减少背景元素,强调主主体
人脸太假只写了“好看”改成自然表情、真实皮肤、柔和光线
UI 不像真实产品没有描述结构写清页面类型、模块、按钮和标签
视频第一帧不稳场景太复杂简化主体、动作和背景

生成前检查清单

  • 主体是否在第一句话里说清楚?
  • 图片用途是否明确?
  • 画幅和构图是否写了?
  • 文字是否短且准确?
  • 是否说明哪些细节必须保持?
  • 是否删除了冲突的风格词?
  • 页面里是否有合理的下一步链接?

你可以先从 GPT Image 2 提示词库 找接近的示例,再到 GPT Image 2 生成器 里小步测试。这样比随机写 Prompt 更容易沉淀出稳定结果。

操作步骤

  1. 明确图片任务

    先判断图片要用于产品展示、广告海报、UI 概念、头像、参考图编辑,还是图生视频第一帧。

  2. 锁定主体信息

    写清楚主体类型、材质、颜色、角度、文字、结构,以及必须保持不变的细节。

  3. 确定构图和画幅

    在风格词之前说明镜头距离、主体位置、画幅比例、留白区域和版式层级。

  4. 加入光线、风格和限制

    补充背景、光线、视觉风格、文字要求和不希望出现的元素。

  5. 一次只改一个变量

    保留效果最好的提示词,每次只改背景、角度、光线或文字中的一个变量。

常见问题

GPT Image 2 提示词应该怎么写?

建议按任务、主体、构图、场景、光线、风格、文字要求和限制条件的顺序来写,最重要的信息放在前面。

GPT Image 2 提示词越长越好吗?

不一定。好的提示词通常是 60 到 160 个英文词或对应长度的中文描述,关键是每一句都提供明确的视觉决策。

怎样让图片里的文字更清楚?

把文字放进引号,减少文字数量,说明位置和层级,并要求不要添加额外文字、乱码、水印或随机字母。

什么时候应该用参考图?

当你需要保持人物身份、产品形状、品牌风格、房间结构或界面布局时,参考图比纯文字更稳定。

GPT Image 2 Team

Editorial