MCPcopy
hub / github.com/wuyoscar/GPT-Image2-Skill

github.com/wuyoscar/GPT-Image2-Skill @v0.2.0 sqlite

repository ↗ · DeepWiki ↗ · release v0.2.0 ↗
12 symbols 49 edges 3 files 3 documented · 25%
README

GPT Image 2 Prompt Gallery + Agentic Skill + CLI

OpenAI GPT Image 2 Prompt Gallery、Image Prompt Library、Agentic Skill + CLI — 面向支持 Skill 的 Agent 运行时的精选可复用提示词与可运行示例。

English · 中文

CC BY 4.0 PRs Welcome 模型: gpt-image-2 Python ≥ 3.11

GPTImage2Skill 横幅


✨ 一眼看懂

项目 内容
图库规模 162 条提示词 / 162 个图片资产 · README 展示精选样张
支持形态 Agentic Skill + CLI — Claude Code / Codex、OpenClaw、Hermes Agent,以及其他支持 Skill 的 Agent 运行时
最后更新 2026-04-25
文档 English + 中文

🔎 这个仓库适合什么场景

你可以把它当作 GPT Image 2 Prompt GalleryImage Prompt LibraryText-to-Image Prompt CollectionImage-to-Prompt Scale / ReferencePrompt-to-Image 示例仓库Codex / Claude Code Agent Skillgpt-image-2 CLI。目前收录了科研配图、海报设计、UI Mockup、游戏 HUD、动漫 / 漫画、摄影风格、字体设计、地图导航、纹身设计,以及参考图编辑等 AI image prompts / examples。


欢迎贡献 — 请查看 CONTRIBUTING.mdCODE_OF_CONDUCT.mdSECURITY.md

📥 安装

Claude Code

/plugin marketplace add wuyoscar/gpt_image_2_skill
/plugin install gpt-image@wuyoscar-skills

Codex

Codex 内置了 $skill-installer$skill-creator 等 Skill 管理工具。 打开 Codex,然后让内置安装器安装这个 GitHub skill 文件夹:

$skill-installer install https://github.com/wuyoscar/gpt_image_2_skill/tree/main/skills/gpt-image

Codex 会下载这个 GitHub 文件夹,并放到你的 Codex skills 目录,通常是:

~/.codex/skills/gpt-image

安装后重启 Codex,让新的 $gpt-image skill 生效。

如果你想手动安装,可以把 skill 文件夹复制到 Codex 的 skills 目录:

git clone https://github.com/wuyoscar/gpt_image_2_skill.git
cd gpt_image_2_skill

mkdir -p "${CODEX_HOME:-$HOME/.codex}/skills"
cp -R skills/gpt-image "${CODEX_HOME:-$HOME/.codex}/skills/"

手动安装 Agent Skill

AGENT_SKILLS_DIR 设置为你的 Agent 运行时所使用的 skills 目录,然后把本仓库的 skill 文件夹软链接进去。

git clone https://github.com/wuyoscar/gpt_image_2_skill.git
cd gpt_image_2_skill

# 选择你的运行时对应的 skills 目录。
# 示例:
#   Codex:      ~/.codex/skills
#   Claude Code / OpenClaw / Hermes Agent / 其他运行时:使用该运行时文档指定的 skills 目录。
export AGENT_SKILLS_DIR="/path/to/your/agent/skills"

mkdir -p "$AGENT_SKILLS_DIR"
ln -s "$PWD/skills/gpt-image" "$AGENT_SKILLS_DIR/gpt-image"

CLI

uvx --from git+https://github.com/wuyoscar/gpt_image_2_skill gpt-image -p "a cat astronaut"

# 或安装到 PATH
uv tool install git+https://github.com/wuyoscar/gpt_image_2_skill
gpt-image -p "a cat astronaut"

更新

# 插件:使用 Claude Code 的更新流程
# codex 技能:重新运行安装器
# 手动 git 克隆方式
cd gpt_image_2_skill && git pull

# CLI
uv tool upgrade gpt-image-cli

从环境变量或 ~/.env 读取 OPENAI_API_KEY


⚡ 快速使用与提示词基础

CLI 快速使用

安装后,下面每个图库条目都可以复制粘贴为 gpt-image -p "…",也可以在任何支持 Skill 的 Agent 运行时里用自然语言请求,例如:“生成技能图库中的波士顿春季海报”

文本 → 图片

gpt-image -p "晚上10点的逼真便利店" --size 1k --quality high -f store.png

底层实现:POST /v1/images/generations,使用 model=gpt-image-2

文字 + 参考图像 → 图像(编辑)

# 单参考图编辑 / 重风格化
gpt-image -p "让它成为一个下大雪的冬日晚景" \
  -i chess.png --quality high -f chess-winter.png

# 多参考图编辑:edits 端点可以同时接收多张输入图
gpt-image -p "把第 2 张图里的狗放到第 1 张图的女人旁边,匹配相同的光线、构图和背景,不要改动其他任何内容。" \
  -i woman.png -i dog.png --size portrait --quality medium -f woman-with-dog.png

# 基于掩码的修补:不透明部分 = 保留,透明部分 = 重新生成
gpt-image -p "将天空替换为极光" \
  -i photo.jpg -m sky_mask.png -f aurora.png

底层实现:POST /v1/images/edits(多部分表单),这是 OpenAI Cookbook 中的官方接口。gpt-image-2 支持 imagemaskpromptsizequalitybackgroundoutput_formatn。支持多个 -i 输入以进行多参考图像编辑。

参数(完整)

显示完整参数参考

标志 取值 默认值 适用范围 备注
-p, --prompt 字符串 — 必需 两者 完整的提示文本。
-f, --file 路径 ./fig/YYYY-MM-DD-HH-MM-SS-<slug>.png 两者 明确输出路径。
-i, --image 路径(可重复) 编辑 存在时走 /v1/images/edits 路由。
-m, --mask 路径(PNG,带alpha通道) 编辑 不透明 = 保留,透明 = 重新生成。需要 -i
--input-fidelity low · high 编辑 gpt-image-1/1.5 支持;gpt-image-2 会拒绝这个参数,所以 CLI 会在本地直接丢弃它。
--size 1k · 2k · 4k · portrait · landscape · square · wide · tall · 字面量如 1024x1024 1024x1024 两者 字面量必须为16像素倍数,最大边3840,比例限制3:1,像素总数介于655k–8.3M之间。
--quality auto · low · medium · high high 两者 这是一个实用预算调节:low 用于便宜的草稿/大规模生成,medium 用于正常探索,high 用于最终以文本为主或面向发布的资源。
-n, --n 整数 1 两者 批量生成。n>1 时文件名后缀依次为 _0_1、…
--background auto · opaque API 默认 生成 opaque 禁用透明度。
--moderation auto · low low 生成 这里默认用 low,更适合广泛探索提示词;如果你想回到更严格的 API 侧默认行为,就手动切到 auto
--format png · jpeg · webp png 两者 响应编码格式。
--compression 0–100 两者 仅适用于 JPEG/WebP。

预算 / 质量指南

这里没有单独的 budget 标志——使用 --quality 作为预算调节。

  • low = 便宜的草稿 / 收集 / 多变体
  • medium = 正常探索 / 风格试探
  • high = 最终海报,中文文本,图表,论文图形,横幅

如果你要生成数十个候选项,先从 low 开始,仅对决选的最终稿使用 high 重新运行。

从画廊 Prompt → CLI / SDK

下面每个条目只给出提示词加一行元数据"size" · "quality" · 来源)。CLI 与 SDK 的调用永远按同样的方式装配——这里示范一次,后面的条目就不再重复这两段样板。以 "portrait" · "high" 条目为例:

# CLI
gpt-image -p "<条目中的提示词>" --size portrait --quality high -f out.png
# OpenAI SDK —— size 传字面像素值;CLI 的 portrait 简写对应 1024x1536
from openai import OpenAI
client = OpenAI()
result = client.images.generate(
    model="gpt-image-2",
    prompt="<条目中的提示词>",
    size="1024x1536",
    quality="high",
)

遇到需要参考图的编辑任务,在 CLI 上追加 -i ref.png(可重复)以及可选的 -m mask.png,或把 SDK 调用换成 client.images.edit(...) 并传 image=[open(p, "rb") for p in refs]。其余参数与 generate 完全一致。

退出代码:0 成功 · 1 API/拒绝错误(完整响应体打印到 stderr) · 2 参数错误或缺失 OPENAI_API_KEY

📖 提示词基础

显示提示词笔记

摘自 OpenAI 的官方 GPT Image 提示指南 (本地也存档于 skills/gpt-image/references/openai-cookbook.md — 当你询问参数语义、编辑、UI 原型、推介幻灯片、科学视觉、虚拟试穿、广告牌模型或翻译编辑时,技能会按需加载):

  1. 先结构,再目标。 使用一致的顺序:背景/场景 → 主体 → 关键细节 → 限制条件,并说明预期用途(广告、UI 原型、信息图),以便模型选择正确模式和润色等级。
  2. 任何格式都可;一致性更重要。 简短提示、描述段落、JSON 风格结构、指令风格提示和标签式提示均可。生产中建议使用易快速浏览的模板,而非巧妙语法。
  3. 具体 + 质量线索。 要具体说明材料、形状、纹理和媒介(照片、水彩、3D 渲染)。仅在必要时添加针对性的质量线索:胶片颗粒纹理笔触微距细节。要实现照片级真实感,直接写 “photorealistic”“真实照片”“用真实相机拍摄”“iPhone 照片” 也有帮助。
  4. 将必需文本用引号括起来。 任何必须出现在图片中的文本 —— 标语、价格、汉字 —— 应用直引号括起。不要在提示中换种说法。
  5. 提前选择宽高比。 提示前先确定 1:1 / 3:4 / 4:3 / 9:16 / 16:9 / 3:1。并在提示文本中强化,而不仅仅是用 --size
  6. 一主角,配角辅助。 复杂场景最好有一个明显的主体,其它作为配角细节表现。
  7. 文本内嵌、密集图表、小标签和多面板布局用 quality="high" 中档会明显降低效果。

这个 skill 提供四个本地 reference surface: - skills/gpt-image/references/gallery.md — 轻量级路由索引,用来为拆分后的 162 条 Prompt Scale Atlas 选择 category;它本身不是完整 Prompt dump。 - skills/gpt-image/references/gallery-*.md — 每个 category 一个文件,只在相关任务中加载,例如 gallery-product-and-food.mdgallery-ui-ux-mockups.mdgallery-research-paper-figures.md。这样既能复用 Scale,又不会撑爆上下文。 - skills/gpt-image/references/craft.md — 扩展后的 19 节 Prompt Craft 清单,覆盖 Scale-first 使用方式、JSON/config-style Prompt、多面板排版、UI 规格、数据/图表语法、编辑不变量、参考图工作流、密集文本和分类 mini-schema。 - skills/gpt-image/references/openai-cookbook.md — OpenAI Cookbook 的逐字 Markdown 捕获(1004 行),包括权威的参数覆盖表和所有第4/5节用例示例。


🎨 提示词精选展示

关于这些提示词。 README 里展示的是一组有代表性的 prompt 及其对应生成图。完整 Reference Gallery 包含全部 162 条提示词和 162 个图片资产,按分类整理在 skills/gpt-image/references/gallery.md 和对应的 skills/gpt-image/references/gallery-*.md 文件中。

来源标签。 Curated 表示由本 repo 整理、改写或重新设计的 prompt / image;外部来源条目继续保留可见的作者和来源链接。

🎌 动漫与漫画 完整图库 MD 🎮 游戏 完整图库 MD 🤖 复古与赛博朋克 完整图库 MD
🎬 电影与动画 完整图库 MD 👤 角色设计 完整图库 MD 📝 排版与海报 完整图库 MD
🎨 插画 完整图库 MD 💧 水彩 完整图库 MD 🖌️ 墨与中国 完整图库 MD
🕹️ 像素艺术 完整图库 MD 📐 等距视图 完整图库 MD 📦 产品与食品 完整图库 MD
🧩 品牌系统与视觉识别 完整图库 MD 📷 摄影 完整图库 MD 🖥️ 屏幕摄影 完整图库 MD
📊 信息图表与实地指南 完整图库 MD 📚 研究论文图示 完整图库 MD 🏢 官方 OpenAI Cookbook 示例 完整图库 MD
编辑端点展示 完整图库 MD 📱 UI/UX 原型图 完整图库 MD 📊 数据可视化 完整图库 MD
⚙️

Core symbols most depended-on inside this repo

resolve_size
called by 2
src/gpt_image_cli/cli.py
_filter_none
called by 2
src/gpt_image_cli/cli.py
main
called by 2
src/gpt_image_cli/cli.py
_load_env_chain
called by 1
src/gpt_image_cli/cli.py
slugify
called by 1
src/gpt_image_cli/cli.py
default_output_path
called by 1
src/gpt_image_cli/cli.py
model_rejects_input_fidelity
called by 1
src/gpt_image_cli/cli.py
parse_args
called by 1
src/gpt_image_cli/cli.py

Shape

Function 12

Languages

Python100%

Modules by API surface

src/gpt_image_cli/cli.py11 symbols
src/gpt_image_cli/__init__.py1 symbols

Dependencies from manifests, versioned

openai1.55 · 1×
python-dotenv1.0 · 1×

For agents

$ claude mcp add GPT-Image2-Skill \
  -- python -m otcore.mcp_server <graph>

⬇ download graph artifact