hub / github.com/wuyoscar/GPT-Image2-Skill

github.com/wuyoscar/GPT-Image2-Skill @v0.2.0 sqlite

repository ↗ · DeepWiki ↗ · release v0.2.0 ↗

12 symbols 49 edges 3 files 3 documented · 25%

README

GPT Image 2 Prompt Gallery + Agentic Skill + CLI

OpenAI GPT Image 2 Prompt Gallery、Image Prompt Library、Agentic Skill + CLI — 面向支持 Skill 的 Agent 运行时的精选可复用提示词与可运行示例。

✨ 一眼看懂

项目	内容
图库规模	162 条提示词 / 162 个图片资产 · README 展示精选样张
支持形态	Agentic Skill + CLI — Claude Code / Codex、OpenClaw、Hermes Agent，以及其他支持 Skill 的 Agent 运行时
最后更新	2026-04-25
文档	English + 中文

🔎 这个仓库适合什么场景

你可以把它当作 GPT Image 2 Prompt Gallery、Image Prompt Library、Text-to-Image Prompt Collection、Image-to-Prompt Scale / Reference、Prompt-to-Image 示例仓库、Codex / Claude Code Agent Skill 和 gpt-image-2 CLI。目前收录了科研配图、海报设计、UI Mockup、游戏 HUD、动漫 / 漫画、摄影风格、字体设计、地图导航、纹身设计，以及参考图编辑等 AI image prompts / examples。

欢迎贡献 — 请查看 CONTRIBUTING.md、CODE_OF_CONDUCT.md 和 SECURITY.md。

📥 安装

Claude Code

/plugin marketplace add wuyoscar/gpt_image_2_skill
/plugin install gpt-image@wuyoscar-skills

Codex

Codex 内置了 $skill-installer、$skill-creator 等 Skill 管理工具。打开 Codex，然后让内置安装器安装这个 GitHub skill 文件夹：

$skill-installer install https://github.com/wuyoscar/gpt_image_2_skill/tree/main/skills/gpt-image

Codex 会下载这个 GitHub 文件夹，并放到你的 Codex skills 目录，通常是：

~/.codex/skills/gpt-image

安装后重启 Codex，让新的 $gpt-image skill 生效。

如果你想手动安装，可以把 skill 文件夹复制到 Codex 的 skills 目录：

git clone https://github.com/wuyoscar/gpt_image_2_skill.git
cd gpt_image_2_skill

mkdir -p "${CODEX_HOME:-$HOME/.codex}/skills"
cp -R skills/gpt-image "${CODEX_HOME:-$HOME/.codex}/skills/"

手动安装 Agent Skill

把 AGENT_SKILLS_DIR 设置为你的 Agent 运行时所使用的 skills 目录，然后把本仓库的 skill 文件夹软链接进去。

git clone https://github.com/wuyoscar/gpt_image_2_skill.git
cd gpt_image_2_skill

# 选择你的运行时对应的 skills 目录。
# 示例：
#   Codex:      ~/.codex/skills
#   Claude Code / OpenClaw / Hermes Agent / 其他运行时：使用该运行时文档指定的 skills 目录。
export AGENT_SKILLS_DIR="/path/to/your/agent/skills"

mkdir -p "$AGENT_SKILLS_DIR"
ln -s "$PWD/skills/gpt-image" "$AGENT_SKILLS_DIR/gpt-image"

CLI

uvx --from git+https://github.com/wuyoscar/gpt_image_2_skill gpt-image -p "a cat astronaut"

# 或安装到 PATH
uv tool install git+https://github.com/wuyoscar/gpt_image_2_skill
gpt-image -p "a cat astronaut"

更新

# 插件：使用 Claude Code 的更新流程
# codex 技能：重新运行安装器
# 手动 git 克隆方式
cd gpt_image_2_skill && git pull

# CLI
uv tool upgrade gpt-image-cli

从环境变量或 ~/.env 读取 OPENAI_API_KEY。

⚡ 快速使用与提示词基础

CLI 快速使用

安装后，下面每个图库条目都可以复制粘贴为 gpt-image -p "…"，也可以在任何支持 Skill 的 Agent 运行时里用自然语言请求，例如：“生成技能图库中的波士顿春季海报”。

文本 → 图片

gpt-image -p "晚上10点的逼真便利店" --size 1k --quality high -f store.png

底层实现：POST /v1/images/generations，使用 model=gpt-image-2。

文字 + 参考图像 → 图像（编辑）

# 单参考图编辑 / 重风格化
gpt-image -p "让它成为一个下大雪的冬日晚景" \
  -i chess.png --quality high -f chess-winter.png

# 多参考图编辑：edits 端点可以同时接收多张输入图
gpt-image -p "把第 2 张图里的狗放到第 1 张图的女人旁边，匹配相同的光线、构图和背景，不要改动其他任何内容。" \
  -i woman.png -i dog.png --size portrait --quality medium -f woman-with-dog.png

# 基于掩码的修补：不透明部分 = 保留，透明部分 = 重新生成
gpt-image -p "将天空替换为极光" \
  -i photo.jpg -m sky_mask.png -f aurora.png

底层实现：POST /v1/images/edits（多部分表单），这是 OpenAI Cookbook 中的官方接口。gpt-image-2 支持 image、mask、prompt、size、quality、background、output_format 和 n。支持多个 -i 输入以进行多参考图像编辑。

参数（完整）

显示完整参数参考

标志	取值	默认值	适用范围	备注
`-p, --prompt`	字符串	— 必需	两者	完整的提示文本。
`-f, --file`	路径	`./fig/YYYY-MM-DD-HH-MM-SS-<slug>.png`	两者	明确输出路径。
`-i, --image`	路径（可重复）	—	编辑	存在时走 `/v1/images/edits` 路由。
`-m, --mask`	路径（PNG，带alpha通道）	—	编辑	不透明 = 保留，透明 = 重新生成。需要 `-i`。
`--input-fidelity`	`low` · `high`	—	编辑	在 `gpt-image-1`/`1.5` 支持；`gpt-image-2` 会拒绝这个参数，所以 CLI 会在本地直接丢弃它。
`--size`	`1k` · `2k` · `4k` · `portrait` · `landscape` · `square` · `wide` · `tall` · 字面量如 `1024x1024` 等	`1024x1024`	两者	字面量必须为16像素倍数，最大边3840，比例限制3:1，像素总数介于655k–8.3M之间。
`--quality`	`auto` · `low` · `medium` · `high`	`high`	两者	这是一个实用预算调节：`low` 用于便宜的草稿/大规模生成，`medium` 用于正常探索，`high` 用于最终以文本为主或面向发布的资源。
`-n, --n`	整数	1	两者	批量生成。`n>1` 时文件名后缀依次为 `_0`、`_1`、…
`--background`	`auto` · `opaque`	API 默认	生成	`opaque` 禁用透明度。
`--moderation`	`auto` · `low`	`low`	生成	这里默认用 `low`，更适合广泛探索提示词；如果你想回到更严格的 API 侧默认行为，就手动切到 `auto`。
`--format`	`png` · `jpeg` · `webp`	`png`	两者	响应编码格式。
`--compression`	0–100	—	两者	仅适用于 JPEG/WebP。

预算 / 质量指南

这里没有单独的 budget 标志——使用 --quality 作为预算调节。

low = 便宜的草稿 / 收集 / 多变体
medium = 正常探索 / 风格试探
high = 最终海报，中文文本，图表，论文图形，横幅

如果你要生成数十个候选项，先从 low 开始，仅对决选的最终稿使用 high 重新运行。

从画廊 Prompt → CLI / SDK

下面每个条目只给出提示词加一行元数据（"size" · "quality" · 来源）。CLI 与 SDK 的调用永远按同样的方式装配——这里示范一次，后面的条目就不再重复这两段样板。以 "portrait" · "high" 条目为例：

# CLI
gpt-image -p "<条目中的提示词>" --size portrait --quality high -f out.png

# OpenAI SDK —— size 传字面像素值；CLI 的 portrait 简写对应 1024x1536
from openai import OpenAI
client = OpenAI()
result = client.images.generate(
    model="gpt-image-2",
    prompt="<条目中的提示词>",
    size="1024x1536",
    quality="high",
)

遇到需要参考图的编辑任务，在 CLI 上追加 -i ref.png（可重复）以及可选的 -m mask.png，或把 SDK 调用换成 client.images.edit(...) 并传 image=[open(p, "rb") for p in refs]。其余参数与 generate 完全一致。

退出代码：0 成功 · 1 API/拒绝错误（完整响应体打印到 stderr） · 2 参数错误或缺失 OPENAI_API_KEY。

📖 提示词基础

显示提示词笔记

摘自 OpenAI 的官方 GPT Image 提示指南（本地也存档于 skills/gpt-image/references/openai-cookbook.md — 当你询问参数语义、编辑、UI 原型、推介幻灯片、科学视觉、虚拟试穿、广告牌模型或翻译编辑时，技能会按需加载）：

先结构，再目标。 使用一致的顺序：背景/场景 → 主体 → 关键细节 → 限制条件，并说明预期用途（广告、UI 原型、信息图），以便模型选择正确模式和润色等级。
任何格式都可；一致性更重要。 简短提示、描述段落、JSON 风格结构、指令风格提示和标签式提示均可。生产中建议使用易快速浏览的模板，而非巧妙语法。
具体 + 质量线索。 要具体说明材料、形状、纹理和媒介（照片、水彩、3D 渲染）。仅在必要时添加针对性的质量线索：胶片颗粒、纹理笔触、微距细节。要实现照片级真实感，直接写 “photorealistic”；“真实照片”、“用真实相机拍摄” 和 “iPhone 照片” 也有帮助。
将必需文本用引号括起来。 任何必须出现在图片中的文本 —— 标语、价格、汉字 —— 应用直引号括起。不要在提示中换种说法。
提前选择宽高比。 提示前先确定 1:1 / 3:4 / 4:3 / 9:16 / 16:9 / 3:1。并在提示文本中强化，而不仅仅是用 --size 。
一主角，配角辅助。 复杂场景最好有一个明显的主体，其它作为配角细节表现。
文本内嵌、密集图表、小标签和多面板布局用 quality="high"。 中档会明显降低效果。

这个 skill 提供四个本地 reference surface： - skills/gpt-image/references/gallery.md — 轻量级路由索引，用来为拆分后的 162 条 Prompt Scale Atlas 选择 category；它本身不是完整 Prompt dump。 - skills/gpt-image/references/gallery-*.md — 每个 category 一个文件，只在相关任务中加载，例如 gallery-product-and-food.md、gallery-ui-ux-mockups.md、gallery-research-paper-figures.md。这样既能复用 Scale，又不会撑爆上下文。 - skills/gpt-image/references/craft.md — 扩展后的 19 节 Prompt Craft 清单，覆盖 Scale-first 使用方式、JSON/config-style Prompt、多面板排版、UI 规格、数据/图表语法、编辑不变量、参考图工作流、密集文本和分类 mini-schema。 - skills/gpt-image/references/openai-cookbook.md — OpenAI Cookbook 的逐字 Markdown 捕获（1004 行），包括权威的参数覆盖表和所有第4/5节用例示例。

🎨 提示词精选展示

关于这些提示词。 README 里展示的是一组有代表性的 prompt 及其对应生成图。完整 Reference Gallery 包含全部 162 条提示词和 162 个图片资产，按分类整理在 skills/gpt-image/references/gallery.md 和对应的 skills/gpt-image/references/gallery-*.md 文件中。

来源标签。 Curated 表示由本 repo 整理、改写或重新设计的 prompt / image；外部来源条目继续保留可见的作者和来源链接。

🎌 动漫与漫画 _{完整图库 MD}	🎮 游戏 _{完整图库 MD}	🤖 复古与赛博朋克 _{完整图库 MD}
🎬 电影与动画 _{完整图库 MD}	👤 角色设计 _{完整图库 MD}	📝 排版与海报 _{完整图库 MD}
🎨 插画 _{完整图库 MD}	💧 水彩 _{完整图库 MD}	🖌️ 墨与中国 _{完整图库 MD}
🕹️ 像素艺术 _{完整图库 MD}	📐 等距视图 _{完整图库 MD}	📦 产品与食品 _{完整图库 MD}
🧩 品牌系统与视觉识别 _{完整图库 MD}	📷 摄影 _{完整图库 MD}	🖥️ 屏幕摄影 _{完整图库 MD}
📊 信息图表与实地指南 _{完整图库 MD}	📚 研究论文图示 _{完整图库 MD}	🏢 官方 OpenAI Cookbook 示例 _{完整图库 MD}
✨ 编辑端点展示 _{完整图库 MD}	📱 UI/UX 原型图 _{完整图库 MD}	📊 数据可视化 _{完整图库 MD}
⚙️

Core symbols most depended-on inside this repo

resolve_size

called by 2

src/gpt_image_cli/cli.py

_filter_none

called by 2

src/gpt_image_cli/cli.py

main

called by 2

src/gpt_image_cli/cli.py

_load_env_chain

called by 1

src/gpt_image_cli/cli.py

slugify

called by 1

src/gpt_image_cli/cli.py

default_output_path

called by 1

src/gpt_image_cli/cli.py

model_rejects_input_fidelity

called by 1

src/gpt_image_cli/cli.py

parse_args

called by 1

src/gpt_image_cli/cli.py

Shape

Function 12

Languages

Python100%

Modules by API surface

src/gpt_image_cli/cli.py11 symbols

src/gpt_image_cli/__init__.py1 symbols

Dependencies from manifests, versioned

openai1.55 · 1×

python-dotenv1.0 · 1×

For agents

$ claude mcp add GPT-Image2-Skill \
  -- python -m otcore.mcp_server <graph>

⬇ download graph artifact