Gemini 图片编辑

Gemini 图片模型支持对已有图片进行编辑和修改。通过发送原始图片和编辑指令，模型会返回修改后的图片。

POST /v1beta/models/{model}:generateContent

基本图片编辑

curl "https://crazyrouter.com/v1beta/models/gemini-2-5-flash-image:generateContent?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {"text": "把这张图片的背景改成星空"},
          {
            "inlineData": {
              "mimeType": "image/jpeg",
              "data": "/9j/4AAQSkZJRgABAQAA..."
            }
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"]
    }
  }'

风格转换

Python

response = model.generate_content(
    [
        "将这张照片转换为水彩画风格，保持原始构图",
        {"mime_type": "image/jpeg", "data": image_data}
    ],
    generation_config=genai.GenerationConfig(
        response_modalities=["TEXT", "IMAGE"]
    )
)

局部编辑

通过详细的文字描述指定编辑区域：

Python

response = model.generate_content(
    [
        "把图片中人物的衣服颜色从红色改成蓝色，其他部分保持不变",
        {"mime_type": "image/jpeg", "data": image_data}
    ],
    generation_config=genai.GenerationConfig(
        response_modalities=["TEXT", "IMAGE"]
    )
)

多图参考编辑

可以发送多张图片作为参考：

Python

response = model.generate_content(
    [
        "参考第二张图片的风格，重新绘制第一张图片",
        {"mime_type": "image/jpeg", "data": content_image},
        {"mime_type": "image/jpeg", "data": style_image}
    ],
    generation_config=genai.GenerationConfig(
        response_modalities=["TEXT", "IMAGE"]
    )
)

图片编辑的效果取决于编辑指令的清晰程度。建议使用具体、明确的描述来指定需要修改的内容。

输入图片和输出图片都会消耗 Token。大尺寸图片会显著增加 Token 消耗。

Gemini 图片生成 Gemini 多模态理解

开始使用

Chat - OpenAI

Chat - Claude

Chat - Gemini

Chat - Responses API

图像生成

视频生成

音频

嵌入 & 重排序

其他 API

Token 管理

SDK & 代码示例

第三方集成

参考

Gemini 图片编辑

Gemini 图片编辑

基本图片编辑

风格转换

局部编辑

多图参考编辑

开始使用

Chat - OpenAI

Chat - Claude

Chat - Gemini

Chat - Responses API

图像生成

视频生成

音频

嵌入 & 重排序

其他 API

Token 管理

SDK & 代码示例

第三方集成

参考

​Gemini 图片编辑

​基本图片编辑

​风格转换

​局部编辑

​多图参考编辑

Gemini 图片编辑

基本图片编辑

风格转换

局部编辑

多图参考编辑