跳转到主要内容

Gemini 图片编辑

Gemini 图片模型支持对已有图片进行编辑和修改。通过发送原始图片和编辑指令,模型会返回修改后的图片。
POST /v1beta/models/{model}:generateContent

基本图片编辑

curl "https://crazyrouter.com/v1beta/models/gemini-2-5-flash-image:generateContent?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {"text": "把这张图片的背景改成星空"},
          {
            "inlineData": {
              "mimeType": "image/jpeg",
              "data": "/9j/4AAQSkZJRgABAQAA..."
            }
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"]
    }
  }'

风格转换

Python
response = model.generate_content(
    [
        "将这张照片转换为水彩画风格,保持原始构图",
        {"mime_type": "image/jpeg", "data": image_data}
    ],
    generation_config=genai.GenerationConfig(
        response_modalities=["TEXT", "IMAGE"]
    )
)

局部编辑

通过详细的文字描述指定编辑区域:
Python
response = model.generate_content(
    [
        "把图片中人物的衣服颜色从红色改成蓝色,其他部分保持不变",
        {"mime_type": "image/jpeg", "data": image_data}
    ],
    generation_config=genai.GenerationConfig(
        response_modalities=["TEXT", "IMAGE"]
    )
)

多图参考编辑

可以发送多张图片作为参考:
Python
response = model.generate_content(
    [
        "参考第二张图片的风格,重新绘制第一张图片",
        {"mime_type": "image/jpeg", "data": content_image},
        {"mime_type": "image/jpeg", "data": style_image}
    ],
    generation_config=genai.GenerationConfig(
        response_modalities=["TEXT", "IMAGE"]
    )
)
图片编辑的效果取决于编辑指令的清晰程度。建议使用具体、明确的描述来指定需要修改的内容。
输入图片和输出图片都会消耗 Token。大尺寸图片会显著增加 Token 消耗。