重排序

重排序

curl --request POST \
  --url https://api.example.com/v1/rerank \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "<string>",
  "query": "<string>",
  "documents": [
    "<string>"
  ],
  "top_n": 123,
  "return_documents": true
}
'

POST

rerank

重排序

curl --request POST \
  --url https://api.example.com/v1/rerank \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "<string>",
  "query": "<string>",
  "documents": [
    "<string>"
  ],
  "top_n": 123,
  "return_documents": true
}
'

接口说明

对一组文档按照与查询的语义相关性进行重新排序，常用于 RAG 检索增强生成的第二阶段精排。

参考 SiliconFlow Rerank API 格式实现。

支持模型

模型	说明
`BAAI/bge-reranker-v2-m3`	多语言重排序模型，推荐
`BAAI/bge-reranker-large`	英文为主

请求参数

model

string

必填

重排序模型名称，如 BAAI/bge-reranker-v2-m3

query

string

必填

查询文本

documents

string[]

必填

待排序的文档列表

top_n

integer

返回前 N 个结果，默认返回全部

return_documents

boolean

默认值:"true"

是否在响应中返回文档原文

响应格式

{
  "model": "BAAI/bge-reranker-v2-m3",
  "results": [
    {
      "index": 2,
      "relevance_score": 0.9875,
      "document": { "text": "最相关的文档内容" }
    },
    {
      "index": 0,
      "relevance_score": 0.7432,
      "document": { "text": "次相关的文档内容" }
    },
    {
      "index": 1,
      "relevance_score": 0.1205,
      "document": { "text": "不太相关的文档内容" }
    }
  ],
  "usage": {
    "total_tokens": 128
  }
}

代码示例

import requests

response = requests.post(
    "https://crazyrouter.com/v1/rerank",
    headers={
        "Authorization": "Bearer sk-xxx",
        "Content-Type": "application/json"
    },
    json={
        "model": "BAAI/bge-reranker-v2-m3",
        "query": "什么是向量数据库",
        "documents": [
            "向量数据库是专门存储和检索高维向量的数据库系统",
            "关系型数据库使用表格存储结构化数据",
            "向量数据库支持近似最近邻搜索，适合语义检索场景",
            "Redis 是一个内存键值存储系统"
        ],
        "top_n": 2,
        "return_documents": True
    }
)

data = response.json()
for result in data["results"]:
    print(f"[{result['relevance_score']:.4f}] {result['document']['text']}")

典型 RAG 流程

用户查询 → Embedding 检索 Top-K → Rerank 精排 → LLM 生成回答

重排序模型的输入文档数量建议不超过 100 条。文档过多会增加延迟和费用。

创建嵌入 GPTs 对话

开始使用

Chat - OpenAI

Chat - Claude

Chat - Gemini

Chat - Responses API

图像生成

视频生成

音频

嵌入 & 重排序

其他 API

Token 管理

SDK & 代码示例

第三方集成

参考

接口说明

支持模型

请求参数

响应格式

代码示例

典型 RAG 流程

开始使用

Chat - OpenAI

Chat - Claude

Chat - Gemini

Chat - Responses API

图像生成

视频生成

音频

嵌入 & 重排序

其他 API

Token 管理

SDK & 代码示例

第三方集成

参考

​接口说明

​支持模型

​请求参数

​响应格式

​代码示例

​典型 RAG 流程

接口说明

支持模型

请求参数

响应格式

代码示例

典型 RAG 流程