文档重排序(Rerank)

按 query 对一组 documents 排相关性,返回降序的 index + relevance_score。RAG 检索后用它精排。Cohere / Jina / SiliconFlow 风格。

生产环境POSThttps://api.lolai.lol/v1/rerank

请求参数

Body 参数application/json

modelstring必填

重排模型,见下方可用模型。

示例:gte-rerank-v2

querystring必填

查询。

示例:什么是向量检索?

documentsstring[]必填

候选文档。

示例:["文档1", "文档2"]

top_ninteger可选

只返回前 N 条。

示例:3

return_documentsboolean可选

为 true 时结果里带回文档原文(document.text)。

示例:true

响应

results 按 relevance_score 降序,每项含 index(原 documents 下标)+ relevance_score(0–1)。计费按 query + documents 估算 token。

可用模型

重排模型见模型广场。当前已接:阿里 gte-rerank(gte-rerank-v2);OpenAI 兼容 rerank(需上游)。

请求与响应体

用下面的示例确认请求格式与返回结构。需要在线发起请求时,点击页面顶部「调试」拉起在线运行面板。

bash

curl https://api.lolai.lol/v1/rerank \
  -H "Authorization: Bearer sk-lolai-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gte-rerank-v2",
    "query": "什么是向量检索?",
    "documents": [
      "向量检索通过相似度匹配语义相近的文档",
      "今天天气很好适合出门",
      "rerank 模型对候选文档按相关性重新排序"
    ],
    "top_n": 3,
    "return_documents": true
  }'

响应 · 200

{
  "model": "gte-rerank-v2",
  "results": [
    { "index": 0, "relevance_score": 0.389,
      "document": { "text": "向量检索通过相似度匹配语义相近的文档" } },
    { "index": 2, "relevance_score": 0.022,
      "document": { "text": "rerank 模型对候选文档按相关性重新排序" } }
  ]
}