LOLAI 开发者平台

文档重排序(Rerank)

按 query 对一组 documents 排相关性,返回降序的 index + relevance_score。RAG 检索后用它精排。Cohere / Jina / SiliconFlow 风格。

生产环境POSThttps://api.lolai.lol/v1/rerank

请求参数

Body 参数application/json
modelstring必填
重排模型,见下方可用模型
示例:gte-rerank-v2
querystring必填
查询。
示例:什么是向量检索?
documentsstring[]必填
候选文档。
示例:["文档1", "文档2"]
top_ninteger可选
只返回前 N 条。
示例:3
return_documentsboolean可选
为 true 时结果里带回文档原文(document.text)。
示例:true

响应

resultsrelevance_score 降序,每项含 index(原 documents 下标)+ relevance_score(0–1)。计费按 query + documents 估算 token。

可用模型

重排模型见 模型广场。当前已接:阿里 gte-rerank(gte-rerank-v2);OpenAI 兼容 rerank(需上游)。

请求与响应体

用下面的示例确认请求格式与返回结构。需要在线发起请求时,点击页面顶部「调试」拉起在线运行面板。

bash
curl https://api.lolai.lol/v1/rerank \
  -H "Authorization: Bearer sk-lolai-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gte-rerank-v2",
    "query": "什么是向量检索?",
    "documents": [
      "向量检索通过相似度匹配语义相近的文档",
      "今天天气很好适合出门",
      "rerank 模型对候选文档按相关性重新排序"
    ],
    "top_n": 3,
    "return_documents": true
  }'
响应 · 200
{
  "model": "gte-rerank-v2",
  "results": [
    { "index": 0, "relevance_score": 0.389,
      "document": { "text": "向量检索通过相似度匹配语义相近的文档" } },
    { "index": 2, "relevance_score": 0.022,
      "document": { "text": "rerank 模型对候选文档按相关性重新排序" } }
  ]
}