按 query 对一组 documents 排相关性,返回降序的 index + relevance_score。RAG 检索后用它精排。Cohere / Jina / SiliconFlow 风格。
https://api.lolai.lol/v1/rerankquerystring必填什么是向量检索?documentsstring[]必填["文档1", "文档2"]top_ninteger可选3return_documentsboolean可选document.text)。trueresults 按 relevance_score 降序,每项含 index(原 documents 下标)+ relevance_score(0–1)。计费按 query + documents 估算 token。
重排模型见 模型广场。当前已接:阿里 gte-rerank(gte-rerank-v2);OpenAI 兼容 rerank(需上游)。
用下面的示例确认请求格式与返回结构。需要在线发起请求时,点击页面顶部「调试」拉起在线运行面板。
curl https://api.lolai.lol/v1/rerank \
-H "Authorization: Bearer sk-lolai-xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "gte-rerank-v2",
"query": "什么是向量检索?",
"documents": [
"向量检索通过相似度匹配语义相近的文档",
"今天天气很好适合出门",
"rerank 模型对候选文档按相关性重新排序"
],
"top_n": 3,
"return_documents": true
}'{
"model": "gte-rerank-v2",
"results": [
{ "index": 0, "relevance_score": 0.389,
"document": { "text": "向量检索通过相似度匹配语义相近的文档" } },
{ "index": 2, "relevance_score": 0.022,
"document": { "text": "rerank 模型对候选文档按相关性重新排序" } }
]
}