Skip to content

向量化与重排(Embeddings & Rerank)

Token Factory 提供 OpenAI 兼容的文本向量化(/v1/embeddings)与重排(/v1/rerank)端点, 连国产模型(智谱),用于 RAG / 知识库的检索与精排。鉴权、计费与对话接口一致(同一个 sk-tf- Key)。

Embeddings 文本向量化

把文本转成向量,用于语义检索。OpenAI 兼容,改 base-url + Key 即可:

bash
curl https://apicoo.com/api/v1/embeddings \
  -H "Authorization: Bearer sk-tf-你的密钥" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "embedding-3",
    "input": "什么是人工智能"
  }'

返回 OpenAI 兼容结构:

json
{
  "object": "list",
  "data": [{ "object": "embedding", "index": 0, "embedding": [0.01, -0.02, ...] }],
  "usage": { "prompt_tokens": 6, "total_tokens": 6 }
}
  • input 支持字符串或字符串数组(批量),计费按总 input token
  • 用 OpenAI SDK:client.embeddings.create(model="embedding-3", input="..."),改 base-url 即可

Rerank 重排

把一组候选文档按与 query 的相关度排序,RAG 检索后精排提质:

bash
curl https://apicoo.com/api/v1/rerank \
  -H "Authorization: Bearer sk-tf-你的密钥" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "rerank",
    "query": "什么是人工智能",
    "documents": ["人工智能是计算机科学分支", "今天天气晴朗", "机器学习属于AI领域"]
  }'

返回按相关度排序的结果:

json
{
  "results": [
    { "index": 0, "relevance_score": 1.0 },
    { "index": 2, "relevance_score": 0.86 },
    { "index": 1, "relevance_score": 0.02 }
  ],
  "usage": { "prompt_tokens": 131, "total_tokens": 131 }
}

计费

embeddings 与 rerank 均按 input token 计费(无输出 token),价目见模型与定价, 与对话接口同一口径,失败调用不收费。

Token Factory · 国产合规 AI Gateway