外观
向量化与重排(Embeddings & Rerank)
Token Factory 提供 OpenAI 兼容的文本向量化(/v1/embeddings)与重排(/v1/rerank)端点, 连国产模型(智谱),用于 RAG / 知识库的检索与精排。鉴权、计费与对话接口一致(同一个 sk-tf- Key)。
Embeddings 文本向量化
把文本转成向量,用于语义检索。OpenAI 兼容,改 base-url + Key 即可:
bash
curl https://apicoo.com/api/v1/embeddings \
-H "Authorization: Bearer sk-tf-你的密钥" \
-H "Content-Type: application/json" \
-d '{
"model": "embedding-3",
"input": "什么是人工智能"
}'返回 OpenAI 兼容结构:
json
{
"object": "list",
"data": [{ "object": "embedding", "index": 0, "embedding": [0.01, -0.02, ...] }],
"usage": { "prompt_tokens": 6, "total_tokens": 6 }
}input支持字符串或字符串数组(批量),计费按总 input token- 用 OpenAI SDK:
client.embeddings.create(model="embedding-3", input="..."),改 base-url 即可
Rerank 重排
把一组候选文档按与 query 的相关度排序,RAG 检索后精排提质:
bash
curl https://apicoo.com/api/v1/rerank \
-H "Authorization: Bearer sk-tf-你的密钥" \
-H "Content-Type: application/json" \
-d '{
"model": "rerank",
"query": "什么是人工智能",
"documents": ["人工智能是计算机科学分支", "今天天气晴朗", "机器学习属于AI领域"]
}'返回按相关度排序的结果:
json
{
"results": [
{ "index": 0, "relevance_score": 1.0 },
{ "index": 2, "relevance_score": 0.86 },
{ "index": 1, "relevance_score": 0.02 }
],
"usage": { "prompt_tokens": 131, "total_tokens": 131 }
}计费
embeddings 与 rerank 均按 input token 计费(无输出 token),价目见模型与定价, 与对话接口同一口径,失败调用不收费。