Create chat completion
对话 / Chat
Create chat completion
用 OpenAI 兼容协议调用 Claude、GPT、Grok 等所有文本模型。
POST
Create chat completion
/v1/chat/completions 是 DimiLinks 推荐的对话入口。请求与响应结构与 OpenAI 官方接口保持一致,可直接使用 OpenAI SDK;只要把 model 换成对应名称,就可以调用 Claude、GPT、Grok 等所有文本模型。
请求地址
简单示例
流式输出
请求加上"stream": true,服务端会以 text/event-stream 推回增量片段,最后以 data: [DONE] 结束。
参数
仅列出常用字段,未列出的字段如果模型支持则原样透传给上游。| 参数 | 类型 | 默认值 | 说明 |
|---|---|---|---|
model | string | 必填 | 模型 ID,例如 claude-sonnet-4-6、claude-opus-4-7、gpt-5.5、gpt-5.4-mini、grok-4.20-fast 等。 |
messages | array | 必填 | 消息数组,至少包含一条 role=user。role 支持 system / user / assistant / tool。 |
stream | boolean | false | true 时返回 SSE 流式片段。 |
temperature | number | 模型默认 | 采样温度,0–2。 |
top_p | number | 模型默认 | 核采样概率,0–1。 |
max_tokens | integer | 模型默认 | 单次输出最大 token;调用 Claude 系模型时建议显式设置。 |
stop | string | string[] | 空 | 命中即停止生成。 |
presence_penalty | number | 0 | 重复主题惩罚,-2 到 2。 |
frequency_penalty | number | 0 | 重复词惩罚,-2 到 2。 |
tools | array | 空 | 工具调用定义,结构兼容 OpenAI Tool Calling。 |
tool_choice | string | object | auto | 控制是否强制调用某个工具。 |
response_format | object | 空 | 请求 JSON 输出,例如 { "type": "json_object" }。 |
user | string | 空 | 终端用户标识,用于审计与限流。 |
推荐模型
| 场景 | 模型 |
|---|---|
| 通用对话 / 长文档 | claude-sonnet-4-6、claude-opus-4-7、gpt-5.5 |
| 复杂推理 / 编码 | claude-opus-4-7、gpt-5.3-codex、gpt-5.4 |
| 思考模式 | claude-opus-4-7-thinking、claude-sonnet-4-6-thinking、grok-4.20-0309-reasoning |
| 低成本批量 | claude-haiku-4-5-20251001、gpt-5.4-mini、deepseek-v4-flash |
| 多模态视觉 | gpt-image-2(图片生成专用);视觉对话能力随模型而定,请先看 /v1/models 的 input_modalities。 |
用 OpenAI SDK 调用
Python:工具调用 (Tool calling)
tool_calls 后,再把工具执行结果以 role=tool 的消息放回 messages 继续调用即可。
错误处理
请求失败时返回 OpenAI 风格的error 包装,详见 Errors。流式请求中如果上游断开,最后一个事件可能不是 [DONE],建议把「连接断开」也当作可重试错误。Authorizations
Bearer authentication header of the form Bearer <token>, where <token> is your auth token.
Body
application/json