通义千问
通义千问 Qwen3.6 Plus(qwen3.6-plus)多轮文本对话,请使用 POST /v1/chat / POST /v1/chat/stream 调用。
能力
messages 一并提交(建议间隔轮询流式结果)。system / user / assistant 多轮消息。extra.enable_thinking 开启或关闭;流式时可能出现思考过程与正文分片。temperature、top_p 写在 extra 中合并进请求体(与官方「常见场景」推荐一致)。image_url / video_url / file 等内容块。常见场景推荐参数
| 场景 | temperature | top_p | 深度思考 |
|---|---|---|---|
| 创意写作 | 0.9 | 0.95 | 建议关闭 |
| 代码生成 | 0.2 | 0.8 | 建议关闭 |
| 事实问答 | 0.1 | 0.7 | 建议关闭 |
| 翻译 | 0.3 | 0.8 | 建议关闭 |
| 复杂推理 | 0.5 | 0.85 | 建议开启(可设 reasoning_effort=high) |
站内对话页可选择场景与深度思考;API 调用时在 extra 中传入对应字段即可。
计费(元/10K词元)
| 类型 | 单价(元/10K词元) |
|---|---|
| 输入 | 0.204 |
| 输出 | 0.816 |
实际扣费以响应 usage 的 prompt/completion tokens 为准。
左侧为章节切换,右侧为对应内容。
| 字段名 | 类型 | 必填 | 说明 |
|---|---|---|---|
Authorization |
string | 是 | Bearer 令牌,格式为 Bearer {应用ID}-{应用密钥}(仅在第一个 - 处分割,密钥本身可含连字符)。应用 ID 与密钥在会员中心「我的应用」获取。兼容 OpenAI SDK:将 {应用ID}-{应用密钥} 作为 api_key 传入即可自动携带本请求头。 |
对接 HTTP 接口请使用上表 Authorization: Bearer {应用ID}-{应用密钥};兼容 OpenAI SDK(将 {应用ID}-{应用密钥} 作为 api_key)。站内网页另有 Cookie 兼容方式,不在此列出。
非流式与流式使用同一请求体结构;流式请使用 …/v1/chat/stream 路径。
多轮与上下文:接口按当次请求里的 messages 处理对话,不会替你「记住」上一轮正文。续聊须由客户端在 body 中组装完整历史(含此前的 user / assistant 等)。
| 字段名 | 类型 | 必填 | 说明 |
|---|---|---|---|
model_id |
int | 是 | 模型主键;本页文档对应 `model_id=27`。 |
messages |
array | 是 | 消息对象数组(见 messages[])。至少一条;多轮时须在数组内按顺序包含完整历史(user/assistant/system 等)。按本次列表处理对话,不自动补全缺省轮次。 |
temperature |
number | 否 | 采样温度,默认 0.7;是否生效取决于具体模型。 |
max_tokens |
int 或 null | 否 | 生成长度上限(token);null 表示使用默认。 |
stream |
bool | 否 | 请求体字段,默认 false。**是否流式由 URL 决定**:流式请 POST `/v1/chat/stream`;`/v1/chat` 为非流式。勿仅靠本字段切换 SSE。 |
attachments |
array | 否 | 附件数组,默认 [](见 attachments[])。服务端会把附件整理为模型可识别的上下文(如追加 system 说明 URL 列表)。 |
extra |
object | 否 | 任意 JSON 对象,默认 {}。模型专有参数放于此(如数字人 image_url/audio_url/parameters;文生图/视频类 prompt、尺寸等)。服务端可能合并内部保留字段;请勿使用以下划线 `_` 开头的键名作为业务自定义字段。 |
数组顺序即对话顺序;多轮时把历史轮次一并列入本数组即可。
| 字段名 | 类型 | 必填 | 说明 |
|---|---|---|---|
role |
string | 是 | 角色:如 user、assistant、system 等,与 OpenAI Chat Completions 约定一致。 |
content |
string | 是 | 该轮文本内容。多轮时 assistant 一般为上一轮模型输出,由客户端保存后在后续请求的 messages 中写回。 |
images |
array 或 null | 否 | 历史消息中的多模态图片结构,会话回放用;元素为对象,字段因模型而异。 |
audios |
array 或 null | 否 | 历史消息中的音频结构,会话回放用。 |
| 字段名 | 类型 | 必填 | 说明 |
|---|---|---|---|
url |
string | 是 | 附件可访问 URL(须能被服务端拉取)。 |
filename |
string 或 null | 否 | 原始文件名,便于展示或日志。 |
mime |
string 或 null | 否 | MIME 类型,如 image/png。 |
extra |
object | 否 | 附件级扩展信息,默认 {}。 |
**支持连续对话**:`messages` 中带齐历史轮次。**`extra` 键合并进请求体顶层**(可含 `temperature`、`top_p`、`enable_thinking` 等)。**深度思考**:`extra.enable_thinking` 未传时网关默认 **true**;示例为事实问答场景故传 **false**。**场景推荐**(与官方文档一致):创意写作 `temperature=0.9, top_p=0.95`;代码 `0.2/0.8`;事实问答 `0.1/0.7`;翻译 `0.3/0.8`;复杂推理建议 `enable_thinking=true` 且可设 `reasoning_effort=high`。流式请 **`POST /v1/chat/stream`**。
下列说明与下方「调用示例」JSON 对齐,由本站配置维护。
| 字段名 | 类型 | 必填 | 说明 |
|---|---|---|---|
model_id |
int | 是 | 须为 `27`。 |
messages |
array | 是 | 多轮对话数组;连续对话须包含完整历史。 |
messages[].role |
string | 是 | `system` / `user` / `assistant`。 |
messages[].content |
string | 是 | 该轮文本内容。 |
stream |
bool | 否 | 流式请用 **`/v1/chat/stream`**;delta 可能含思考与正文。 |
extra.temperature |
float | 否 | 合并进请求体;覆盖请求体顶层 `temperature`(若同时存在)。 |
extra.top_p |
float | 否 | 核采样阈值,与 `temperature` 建议每次只调其一评估效果。 |
extra.enable_thinking |
bool | 否 | 深度思考;未传时网关默认 true。 |
extra.reasoning_effort |
string | 否 | 思考强度:`low` / `medium` / `high` / `max`(开启思考时有效)。 |