当前位置: 首页 > api商店 > 数字人-生成人脸动态视频 · API 说明
数字人-生成人脸动态视频

通义千问

模型 ID 15 视频生成
模型说明
基于人物肖像图片和人声音频,生成人脸动态视频

进入对话页

  • 接口说明
  • 调用示例
  • Markdown

左侧为章节切换,右侧为对应内容。

请求头(鉴权)
字段名 类型 必填 说明
X-AI-App-Id string 会员中心「我的应用」中展示的应用 ID。
X-AI-App-Secret string 该应用的密钥 secret_key,与会员中心展示一致;服务端会做安全校验。

对接 HTTP 接口请使用上表请求头;站内网页另有兼容方式,不在此列出。

POST /v1/chat、POST /v1/chat/stream — JSON 请求体根字段

非流式与流式使用同一请求体结构;流式请使用 …/v1/chat/stream 路径。

多轮与上下文:网关按当次请求里的 messages 原样交给上游模型,接口不会替你「记住」上一轮正文。续聊须由客户端在 body 中组装完整历史(含此前的 user / assistant 等)。

字段名 类型 必填 说明
model_id int 模型主键;本页文档对应 `model_id=15`。
messages array 消息对象数组(见 messages[])。至少一条;多轮时须在数组内按顺序包含完整历史(user/assistant/system 等)。网关按本次列表调用上游,不自动补全缺省轮次。
temperature number 采样温度,默认 0.7;是否生效取决于具体模型。
max_tokens int 或 null 生成长度上限(token);null 表示使用网关/上游默认。
stream bool 请求体字段,默认 false。**是否流式由 URL 决定**:流式请 POST `/v1/chat/stream`;`/v1/chat` 为非流式。勿仅靠本字段切换 SSE。
attachments array 附件数组,默认 [](见 attachments[])。网关会把附件整理为上游可识别的上下文(如追加 system 说明 URL 列表)。
extra object 任意 JSON 对象,默认 {}。模型专有参数放于此(如数字人 image_url/audio_url/parameters;文生图/视频类 prompt、尺寸等)。服务端可能合并内部保留字段;请勿使用以下划线 `_` 开头的键名作为业务自定义字段。
messages[] — 单条消息

数组顺序即对话顺序;多轮时把历史轮次一并列入本数组即可。

字段名 类型 必填 说明
role string 角色:如 user、assistant、system 等,与上游 Chat Completions 约定一致。
content string 该轮文本内容。多轮时 assistant 一般为上一轮模型输出,由客户端保存后在后续请求的 messages 中写回。
images array 或 null 历史消息中的多模态图片结构,会话回放用;元素为对象,字段因上游而异。
audios array 或 null 历史消息中的音频结构,会话回放用。
attachments[] — 单条附件
字段名 类型 必填 说明
url string 附件可访问 URL(须能被上游或网关拉取)。
filename string 或 null 原始文件名,便于展示或日志。
mime string 或 null MIME 类型,如 image/png。
extra object 附件级扩展信息,默认 {}。
本页示例 JSON 涉及字段(model_id=15 · EMO 人像驱动视频)

仅需人像 `image_url` 与人声 `audio_url`。`face_bbox`、`ext_bbox` 由网关自动调用 EMO 图像检测接口写入,**无需在请求中传递**;若业务需覆盖检测结果可选手传(高级用法)。`style_level` 可放在 `extra.parameters` 或根级;`extra.ratio` 为检测画幅 `1:1` 或 `3:4`(默认 `1:1`)。

下列说明与下方「调用示例」JSON 对齐,由本站配置维护。

字段名 类型 必填 说明
model_id int 须为 `15`,与本页模型编号一致。
messages[].content string 任务说明文案;可与业务改写。
extra.image_url string 人像图片可访问 URL(须符合上游格式与尺寸要求)。
extra.audio_url string 含清晰人声的音频 URL(如 mp3/wav)。
extra.parameters.style_level string `normal` / `calm` / `active`,默认 `normal`,控制动作幅度。
extra.ratio string 自动检测时使用的画幅 `1:1` 或 `3:4`,默认 `1:1`。