跳转到主要内容

工作原理

1

将您的资产托管在一个公开可访问的 URL 上

上传您的视频、照片和音频文件,以便我们的服务器可以检索它们。
2

发送带有适当参数的 API 请求

引用您托管的资产并指定您所需的模式(标准或精确)。
3

等待或查询状态

使用我们的网页hooks回调或使用您的作业ID轮询API,直到处理完成。
4

下载视频输出

从提供的URL中获取完成的图片说话或口型同步视频。

使用限制:

  • 您最多可以有 10 个并发作业(包括排队请求)。
  • 仅支持单面人脸的视频或照片。
  • 预计排队时间:1–120分钟,具体取决于系统负载。
  • 标准模式处理时间:约 10 分钟。
  • 精确模式处理时间:约 20 分钟。
如果视频或照片包含多个面部,仅最大的检测到的面部将进行口型同步。

API 错误代码

代码描述
5无效的请求参数。
7无权限请求。
104积分不足。
814您的账户不是会员,无法调用API。
1000服务器内部错误。
1301回调挑战失败。
1302API密钥已被撤销。
1304API密钥已达到最大并发请求数量。
1502您的音频驱动程序无效或无法下载。
1503您的账户没有权限调用API。
1305仅允许使用Studio方案。

作业错误代码

代码描述
999下载文件失败。
20403人脸不足。
20407人脸轨迹数量过多。
20408图像转视频人脸检测未通过。
20601图片中没有人脸。
20602未知的图像格式。
20611视频触发流限制。
20613生成对图像敏感的视频输入。
最后修改于 2026年5月21日