跳转到主要内容

工作原理

1

将您的资产托管在一个公开可访问的 URL 上

上传您的视频、照片和音频文件,以便我们的服务器可以检索它们。
2

发送带有适当参数的 API 请求

引用您托管的资产并指定您想要的模式(标准模式或精确模式)。
3

等待或查询状态

使用我们的 webhook 回调或通过您的作业 ID 轮询 API,直到处理完成。
4

下载视频输出

从提供的 URL 获取完成的图片生成口播或对口型视频。

使用限制:

  • 您最多可以有 10 个并发作业(包括排队请求)。
  • 仅支持单面人脸的视频或照片。
  • 预计排队时间:1–120分钟,具体取决于系统负载。
  • 标准模式处理时间:约 10 分钟。
  • 精确模式处理时间:约 20 分钟。
如果视频或照片包含多张人脸,则只有检测到的最大人脸会被对口型处理。

API 错误代码

代码描述
5请求参数无效。
7没有请求权限。
104余额不足。
814您的账户不是会员,不允许调用 API。
1000内部服务器错误。
1301回调验证失败。
1302API 密钥已被撤销。
1304API 密钥已达到最大并发请求数。
1502您的音频驱动程序无效或无法下载。
1503您的账户未被授权调用 API。
1305仅允许 Business 方案。

作业错误代码

代码描述
999下载文件失败。
20403人脸不足。
20407人脸轨迹数量过多。
20408图像转视频人脸检测未通过。
20601图片中没有人脸。
20602未知的图像格式。
20611视频触发流限制。
20613生成对图像敏感的视频输入。