跳转到主要内容

为什么字幕在视觉翻译中不被翻译

字幕是从视频中的音频或配音生成的,因此它们本质上是 基于音频 的,并与语言内容密切相关。 而视觉翻译旨在翻译直接出现在视频画面中的 解释性视觉文本。这包括 标签、标题和幻灯片内容 等元素——这些文本在视觉上解释或补充视频内容,而不是表示口语语言。 出于这个原因,视觉翻译 故意不处理字幕。

为什么我们将字幕与视觉文本分开

字幕需要音频上下文

字幕翻译在很大程度上依赖于说话的上下文、句子流畅度和时机。
视觉翻译则处理独立的视觉文本,无法访问高质量字幕翻译所需的完整语言上下文。
如果通过视觉翻译翻译字幕,结果可能会不准确或不自然。

避免重复或冲突的结果

字幕更适合通过基于音频的工作流程处理:
  • 翻译字幕
  • 翻译与配音
如果字幕也通过视觉方式翻译:
  • 您可能会得到重复的字幕。而且基于文本的字幕翻译可能与基于音频的翻译发生冲突。
  • 当后来进行配音时,字幕文本和口述配音可能会有所不同,因为它们是从两个独立的翻译生成的——一个是视觉的,一个是基于音频的。

接下来你应该使用哪个工具?

完成视觉翻译后,如果您仍想翻译尚未处理的字幕,接下来可以这样做:
  • 如果您只想翻译字幕(不进行配音)
    → 导出视频并使用 翻译字幕
  • 如果您想在新语言中使用配音和字幕
    → 导出视频并使用 翻译与配音,然后打开 字幕
目前,翻译字幕翻译与配音 不支持擦除现有字幕。这些工具只能在视频上添加翻译过的字幕。如果您需要临时覆盖原始字幕,可以添加 字幕背景 来遮盖它们。我们正在积极努力使所有相关工具支持字幕擦除功能。
AI翻译其他工具

接下来会有什么

我们正在朝着 一体化翻译工作流程 的方向努力。 将来,您将能够一次上传视频,选择要处理的所有元素——如视觉文本、字幕、配音和口型同步——并在一个工作流程中完成整个翻译。 敬请关注。