跳到主要内容

字幕生成

VidGo 提供强大的 AI 字幕生成功能,可以自动为你的视频生成准确的字幕文件,并借助LLM优化断句。 字幕生成

功能概览

🎢 自动语音识别

  • 支持多种语言的语音转文字
  • 高精度的时间轴对齐
  • 智能断句和标点符号

🌐 多语言翻译

  • 支持将字幕翻译成多种目标语言
  • 保持原有时间轴不变
  • 提供双语字幕选项

✨ 字幕优化

  • AI 驱动的字幕内容优化
  • 自动调整断句和时长
  • 提升字幕可读性

字幕生成流程

1. 选择视频

在媒体库中:

  1. 找到需要生成字幕的视频
  2. 点击视频卡片上的 生成字幕 按钮
  3. 或在视频详情页面点击 字幕 标签

2. 配置生成选项

语言设置

  • 源语言: 视频中的音频语言
  • 目标语言: 需要翻译到的语言(可选)
  • 双语模式: 同时显示源语言和目标语言

字幕样式

  • 字幕长度: 每行字幕的最大字符数
  • 显示时长: 每条字幕的最小显示时间
  • 合并短句: 自动合并过短的字幕段

3. 开始生成

点击 开始生成 后,系统会创建字幕生成任务。

任务监控

字幕生成包含三个阶段:

🎙️ 转录阶段

  • 功能: 将音频转换为文字
  • 输出: 带时间轴的原始转录文本

✨ 优化阶段

  • 功能: 优化字幕内容和格式
  • 处理: 断句、标点、时长调整
  • 输出: 格式化的字幕文件

🌍 翻译阶段(可选)

  • 功能: 将字幕翻译成目标语言
  • 保持: 原有时间轴和断句结构
  • 输出: 多语言字幕文件

字幕格式支持

导出格式

  • SRT: 最通用的字幕格式
  • VTT: 网页视频字幕格式
  • ASS/SSA: 支持样式和特效的格式
  • TXT: 纯文本格式

字幕编辑

在线编辑器

生成后可以使用内置编辑器:

  • 时间轴调整: 拖拽调整字幕时间
  • ✏️ 文本编辑: 直接修改字幕内容
  • 🎨 样式设置: 字体、颜色、位置
  • 👥 说话人标记: 为不同说话人添加标识(待完成)