字幕生成
VidGo 提供强大的 AI 字幕生成功能,可以自动为你的视频生成准确的字幕文件,并借助LLM优化断句。
功能概览
🎢 自动语音识别
- 支持多种语言的语音转文字
- 高精度的时间轴对齐
- 智能断句和标点符号
🌐 多语言翻译
- 支持将字幕翻译成多种目标语言
- 保持原有时间轴不变
- 提供双语字幕选项
✨ 字幕优化
- AI 驱动的字幕内容优化
- 自动调整断句和时长
- 提升字幕可读性
字幕生成流程
1. 选择视频
在媒体库中:
- 找到需要生成字幕的视频
- 点击视频卡片上的 生成字幕 按钮
- 或在视频详情页面点击 字幕 标签
2. 配置生成选项
语言设置
- 源语言: 视频中的音频语言
- 目标语言: 需要翻译到的语言(可选)
- 双语模式: 同时显示源语言和目标语言
字幕样式
- 字幕长度: 每行字幕的最大字符数
- 显示时长: 每条字幕的最小显示时间
- 合并短句: 自动合并过短的字幕段
3. 开始生成
点击 开始生成 后,系统会创建字幕生成任务。
任务监控
字幕生成包含三个阶段:
🎙️ 转录阶段
- 功能: 将音频转换为文字
- 输出: 带时间轴的原始转录文本
✨ 优化阶段
- 功能: 优化字幕内容和格式
- 处理: 断句、标点、时长调整
- 输出: 格式化的字幕文件
🌍 翻译阶段(可选)
- 功能: 将字幕翻译成目标语言
- 保持: 原有时间轴和断句结构
- 输出: 多语言字幕文件
字幕格式支持
导出格式
- SRT: 最通用的字幕格式
- VTT: 网页视频字幕格式
- ASS/SSA: 支持样式和特效的格式
- TXT: 纯文本格式
字幕编辑
在线编辑器
生成后可以使用内置编辑器:
- ⏰ 时间轴调整: 拖拽调整字幕时间
- ✏️ 文本编辑: 直接修改字幕内容
- 🎨 样式设置: 字体、颜色、位置
- 👥 说话人标记: 为不同说话人添加标识(待完成)