VideoTranslator：智能视频翻译系统，支持提取音频、语音识别、翻译文本、生成字幕、导出视频等功能

最新修改 2025年 12月 22日 by amiao

项目介绍

VideoTranslator，一款开源的视频翻译工具，集成了OpenAI Whisper语音识别引擎和多种翻译API。

提供了一整套视频翻译解决方案，包括从视频中提取音频、进行语音识别、翻译文本、生成字幕以及导出视频等功能。

截图

VideoTranslator：智能视频翻译系统，支持提取音频、语音识别、翻译文本、生成字幕、导出视频等功能

核心功能

🎵 音频处理: 自动从视频中提取音频，支持多种音频格式
🗣️ 语音识别: 集成OpenAI Whisper引擎，支持多语言高精度语音转文本
🌐 智能翻译: 支持OpenAI、DeepL、Google等多种翻译API
📝 字幕编辑: 可视化字幕编辑器，支持时间轴调整和样式设置
🎬 视频导出: 支持字幕烧录和软字幕嵌入两种导出方式
⚡ 性能优化: 内存管理、多线程处理、检查点恢复机制

安装指南

1. 克隆项目

git clone https://github.com/YinChingZ/VideoTranslator.git cd VideoTranslator

2. 安装依赖

# 安装Python依赖 pip install -r requirements.txt # 安装FFmpeg (Windows) # 下载并安装FFmpeg，确保添加到PATH环境变量 # 安装FFmpeg (macOS) brew install ffmpeg # 安装FFmpeg (Ubuntu) sudo apt update sudo apt install ffmpeg

3. 配置API密钥

在应用程序设置中配置您的翻译API密钥：
OpenAI API密钥
DeepL API密钥
Google Translate API密钥
4. 运行应用程序

python main.py

使用流程

1. 视频导入

拖拽视频文件到应用窗口
或通过菜单选择视频文件
支持的格式: MP4, AVI, MOV, MKV等

2. 语言设置

选择源语言 (可自动检测)
选择目标语言
配置Whisper模型大小

3. 处理阶段

音频提取: 从视频中提取音频轨道
语音识别: 使用Whisper进行语音转文本
文本翻译: 调用翻译API进行文本翻译
字幕生成: 生成带时间轴的字幕文件

4. 字幕编辑

在字幕编辑器中调整时间轴
修改翻译文本
设置字幕样式和位置

5. 视频导出

选择导出格式 (硬字幕/软字幕)
设置视频质量参数
开始导出最终视频

链接

GitHub：https://github.com/YinChingZ/VideoTranslator

{{userData.name}}已认证