VideoTranslator:智能视频翻译系统,支持提取音频、语音识别、翻译文本、生成字幕、导出视频等功能

最新修改 2025年 12月 22日 by amiao

项目介绍

VideoTranslator,一款开源的视频翻译工具,集成了OpenAI Whisper语音识别引擎和多种翻译API。

提供了一整套视频翻译解决方案,包括从视频中提取音频、进行语音识别、翻译文本、生成字幕以及导出视频等功能。

截图

VideoTranslator:智能视频翻译系统,支持提取音频、语音识别、翻译文本、生成字幕、导出视频等功能

核心功能

  • 🎵 音频处理: 自动从视频中提取音频,支持多种音频格式
  • 🗣️ 语音识别: 集成OpenAI Whisper引擎,支持多语言高精度语音转文本
  • 🌐 智能翻译: 支持OpenAI、DeepL、Google等多种翻译API
  • 📝 字幕编辑: 可视化字幕编辑器,支持时间轴调整和样式设置
  • 🎬 视频导出: 支持字幕烧录和软字幕嵌入两种导出方式
  • ⚡ 性能优化: 内存管理、多线程处理、检查点恢复机制

安装指南

1. 克隆项目

git clone https://github.com/YinChingZ/VideoTranslator.git cd VideoTranslator

2. 安装依赖

# 安装Python依赖 pip install -r requirements.txt # 安装FFmpeg (Windows) # 下载并安装FFmpeg,确保添加到PATH环境变量 # 安装FFmpeg (macOS) brew install ffmpeg # 安装FFmpeg (Ubuntu) sudo apt update sudo apt install ffmpeg

3. 配置API密钥

在应用程序设置中配置您的翻译API密钥:
OpenAI API密钥
DeepL API密钥
Google Translate API密钥
4. 运行应用程序

python main.py

使用流程

1. 视频导入

  • 拖拽视频文件到应用窗口
  • 或通过菜单选择视频文件
  • 支持的格式: MP4, AVI, MOV, MKV等

2. 语言设置

  • 选择源语言 (可自动检测)
  • 选择目标语言
  • 配置Whisper模型大小

3. 处理阶段

  • 音频提取: 从视频中提取音频轨道
  • 语音识别: 使用Whisper进行语音转文本
  • 文本翻译: 调用翻译API进行文本翻译
  • 字幕生成: 生成带时间轴的字幕文件

4. 字幕编辑

  • 在字幕编辑器中调整时间轴
  • 修改翻译文本
  • 设置字幕样式和位置

5. 视频导出

  • 选择导出格式 (硬字幕/软字幕)
  • 设置视频质量参数
  • 开始导出最终视频

链接

GitHub:https://github.com/YinChingZ/VideoTranslator

开源项目软件推荐

Keyden - 简洁优雅的 macOS 菜单栏 TOTP 双因素认证器,密钥安全存储于 macOS 钥匙串,支持扫码添加账号与一键复制验证码

2025-12-19 10:49:41

人工智能

 Open Interpreter,让AI语言模型在您的计算机上运行代码。实现本地AI控制和交互

2025-12-24 10:35:40

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索