### [Paper2Video：学术论文自动生成演讲视频的工具，可将文章直接转换成 PPT 演讲视频](https://www.appmiao.com/article/1939)

**Published:** 2025-10-31T03:04:46

**Author:** 阿喵

**Excerpt:** 完成了一篇论文或者文章，但不擅长讲解，不知道如何讲解更清晰？ 那让Paper2Video来帮助你吧，一个可以将学术论文转换成PPT并自动生成演讲视频的好项目。 提供一篇论文+一张作者照片+一段参考音频，它就能帮你生成一个生动的演讲解说视频。

完成了一篇论文或者文章，但不擅长讲解，不知道如何讲解更清晰？

那让Paper2Video来帮助你吧，一个可以将学术论文转换成PPT并自动生成演讲视频的好项目。

提供一篇论文+一张作者照片+一段参考音频，它就能帮你生成一个生动的演讲解说视频。对于偏专业和学术性的场景，这个工具几乎能承担起人工完成的工作，做学术汇报和做课程的朋友有福了！

## 网站介绍

Paper2Video，一个自动化系统，旨在将学术论文（如 LaTeX 或 PDF）自动转换成完整的演讲视频，提供模块化架构，支持不同模型（如 GPT-4、Gemini、Hallo2 等）自由组合。

它能够根据论文内容自动生成幻灯片、字幕、语音讲解、光标指示，甚至可选的讲者视频，从而实现从论文到学术报告的全流程自动化，极大地简化了科研成果展示与传播的过程。

### 截图

![](https://pic.amiao.app/2025/10/26054220/1761878301-43568.png)

### **这项工作解决了学术演讲的两个核心问题:**

-   **左边: 如何根据论文制作学术演讲?**  
    _PaperTalker_ — 集成**幻灯片**、**字幕**、**光标**、**语音合成**和**演讲者视频渲染**的多智能体。
-   **右边: 如何评估学术演讲视频?**  
    _Paper2Video_ — 一个具有精心设计的指标来评估演示质量的基准。

### 快速上手

#### 1\. 环境配置[](https://github.com/showlab/Paper2Video/blob/main/README-CN.md#1-%E7%8E%AF%E5%A2%83%E9%85%8D%E7%BD%AE)

准备Python环境:

cd src
conda create -n p2v python=3.10
conda activate p2v
pip install -r requirements.txt
conda install -c conda-forge tectonic

**\[可选\] 如果您不需要数字人展示，请 [跳过](https://github.com/showlab/Paper2Video/blob/main/README-CN.md#2-%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E9%85%8D%E7%BD%AE) 此部分。**

下载所依赖代码，并按照[Hallo2](https://github.com/fudan-generative-vision/hallo2)中的说明下载模型权重。

git clone https://github.com/fudan-generative-vision/hallo2.git

您需要**单独准备用于 talking-head generation 的环境**，以避免潜在的软件包冲突，请参考Hallo2。安装完成后，使用 `which python` 命令获取 Python 环境路径。

cd hallo2
conda create -n hallo python=3.10
conda activate hallo
pip install -r requirements.txt

#### 2\. 大语言模型配置[](https://github.com/showlab/Paper2Video/blob/main/README-CN.md#2-%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E9%85%8D%E7%BD%AE)

在终端配置您的**API 凭证**:

export GEMINI\_API\_KEY="your\_gemini\_key\_here"
export OPENAI\_API\_KEY="your\_openai\_key\_here"

最佳实践是针对 LLM 和 VLM 使用 **GPT4.1** 或 **Gemini2.5-Pro**。我们也支持本地部署开源模型（例如 Qwen），详情请参阅 [Paper2Poster](https://github.com/Paper2Poster/Paper2Poster.git)。

#### 3\. 推理[](https://github.com/showlab/Paper2Video/blob/main/README-CN.md#3-%E6%8E%A8%E7%90%86)

脚本 `pipeline.py` 提供了一个自动化的学术演示视频生成流程。它以 **LaTeX 论文素材** 和 **参考图像/音频** 作为输入，并经过多个子模块（幻灯片 → 字幕 → 语音 → 光标 → 头部特写）生成完整的演示视频。⚡ 运行此流程的最低推荐 GPU 为 **NVIDIA A6000**，显存 48G。

## 网站链接

github地址：[https://github.com/showlab/Paper2Video](https://github.com/showlab/Paper2Video)

官方地址：[https://showlab.github.io/Paper2Video/](https://showlab.github.io/Paper2Video/)

**Tags:** 学术论文, 文本转视频, 视频讲解

**Categories:** 开源项目

---