DeepSeek OCR APP- 由 DeepSeek-OCR 提供支持的 OCR Web 前端OCR程序，直接在线识别各种图像

人工智能
25年10月25日
编辑

amiao

最新修改 2025年 10月 25日 by amiao

模型介绍

DeepSeek_OCR_APP，为DeepSeek-OCR 提供支持的 OCR Web 前端OCR程序，直接在线识别各种图像，需要自行部署。

硬件：支持 CUDA 的 NVIDIA GPU，推荐：RTX 3090、RTX 4090、RTX 5090 或更高版本，最低要求：8-12GB VRAM（适用于该型号），更多的 VRAM 总是好的！

模型截图

All birds品种丰富色彩鲜艳，栖息在繁花似锦的春日树枝上，展现自然生态之美.

2020年到2006年数据线性增长折线图.

核心功能

4 种核心 OCR 模式

纯文本 OCR – 从任何图像中提取原始文本
描述– 生成智能图像描述
查找– 使用视觉边界框定位特定术语
自由形式——针对特殊任务的自定义提示

UI 功能

🔍 多边界框支持（处理找到的术语的多个实例）

🎨 具有动画渐变的玻璃形态设计

🎯 拖放文件上传（默认最大 100MB）

🗑️ 轻松删除图像并重新上传

📦 具有适当坐标缩放的接地盒可视化

✨ 流畅的动画（Framer Motion）

📋 复制/下载结果

🎛️ 高级设置下拉菜单

📝 HTML 和 Markdown 渲染以进行格式化输出

快速配置

克隆并配置：git clone <repository-url> cd deepseek_ocr_app # Copy and customize environment variables cp .env.example .env # Edit .env to configure ports, upload limits, etc.
启动应用程序：docker compose up –build第一次运行将下载模型（~5-10GB），这可能需要一些时间。
访问应用程序：
- 前端：http://localhost:3000（或您配置的 FRONTEND_PORT）
- 后端 API：http://localhost:8000（或您配置的 API_PORT）
- API 文档：http://localhost:8000/docs

模型链接

github：https://github.com/rdumasia303/deepseek_ocr_app

deepseek DeepSeek OCR OCR 大模型

FireRedTTS-2 - 面向播客和聊天机器人的AI长对话语音生成

2025-10-25 9:26:45

GenColoring ai：在线AI涂色页生成器，几秒完成照片转换成涂色页，免费使用

2025-10-29 10:46:07

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

❯

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部