DeepSeek OCR APP- 由 DeepSeek-OCR 提供支持的 OCR Web 前端OCR程序,直接在线识别各种图像

最新修改 2025年 10月 25日 by amiao

模型介绍

DeepSeek_OCR_APP,为DeepSeek-OCR 提供支持的 OCR Web 前端OCR程序,直接在线识别各种图像,需要自行部署。

硬件:支持 CUDA 的 NVIDIA GPU,推荐:RTX 3090、RTX 4090、RTX 5090 或更高版本,最低要求:8-12GB VRAM(适用于该型号),更多的 VRAM 总是好的!

模型截图

All birds品种丰富色彩鲜艳,栖息在繁花似锦的春日树枝上,展现自然生态之美.
2020年到2006年数据线性增长折线图.

核心功能

4 种核心 OCR 模式

  • 纯文本 OCR - 从任何图像中提取原始文本
  • 描述- 生成智能图像描述
  • 查找- 使用视觉边界框定位特定术语
  • 自由形式——针对特殊任务的自定义提示

UI 功能

🔍 多边界框支持(处理找到的术语的多个实例)

🎨 具有动画渐变的玻璃形态设计

🎯 拖放文件上传(默认最大 100MB)

🗑️ 轻松删除图像并重新上传

📦 具有适当坐标缩放的接地盒可视化

✨ 流畅的动画(Framer Motion)

📋 复制/下载结果

🎛️ 高级设置下拉菜单

📝 HTML 和 Markdown 渲染以进行格式化输出

快速配置

  1. 克隆并配置:git clone <repository-url> cd deepseek_ocr_app # Copy and customize environment variables cp .env.example .env # Edit .env to configure ports, upload limits, etc.
  2. 启动应用程序:docker compose up --build第一次运行将下载模型(~5-10GB),这可能需要一些时间。
  3. 访问应用程序:

模型链接

github:https://github.com/rdumasia303/deepseek_ocr_app

人工智能

FireRedTTS-2 - 面向播客和聊天机器人的AI长对话语音生成

2025-10-25 9:26:45

网站推荐

Pingro:智能最新资讯信息监控,不在错过重要信息

2025-4-30 16:13:58

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索