# translate **Repository Path**: chengang198501/translate ## Basic Information - **Project Name**: translate - **Description**: doc translation - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-11-17 - **Last Updated**: 2025-12-11 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # PDF 智能解析与翻译工具 (PDF Intelligence & Translation) 本项目包含两套核心 PDF 处理方案: 1. **`translate_demo.py`**: 基于 `pdf2zh` 的流式翻译(保留排版,适合论文)。 2. **`demo_ocr_to_md.py`**: 基于 **PaddleOCR V3 (PP-Structure)** 的视觉重构与数字化(适合复杂表格、目录、扫描件)。 --- ## 🚀 核心功能:OCR 高清重构 (V3) 针对复杂文档(如无边框表格、多栏目录),我们采用了 **PaddleOCR V3 服务器级模型** 配合 **3x 高清渲染** 技术,实现了像素级的结构还原。 - **支持格式**:PDF (扫描件/电子版) -> Markdown / HTML - **核心能力**: - 自动识别表格并添加边框样式 - 自动识别标题层级 - 完美处理多栏排版(如目录页) - **硬件加速**:支持 NVIDIA GPU 加速 (CUDA 12) --- ## 🛠️ 环境部署指南 (GPU 服务器推荐) 为了获得最佳性能(单页 < 20秒),强烈建议在 **GPU 服务器** 上运行。 ### 1. 基础环境 - **OS**: Linux (Ubuntu 20.04+) / Windows - **Python**: 3.10 (推荐) - **CUDA**: **12.3** (推荐, 兼容性最好) / 11.8 ### 2. 安装步骤 (Conda 方式) 请严格按照以下顺序执行安装,避免依赖冲突: ```bash # 1. 创建并激活环境 conda create -n paddle_ocr python=3.10 -y conda activate paddle_ocr # 2. 安装 PaddlePaddle GPU 版 (CUDA 12.3) # ⚠️ 必须先安装这个,否则可能会自动安装成 CPU 版 pip install paddlepaddle-gpu==3.0.0b1 -i https://www.paddlepaddle.org.cn/packages/stable/cu123/ # 3. 安装 PaddleX OCR 插件 # PP-StructureV3 依赖此插件 pip install "paddlex[ocr]" # 4. 修复 NumPy 版本兼容性问题 # 防止出现 "A module that was compiled using NumPy 1.x" 报错 pip install "numpy<2.0" # 5. 安装项目其他依赖 pip install -r requirements.txt ``` ### 3. 常见问题排查 - **报错 `ImportError: libcudnn.so.9`**: 通常是因为环境里残留了不兼容的 PyTorch。建议卸载 PyTorch: ```bash pip uninstall torch torchvision torchaudio -y ``` - **验证 GPU 是否生效**: ```bash python -c "import paddle; paddle.utils.run_check()" ``` 应输出: `PaddlePaddle works well on MUTIPLE GPU` --- ## ⚡ 运行指南 ### 1. 运行 OCR 转 Markdown 支持命令行参数,方便服务器调用: ```bash # 处理默认文件 (table4.pdf) python demo_ocr_to_md.py # 处理指定文件 python demo_ocr_to_md.py /path/to/your/document.pdf ``` 输出文件将生成在源文件同级目录,后缀为 `_converted.md`。 ### 2. 运行流式翻译 demo ```bash python translate_demo.py ``` --- ### 3. DIFY 接口密钥 app-i2hg1y0vmi0X8UuahEzUHlqO ## 📦 依赖列表 (requirements.txt) *见项目根目录 requirements.txt* 方法1:通过命令面板 按 Ctrl+Shift+P 打开命令面板 输入 Python: Select Interpreter 选择 translate 环境(路径类似 C:\ProgramData\miniconda3\envs\translate\python.exe)