# gtv-ocr **Repository Path**: handsomepj/gtv-ocr ## Basic Information - **Project Name**: gtv-ocr - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-01-23 - **Last Updated**: 2026-01-28 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # OCR 服务 基于 PaddleOCR 3.3.x 的文字识别服务,使用 PP-OCRv5 服务器版模型,专为列车号识别优化。 ## 模型说明 - **检测模型**: PP-OCRv5_server_det(最新服务器版) - **识别模型**: PP-OCRv5_server_rec(最新服务器版) - **方向分类**: PP-LCNet_x1_0_textline_ori - **框架版本**: PaddlePaddle 3.3.0 GPU + PaddleOCR 3.3.3 **优势**: - PP-OCRv5 是目前最新最强的 OCR 模型 - 服务器版模型精度更高,适合 GPU 部署 - 对列车号、车牌号等数字字母混合文本识别效果优异 ## 快速开始 ### 1. 安装依赖 ```bash # 使用 uv 安装(会自动从 PaddlePaddle 官方源安装 GPU 版本) uv sync # 验证安装 uv run python -c "import paddle; print(f'PaddlePaddle: {paddle.__version__}')" ``` ### 2. 启动服务 ```bash # 设置环境变量跳过模型源检查(加快启动速度) export DISABLE_MODEL_SOURCE_CHECK=True # 启动服务 uv run ./main.py ``` 服务地址: http://0.0.0.0:8767 ### 3. API 文档 - Swagger UI: http://localhost:8767/docs - ReDoc: http://localhost:8767/redoc ## 配置说明 本项目通过 `pyproject.toml` 配置 PaddlePaddle GPU 版本的安装: ```toml [project] dependencies = [ "paddlepaddle-gpu==3.3.0", # 从 PaddlePaddle 官方源安装 "paddleocr>=3.3.0", # ... 其他依赖 ] [[tool.uv.index]] name = "paddlepaddle" url = "https://www.paddlepaddle.org.cn/packages/stable/cu118/" explicit = true [tool.uv.sources] paddlepaddle-gpu = { index = "paddlepaddle" } ``` 只需要运行 `uv sync` 即可自动安装所有依赖,包括从官方源下载 PaddlePaddle GPU 版本。 ## 模型文件 本地模型位于: - `ocr_models/det/` - PP-OCRv5 检测模型 - `ocr_models/rec/` - PP-OCRv5 识别模型 - `ocr_models/cls/` - 方向分类模型