# gtv-ocr

**Repository Path**: handsomepj/gtv-ocr

## Basic Information

- **Project Name**: gtv-ocr
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-01-23
- **Last Updated**: 2026-01-28

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# OCR 服务

基于 PaddleOCR 3.3.x 的文字识别服务，使用 PP-OCRv5 服务器版模型，专为列车号识别优化。

## 模型说明

- **检测模型**: PP-OCRv5_server_det（最新服务器版）
- **识别模型**: PP-OCRv5_server_rec（最新服务器版）  
- **方向分类**: PP-LCNet_x1_0_textline_ori
- **框架版本**: PaddlePaddle 3.3.0 GPU + PaddleOCR 3.3.3

**优势**：
- PP-OCRv5 是目前最新最强的 OCR 模型
- 服务器版模型精度更高，适合 GPU 部署
- 对列车号、车牌号等数字字母混合文本识别效果优异

## 快速开始

### 1. 安装依赖

```bash
# 使用 uv 安装（会自动从 PaddlePaddle 官方源安装 GPU 版本）
uv sync

# 验证安装
uv run python -c "import paddle; print(f'PaddlePaddle: {paddle.__version__}')"
```

### 2. 启动服务

```bash
# 设置环境变量跳过模型源检查（加快启动速度）
export DISABLE_MODEL_SOURCE_CHECK=True

# 启动服务
uv run ./main.py
```

服务地址: http://0.0.0.0:8767

### 3. API 文档

- Swagger UI: http://localhost:8767/docs
- ReDoc: http://localhost:8767/redoc

## 配置说明

本项目通过 `pyproject.toml` 配置 PaddlePaddle GPU 版本的安装：

```toml
[project]
dependencies = [
    "paddlepaddle-gpu==3.3.0",  # 从 PaddlePaddle 官方源安装
    "paddleocr>=3.3.0",
    # ... 其他依赖
]

[[tool.uv.index]]
name = "paddlepaddle"
url = "https://www.paddlepaddle.org.cn/packages/stable/cu118/"
explicit = true

[tool.uv.sources]
paddlepaddle-gpu = { index = "paddlepaddle" }
```

只需要运行 `uv sync` 即可自动安装所有依赖，包括从官方源下载 PaddlePaddle GPU 版本。

## 模型文件

本地模型位于：
- `ocr_models/det/` - PP-OCRv5 检测模型
- `ocr_models/rec/` - PP-OCRv5 识别模型
- `ocr_models/cls/` - 方向分类模型