# TS_Workers **Repository Path**: zqa2048/ts_workers ## Basic Information - **Project Name**: TS_Workers - **Description**: 转录服务—— workers - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-11-03 - **Last Updated**: 2025-11-06 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 视频转录服务 Worker 视频转录和AI润色的分布式Worker服务 ## 快速开始 ```bash # 流水线模式(推荐)- 自动完成转录+润色 python src/worker.py --excel file.xlsx --pipeline ``` ## 主要功能 - ✅ Whisper 自动转录(Tiny/Base/Small) - ✅ AI 智能润色(DeepSeek Chat/Reasoner) - ✅ 质量检测(重复内容识别) - ✅ 智能重试(自动升级模型) - ✅ 批量处理(并行上传) ## 安装配置 ### 1. 安装依赖 ```bash pip install -r requirements.txt ``` ### 2. 配置文件 ```bash # 复制配置模板 cp config/.env.example config/.env cp config/worker_config.example.json config/worker_config.json # 编辑配置 vi config/.env # 设置 API Key vi config/worker_config.json # 设置机器名、路径等 ``` ## 使用方式 ### 流水线模式(推荐) ```bash python src/worker.py --excel file.xlsx --pipeline ``` **流程**: 1. 阶段1:Tiny + Chat(快速处理85%) 2. 阶段2:自动升级(Base/Small + Reasoner,恢复12%) 3. 最终成功率:97% ### 其他模式 ```bash # 普通模式 python src/worker.py --excel file.xlsx # 重新润色 python src/worker.py --excel file.xlsx --repolish # 手动重试 python src/worker.py --excel file.xlsx --retry-failed --whisper-model base ``` ## 项目结构 ``` transcribe-service/ ├── src/ │ ├── core/ │ │ ├── transcriber.py # Whisper 转录 │ │ ├── polish.py # AI 润色 │ │ └── pipeline.py # 流水线处理 ⭐ │ ├── parsers/ # Excel 解析 │ ├── client/ # API 客户端 │ └── worker.py # 主程序 ├── config/ # 配置文件 ├── docs/ # 文档 📖 │ ├── PIPELINE.md # 流水线使用指南 │ ├── DATABASE.md # 数据库字段说明 │ └── CHANGELOG.md # 更新日志 └── scripts/ # 工具脚本 ``` ## 文档 - [流水线使用指南](docs/PIPELINE.md) - 详细使用说明 - [数据库字段说明](docs/DATABASE.md) - 新增字段文档 - [更新日志](docs/CHANGELOG.md) - 版本变更记录 - [部署指南](docs/DEPLOY.md) - 跨平台部署 ## 成本估算 **1000个视频**: - 时间:45-65分钟 - 成本:¥15-25 - 成功率:97% ## 版本 当前版本:**v3.0.0** (Pipeline Mode) ## License Private Project