# formula_project **Repository Path**: wangyi1677_admin/formula_project ## Basic Information - **Project Name**: formula_project - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-12-15 - **Last Updated**: 2025-12-29 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Formula Project 一个专注于公式识别与评估的项目。 ## 目录结构 - [01_data](file:///home/wangyi/coding/formula_project/01_data/) - raw_datasets: 原始数据集(直接从网上下载,不做修改) - personal_datasets: 个人数据集(用于存储自用数据集) - test_datasets: 测试数据集(用于评估工具测试) - processed_datasets: 处理后的数据集 - [02_train](file:///home/wangyi/coding/formula_project/02_train/): 训练相关 - [03_experiments](file:///home/wangyi/coding/formula_project/03_experiments/): 实验相关 - [04_eval](file:///home/wangyi/coding/formula_project/04_eval/): 评估相关 - external_tools: 外部评估工具 - UniMERNet/cdm: CDM评估工具 - TeXBLEU: TeXBLEU评估工具 - test_data: 评估测试数据 - evaluations: 评估结果存储目录 - [docs](file:///home/wangyi/coding/formula_project/docs/): 文档相关 - [scripts](file:///home/wangyi/coding/formula_project/scripts/): 脚本相关 ## 快速开始 ### 环境配置 ```bash # 创建虚拟环境 python -m venv formula_env # 激活虚拟环境 source formula_env/bin/activate # 安装依赖 pip install -r requirements.txt ``` ### 安装系统依赖 评估工具(特别是CDM)需要额外的系统级依赖才能正常工作。详细安装说明请参考[安装指南](file:///home/wangyi/coding/formula_project/docs/installation_guide.md)。 ### 模型训练 ```bash # 进入训练目录 cd 02_train # 运行模型训练 python vl_swift.py ``` ### 模型评估 项目提供了多种评估工具: 1. **深度诊断分析 (v7.0 Analytical Edition)**: 这是目前推荐的主流评估方式,能生成包含 Pareto 分布图和 8 维指标明细的交互式 HTML 报告。 ```bash python 04_eval/full_model_evaluation.py --model-path /path/to/model --sample-count 100 ``` 详细文档请参考 [04_eval/README.md](file:///home/wangyi/coding/formula_project/04_eval/README.md)。 2. **基础评估**: ```bash cd 04_eval python comprehensive_evaluation.py --model-path /path/to/model --data-path /path/to/data ``` 2. **综合评估工具包**: ```bash # 使用所有评估工具 python comprehensive_evaluator.py -p predictions.txt -r references.txt # 使用特定评估工具 python comprehensive_evaluator.py -p predictions.txt -r references.txt -t sacrebleu texbleu ``` 详细使用说明请参考[评估工具包使用说明](file:///home/wangyi/coding/formula_project/docs/evaluation_toolkit_usage.md)。 ## 文档 - [项目主计划](file:///home/wangyi/coding/formula_project/docs/project_master_plan.md) - [项目规则](file:///home/wangyi/coding/formula_project/docs/project_rules.md) - [评估工具包使用说明](file:///home/wangyi/coding/formula_project/docs/evaluation_toolkit_usage.md) - [安装指南](file:///home/wangyi/coding/formula_project/docs/installation_guide.md) - [评估系统规范](file:///home/wangyi/coding/formula_project/docs/evaluation_system.md) - [每日记录](file:///home/wangyi/coding/formula_project/docs/daily/)