# formula_project

**Repository Path**: wangyi1677_admin/formula_project

## Basic Information

- **Project Name**: formula_project
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-12-15
- **Last Updated**: 2025-12-29

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# Formula Project

一个专注于公式识别与评估的项目。

## 目录结构

- [01_data](file:///home/wangyi/coding/formula_project/01_data/)
  - raw_datasets: 原始数据集（直接从网上下载，不做修改）
  - personal_datasets: 个人数据集（用于存储自用数据集）
    - test_datasets: 测试数据集（用于评估工具测试）
  - processed_datasets: 处理后的数据集
- [02_train](file:///home/wangyi/coding/formula_project/02_train/): 训练相关
- [03_experiments](file:///home/wangyi/coding/formula_project/03_experiments/): 实验相关
- [04_eval](file:///home/wangyi/coding/formula_project/04_eval/): 评估相关
  - external_tools: 外部评估工具
    - UniMERNet/cdm: CDM评估工具
    - TeXBLEU: TeXBLEU评估工具
  - test_data: 评估测试数据
  - evaluations: 评估结果存储目录
- [docs](file:///home/wangyi/coding/formula_project/docs/): 文档相关
- [scripts](file:///home/wangyi/coding/formula_project/scripts/): 脚本相关

## 快速开始

### 环境配置

```bash
# 创建虚拟环境
python -m venv formula_env

# 激活虚拟环境
source formula_env/bin/activate

# 安装依赖
pip install -r requirements.txt
```

### 安装系统依赖

评估工具（特别是CDM）需要额外的系统级依赖才能正常工作。详细安装说明请参考[安装指南](file:///home/wangyi/coding/formula_project/docs/installation_guide.md)。

### 模型训练

```bash
# 进入训练目录
cd 02_train

# 运行模型训练
python vl_swift.py
```

### 模型评估

项目提供了多种评估工具：

1. **深度诊断分析 (v7.0 Analytical Edition)**：
   这是目前推荐的主流评估方式，能生成包含 Pareto 分布图和 8 维指标明细的交互式 HTML 报告。
   ```bash
   python 04_eval/full_model_evaluation.py --model-path /path/to/model --sample-count 100
   ```
   详细文档请参考 [04_eval/README.md](file:///home/wangyi/coding/formula_project/04_eval/README.md)。

2. **基础评估**：
   ```bash
   cd 04_eval
   python comprehensive_evaluation.py --model-path /path/to/model --data-path /path/to/data
   ```

2. **综合评估工具包**：
   ```bash
   # 使用所有评估工具
   python comprehensive_evaluator.py -p predictions.txt -r references.txt
   
   # 使用特定评估工具
   python comprehensive_evaluator.py -p predictions.txt -r references.txt -t sacrebleu texbleu
   ```

详细使用说明请参考[评估工具包使用说明](file:///home/wangyi/coding/formula_project/docs/evaluation_toolkit_usage.md)。

## 文档

- [项目主计划](file:///home/wangyi/coding/formula_project/docs/project_master_plan.md)
- [项目规则](file:///home/wangyi/coding/formula_project/docs/project_rules.md)
- [评估工具包使用说明](file:///home/wangyi/coding/formula_project/docs/evaluation_toolkit_usage.md)
- [安装指南](file:///home/wangyi/coding/formula_project/docs/installation_guide.md)
- [评估系统规范](file:///home/wangyi/coding/formula_project/docs/evaluation_system.md)
- [每日记录](file:///home/wangyi/coding/formula_project/docs/daily/)