# sciencebeam_parser **Repository Path**: remixa/sciencebeam_parser ## Basic Information - **Project Name**: sciencebeam_parser - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 3 - **Forks**: 0 - **Created**: 2023-10-29 - **Last Updated**: 2024-09-16 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # sciencebeam_parser ## 配置环境 ```bash # 1. 获取仓库文件 git clone https://gitee.com/remixa/sciencebeam_parser.gi # 2. 进入目录 cd sciencebeam_parser # 3. 基于yml文件配置conda环境 conda env create -f conda_environment.yml # 4. 激活conda环境 conda activate ScienceBeam # 5. 额外安装必要库 pip install pikepdf ``` ## 使用 ```bash # 1. 以8080端口启动ScienceBeam parser服务 python -m sciencebeam_parser.service.server --port=8080 # 2. 使用代码指定pdf文件目录进行批量解析 # - 解析得到的各json文件将置于pdf文件目录同级的sciencebeam_parser_results目录中 python sciencebeam_parser.py --dir_path {pdf_dir_path} ```