# 无ocr的pdf转markdown **Repository Path**: Fj1225815367/pdf2md_without_ocr ## Basic Information - **Project Name**: 无ocr的pdf转markdown - **Description**: 没有ocr的pdf转markdown,主要针对于非扫描版pdf文件 - **Primary Language**: Python - **License**: MulanPSL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-05-30 - **Last Updated**: 2025-06-09 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 无OCR的pdf表格解析 整个代码主要基于MinerU实现。针对标准版本的pdf文档(非扫描件)进行markdown转换。 创建python环境3.12 conda create -n pdf2md 'python=3.12' -y conda activate pdf2md 配置环境 安装MinerU(https://github.com/opendatalab/MinerU/blob/master/README_zh-CN.md) pip install -U "magic-pdf[full]" -i https://mirrors.aliyun.com/pypi/simple