# 文档拆分与合并工具 **Repository Path**: lyd_js/FileTool ## Basic Information - **Project Name**: 文档拆分与合并工具 - **Description**: 利用Python语言实现的word、excel、pdf、txt四种文档按行或页进行拆分与合并 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 1 - **Created**: 2019-09-09 - **Last Updated**: 2022-09-02 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 文档拆分与合并工具 #### 介绍 利用Python语言实现的word、excel、pdf、txt四种文档按行或页进行拆分与合并 #### 所需依赖 python-qt5 xlrd xlsxwriter pywin32 PyPDF2 Office Word 2013 #### 解决PDF字符编码问题 1.修改PyPdf2模块库文件generic.py 位置:python安装目录\Lib\site-packages\PyPDF2\generic.py 第474行 `return NameObject(name.decode('utf-8'))` 改为 `ret=name.decode('utf-8')` 第 488行-492行 `if not pdf.strict:` `warnings.warn("Illegal character in Name Object", utils.PdfReadWarning)` `return NameObject(name)` `else:` `raise utils.PdfReadError("Illegal character in Name Object")` 改为`ret=name.decode('gbk')` 在494行前加上`return NameObject(ret)` 与 `except`对齐 2.修改PyPdf2模块库文件utils.py 位置:python安装目录\Lib\site-packages\PyPDF2\utils.py 将第238行`r = s.encode('latin-1')`改为`try:` `r = s.encode('latin-1')` `except Exception as e:` `r = s.encode('utf-8')`