# 文档拆分与合并工具

**Repository Path**: lyd_js/FileTool

## Basic Information

- **Project Name**: 文档拆分与合并工具
- **Description**: 利用Python语言实现的word、excel、pdf、txt四种文档按行或页进行拆分与合并
- **Primary Language**: Python
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 2
- **Forks**: 1
- **Created**: 2019-09-09
- **Last Updated**: 2022-09-02

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 文档拆分与合并工具

#### 介绍
利用Python语言实现的word、excel、pdf、txt四种文档按行或页进行拆分与合并


#### 所需依赖

python-qt5

xlrd

xlsxwriter

pywin32

PyPDF2

Office Word 2013

#### 解决PDF字符编码问题

1.修改PyPdf2模块库文件generic.py

位置：python安装目录\Lib\site-packages\PyPDF2\generic.py

第474行 `return NameObject(name.decode('utf-8'))` 改为 `ret=name.decode('utf-8')`

第 488行-492行 `if not pdf.strict:`
                   
                    `warnings.warn("Illegal character in Name Object", utils.PdfReadWarning)`
                   
                    `return NameObject(name)`
               
                `else:`
                   
                    `raise utils.PdfReadError("Illegal character in Name Object")`
                    
                    改为`ret=name.decode('gbk')`

在494行前加上`return NameObject(ret)` 与 `except`对齐

2.修改PyPdf2模块库文件utils.py

位置：python安装目录\Lib\site-packages\PyPDF2\utils.py

将第238行`r = s.encode('latin-1')`改为`try:`
                                        
                                        `r = s.encode('latin-1')`
                                    
                                     `except Exception as e:`
                                       
                                        `r = s.encode('utf-8')`