# pdplus
**Repository Path**: osc8086/pdplus
## Basic Information
- **Project Name**: pdplus
- **Description**: an new data analysis library add many feature,add duckdb sql functions.so calls: pandas plus
- **Primary Language**: Python
- **License**: 0BSD
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2024-04-03
- **Last Updated**: 2024-04-03
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
pdplus
-----------------
#名字来源
pandas的超级加强版,英文简称pdplus。
##用途
pdplus 对数据的处理是为数据的分析服务的,它所提供的各种数据处理方法、工具是基于数理统计学出发,包含了日常应用中的众多数据分析方法。我们学习它不光掌控它的相应操作技术,还要从它的处理思路中学习数据分析的理论和方法。
特别地,想成为或者转行数据分析师、数据产品经理、数据开发等和数据相关工作者的同学,学习 pdplus 更能让你深入数据理论和实践,更好地理解和应用数据。
pdplus 可以轻松应对白领们日常工作中的各种表格数据处理,还应用在金融、统计、数理研究、物理计算、社会科学、工程等领域里。
pdplus 可以实现复杂的处理逻辑,这些往往是 Excel 等工具无法处理的,还可以自动化、批量化,对于相同的大量的数据处理我们不需要重复去工作。
pdplus 可以做到非常震撼的SQL语言处理,它对接众多的SQL语言特性,可以实现简单高效的操作。
以上这些,在往后的教程中,你会有所体会。
##适用的数据
pdplus 适合处理一个规正的二维数据(一维也可以,应用较少),即有 N 行 N 列,类似于 SQL 执行后产出的,或者 无合并单元格Excel 表格 这样的数据。它可以把多个文件的数据合并在一起,如果结构不一样,也可以经过处理进行合并。
这里说的二维数据是指,像一个矩形的平面在横向和纵向被分隔成多个格子,每个格子里存放一个数据。
##基本功能
常用的基本功能有:
从 Excel、CSV、网页、SQL、剪贴板等读取数据
合并多个文件或者 sheet 数据,拆分数据为独立文件
数据清洗,如去重、缺失值、填充默认值、格式补全、极端值处理等
建立高效的索引
支持大体量数据
按一定业务逻辑插入计算后的列、删除列
灵活方便的数据查询、筛选
分组聚合数据,可独立指定分组后的各字段计算方式
数据的转置,如行转列列转行变更处理
连接数据库,直接 SQL 查询数据并进行处理
对时序数据进行分组采样,如按月、按季、按工作小时,也可以自定义周期,如工作日
窗口计划,移动窗口统计、日期移动等
融合在表格的样式风格,提高数据识别效率
等等。
接下来,我们先安装 pdplus 然后开启 pdplus 之旅吧!