# PythonDataAnalysis

**Repository Path**: bywangziye/PythonDataAnalysis

## Basic Information

- **Project Name**: PythonDataAnalysis
- **Description**: The data and code that used in my book.
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2020-04-21
- **Last Updated**: 2020-12-19

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

### 《Python数据分析入门————从数据获取到可视化》

#### 概览

这里是本书中使用的所有源代码，数据等文件。关于本书的一些最新的进展的也会第一时间在这里公布。希望本书能对大家有所帮助。


#### 问题提交

如果大家有问题和建议，可以直接在本项目提交issue（推荐），也可以发邮件给我(datahonor@gmail.com)
我会定期查看并尽快回复。
(也有读者到[出版社](http://www.broadview.com.cn/book/5010)
提交勘误的，也是可以的，不过只建议在那里提交typo相关的，
涉及到代码还是建议在Github提issue，方便一些)。


#### 勘误

已更正：

| 页码 | 错误 | 改正 |
|--------|--------|--------|
|  201     |  上方第一个阴影框（训练集数据）“种类”列最后两行将“bumpy”全改为“orange”  | 第二次印刷时更正|
|  202      |    第三行，“是橙子还是水果”改为“是橙子还是苹果”    |第二次印刷时更正|
|  99     | 代码框最后两行交换位置（因为多线程会把`urls`清空）| 第六次印刷时更正 |
|  115     |正文第三行“运行输出如下。”下面的输出有误，下面的数据需要我们自己手动创建 | 第六次印刷时更正 |
|  245     | 代码框，最上面应加上`import random as rnd`| 第六次印刷时更正 |
| 247,248 | 两个LP问题的目标函数漏掉，改正参考[博客](http://datahonor.com/2017/03/22/%E5%88%A9%E7%94%A8Python%E8%A7%A3%E7%BA%BF%E6%80%A7%E8%A7%84%E5%88%92%E9%97%AE%E9%A2%98-LP/)。 | 第六次印刷时更正 |
| 71-73 | 豆瓣模拟登录报错 | 第六次印刷时更正 |


待更正：

| 页码 | 错误 | 改正 |
|--------|--------|--------|


#### 意见征集

个人认为，一本书在出版后绝对不是结束的标志，而是新一轮的开始。本书写作的初衷在于，当时国内很多的书并没有将数据爬取，数据处理，分析以及可视化放到一起来写，我认为这是一件值得去尝试的事情，所以才有了这本书。

在本书出版一年多来，根据各方的反馈也在不断进行着完善。于此同时也意识到书中存在的问题，比较核心的就在于知识的深度与广度之间的矛盾，本书是着眼于广度的，所以深度就有所欠缺。后面会考虑对内容进行删减，在顾及广度的同时突出重点（统计学方法，机器学习方法等算法）。

此外，如果有机会写第二版，会将文章核心内容以Jupyter notebook的形式呈现，以更好地说明问题。

如上所言，是有一些反馈，但是不太多。希望各位作为读者,在阅读完本书后能够写一些建议给我，我也能更好地明确下面修改的方向。