# PythonDataAnalysis **Repository Path**: bywangziye/PythonDataAnalysis ## Basic Information - **Project Name**: PythonDataAnalysis - **Description**: The data and code that used in my book. - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-04-21 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ### 《Python数据分析入门————从数据获取到可视化》 #### 概览 这里是本书中使用的所有源代码,数据等文件。关于本书的一些最新的进展的也会第一时间在这里公布。希望本书能对大家有所帮助。 #### 问题提交 如果大家有问题和建议,可以直接在本项目提交issue(推荐),也可以发邮件给我(datahonor@gmail.com) 我会定期查看并尽快回复。 (也有读者到[出版社](http://www.broadview.com.cn/book/5010) 提交勘误的,也是可以的,不过只建议在那里提交typo相关的, 涉及到代码还是建议在Github提issue,方便一些)。 #### 勘误 已更正: | 页码 | 错误 | 改正 | |--------|--------|--------| | 201 | 上方第一个阴影框(训练集数据)“种类”列最后两行将“bumpy”全改为“orange” | 第二次印刷时更正| | 202 | 第三行,“是橙子还是水果”改为“是橙子还是苹果” |第二次印刷时更正| | 99 | 代码框最后两行交换位置(因为多线程会把`urls`清空)| 第六次印刷时更正 | | 115 |正文第三行“运行输出如下。”下面的输出有误,下面的数据需要我们自己手动创建 | 第六次印刷时更正 | | 245 | 代码框,最上面应加上`import random as rnd`| 第六次印刷时更正 | | 247,248 | 两个LP问题的目标函数漏掉,改正参考[博客](http://datahonor.com/2017/03/22/%E5%88%A9%E7%94%A8Python%E8%A7%A3%E7%BA%BF%E6%80%A7%E8%A7%84%E5%88%92%E9%97%AE%E9%A2%98-LP/)。 | 第六次印刷时更正 | | 71-73 | 豆瓣模拟登录报错 | 第六次印刷时更正 | 待更正: | 页码 | 错误 | 改正 | |--------|--------|--------| #### 意见征集 个人认为,一本书在出版后绝对不是结束的标志,而是新一轮的开始。本书写作的初衷在于,当时国内很多的书并没有将数据爬取,数据处理,分析以及可视化放到一起来写,我认为这是一件值得去尝试的事情,所以才有了这本书。 在本书出版一年多来,根据各方的反馈也在不断进行着完善。于此同时也意识到书中存在的问题,比较核心的就在于知识的深度与广度之间的矛盾,本书是着眼于广度的,所以深度就有所欠缺。后面会考虑对内容进行删减,在顾及广度的同时突出重点(统计学方法,机器学习方法等算法)。 此外,如果有机会写第二版,会将文章核心内容以Jupyter notebook的形式呈现,以更好地说明问题。 如上所言,是有一些反馈,但是不太多。希望各位作为读者,在阅读完本书后能够写一些建议给我,我也能更好地明确下面修改的方向。