# Data-Viual **Repository Path**: mgod_wu/Data-Viual ## Basic Information - **Project Name**: Data-Viual - **Description**: 简易数据可视化小案例 - **Primary Language**: HTML - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2022-07-06 - **Last Updated**: 2022-07-07 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## 数据分析参考小案例 > 自学数据分析可视化,开源小案例 目前已完成: - [数据分析参考小案例](#数据分析参考小案例) - [斗鱼直播人气分析](#斗鱼直播人气分析) - [成品展示](#成品展示) ------ ### 斗鱼直播人气分析 所用到的第三方库: - `jieba`:优秀的中文语句断句开源库 - `requests`: 史上最好用的爬虫包 - `lxml`:网页解析利器 - `jsonpath`: 用于解析json数据 - `wordcloud`:优秀的词云开源库 - `pyecharts`:百度史上最良心的数据可视化开源库 - `PIL`:python最常用的图像处理库 - `pytesseract`:好用的OCR开源库 资源:`./douyu_simple` - `proxies.py`:获取代理ip,防止使用本地ip爬虫过度而被官方封禁(但免费的代理ip是真滴不好用啊!!!) - `analys.py`: 数据分析及可视化,可生成[前25位人气主播分析网页](#前25位),[直播类型平均人气值排名网页](#平均),[主播人气值与数量关系网页](#人气值&数量),生成的网页数据均在`./result`目录下 - `douyu_spider,py`(main): 获取斗鱼所有的直播间数据(包括直播间名,主播名,直播类型,人气值),数据将会以json格式存储到`./result/datas.json`,模块还会根据爬取到的[直播间名](#词云1),[直播内容](#词云2)和直播内容出现的文字频率生成对应的词云图片,当前流行的直播内容一览无遗 #### 成品展示 - [](#) ------ - [](#-1) ------ - [](#-2) ------ - [](#-3) ------ - [](#-4) ------- - [](#-4)