# selenium实战-微信公众号文本挖掘

**Repository Path**: caimingli/web-mining-wechat-public

## Basic Information

- **Project Name**: selenium实战-微信公众号文本挖掘
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2021-05-31
- **Last Updated**: 2021-05-31

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

## selenium实战-微信公众号文本挖掘

### 要求：
1.使用selenium进入微信公众平台  
2.在微信公众平台寻找指定的公众号  
3.抓取该公众号指定时间区间的文章（不低于50页数据/不低于1年的数据）  
4.导出文章信息（应包含标题，时间，文章url链接以及文章文本内容）  
5.提交gitee/github要求如下

### 数据抓取意义：
- 爬取36氪的文章数据，了解行业发展趋势变化，拓展视野。


### 作者
作者：蔡明丽

### 遇到问题及解决方案

1.  在爬取过程中点击新建图文消息时输出窗口只有一个,通过[该网站](https://www.selenium.dev/documentation/zh-cn/webdriver/browser_manipulation/)解决
```
print (driver.window_handles)
```