# selenium实战-微信公众号文本挖掘 **Repository Path**: caimingli/web-mining-wechat-public ## Basic Information - **Project Name**: selenium实战-微信公众号文本挖掘 - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-05-31 - **Last Updated**: 2021-05-31 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## selenium实战-微信公众号文本挖掘 ### 要求: 1.使用selenium进入微信公众平台 2.在微信公众平台寻找指定的公众号 3.抓取该公众号指定时间区间的文章(不低于50页数据/不低于1年的数据) 4.导出文章信息(应包含标题,时间,文章url链接以及文章文本内容) 5.提交gitee/github要求如下 ### 数据抓取意义: - 爬取36氪的文章数据,了解行业发展趋势变化,拓展视野。 ### 作者 作者:蔡明丽 ### 遇到问题及解决方案 1. 在爬取过程中点击新建图文消息时输出窗口只有一个,通过[该网站](https://www.selenium.dev/documentation/zh-cn/webdriver/browser_manipulation/)解决 ``` print (driver.window_handles) ```