# spider **Repository Path**: _swg/spider ## Basic Information - **Project Name**: spider - **Description**: a simple spider program based on java - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2017-12-22 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README 一个简单的基于java的网页爬虫小程序 == ### 基础框架用springBoot,快速创建web应用。使用HttpClient对网页进行抓取,Jsoup对网页进行解析。最后用IO流输出一个txt保存信息。 ### 参考: http://www.jb51.net/article/129425.htm http://www.jianshu.com/p/5eedb921c4d9