# node_lmlcSpider_production **Repository Path**: mirrors_singod/node_lmlcSpider_production ## Basic Information - **Project Name**: node_lmlcSpider_production - **Description**: :beetle: 立马理财销售统计(爬虫+页面展示) - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-09-25 - **Last Updated**: 2026-03-22 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 基于 nodejs 的立马理财爬虫项目 **要是觉得这个项目还不错,别忘记star哦** 技术分析,详见我的[博客](https://www.wty90.com/2018/01/17/lmlc-spider/) 线上地址:[点击这里](https://lmlc.wty90.com) ## 一、工程目录分析 data是爬虫爬取数据后存储的文件夹 dist是前端js、css打包的目录 public存放一些公共文件 server是后台代码目录 * user.js是首页用户购买ajax接口爬虫代码 * product.js是理财页产品ajax接口爬虫代码 * record.js是详情页投资记录同步页面爬虫代码 * getCookie.js是测试爬虫带cookie模拟登录代码 * dataHandle.js是处理数据得到销售额的代码 * lmlcSpider.js是将上述爬虫代码整合在一起的最终线上用的爬虫代码 spider存放爬虫代码的目录 src前端工程目录 views存放html模板 ## 二、项目运行 1. 下载chrome插件[LiveReload](https://chrome.google.com/webstore/detail/livereload/jnihajbhpnppcggbcgedagnkighmdlei) 2. 修改views文件夹里的index.html和detail.html文件。 * 如果是本地调试,index.js都要改成`http://localhost:8080/dist/index.js` * 如果是其他设备访问,则改成`your_ip_addr:5000/dist/index.js` * index.css一样。 3. 运行方式 ``` npm run dev npm run server // 启动后台 npm run spider your_username your_password // 启动爬虫 ``` 4. 测试学习各页面的爬虫代码 ``` npm run user // 爬取立马理财首页的用户购买信息ajax接口 npm run product // 爬取立马理财理财页所有产品的ajax接口 npm run record // 爬取立马理财产品详情页的投资记录同步页面数据 ``` ## 注意 开启爬虫需要带网易[立马理财](https://www.lmlc.com/)登录的账号和密码参数。当然如果有网易邮箱,可以直接输入网易邮箱和密码即可。