# baikeCategory **Repository Path**: zgr9527/baikecategory ## Basic Information - **Project Name**: baikeCategory - **Description**: 抓取互动百科分类目录下各类别下一分级所有词条的代码文件 其中微百科类额外抓取 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2013-07-12 - **Last Updated**: 2021-06-21 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README #baikeCategory 目前呢 是会自动生成类别文件夹 然后词条xml文件会下载到对应所在类别中 保存文件名为 N+词条名+T+最近更新时间 主程序中 各线程run()方法中调用down()方法 down()中调用 download和download2 其中download2是为了适应特殊情况 因为如果一个词条刚开更新完毕 其对应的url地址源码格式不同 并且download2还可以排除无法下载的情况 详细的内容在wiki中有说明 现在加入了新的方法 将内容通过sqlite3存在sqlite建立的数据库中 表的内容会在 wiki中有图说明 只需要将down 方法换为数据库相关版本的就好了