# DvisionSpiderCN **Repository Path**: lscherry/dvisionspidercn ## Basic Information - **Project Name**: DvisionSpiderCN - **Description**: Python实现获取最新中国行政区划(县以上) - **Primary Language**: Python - **License**: GPL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2017-04-14 - **Last Updated**: 2021-01-20 ## Categories & Tags **Categories**: utils **Tags**: None ## README #中国行政区划(县以上行政单位) ## 项目简介 - 本项目是一个Python的爬虫,用于从国家统计局获取最新的行政区划信息,并生成JSON格式文件,最新的数据是2016年7月31日的 - 项目过滤掉了 自治区直辖县级行政区划, 县, 省直辖县级行政区划, 市辖区 这几个组织级别,将其下属行政单位与地区级区划并列挂在省级区划下,可参考海南省的情形 - 直辖市下直接是区县,没有市辖区/县等称谓,详见重庆市 - [最新县及县以上行政区划代码(截止2016年7月31日)](http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201703/t20170310_1471429.html) ## 依赖 - Python 2.7 - bs4 - urllib2 - lxml ## 数据来源 - [中华人民共和国国家统计局](http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/) ## 使用说明 ``` #默认文件名称city.min.js python RenderDvisionCN.py -f <是否完整格式> -n <文件名称> ``` ## 数据格式说明 ### 完整格式 ``` { "provinces":{ [ "name":"河北省", "code","130000", "pcode":"", "cities":{ [ "name":"张家口市", "code","130700", "pcode":"130000", "counties":{ [ {"name":"下花园区","code":"130706","pcode":"130700"} ] } ] } ] } } ``` ### 简单格式 ``` { "provinces":{ [ "name":"河北省", "cities":{ [ "name":"张家口市", "counties":{ [ {"name":"下花园区"} ] } ] } ] } } ```