3.2版更新说明:
1.上版本基础上,进一步更新指标至2020年
2.减小剔除阈值,保留更多区县
3.0版更新说明:
1.数据更新至2020年
2.剔除缺失较多的区县,转为平衡面板
3.填补升级。内含原始版本、线性插值、ARIMA填补三个版本数据

一、数据介绍
数据名称:中国县域数据库
数据来源:《中国区域经济统计年鉴》、《中国县域统计年鉴》
数据范围:2000-2020年,包括2703个区县
样本数量:平衡面板56763条(2703*21=56763)
数据整理:各指标存在不同程度的缺失
更新时间:2022年12月,当前最新3.2版
二、整理方法
第一,识别年鉴。利用NLP算法识别《中国区域经济统计年鉴》、《中国县域统计年鉴》,并转为面板数据
第二,完善数据。对比主流数据库、地方统计局,进一步完善县域数据
第三,统一地区。匹配民政部编码,统一使用2019年编码和地区名称
第四,统一单位。对不同单位的情况,进行单位换算
第五,人工验证。得到指标的面板数据,并人工抽样验证
第六,平衡面板。将非平衡面板转为平衡面板数据
第七,线性插值。利用线性趋势对中间缺失进行填充,得到线性插值版
第八,ARIMA填补。利用时间趋势,对剩余缺失进行预测,得到ARIMA填补版
最终,保留原始版本、线性插值版、ARIMA填补版
三、数据指标
共计83个指标,部分如下:
| 年份 | 宽带接入用户数 | 农林牧渔业总产值 |
| 行政区划代码 | 地区生产总值 | 规模以上工业企业数 |
| 地区名称 | 第一产业增加值 | 规模以上工业总产值 |
| 经度 | 第二产业增加值 | 城镇固定资产投资完成额 |
| 纬度 | 工业增加值 | 全社会固定资产投资 |
| 所属城市 | 第三产业增加值 | 社会消费品零售总额 |
| 所属省份 | 农业增加值 | 房地产开发投资 |
| 长江经济带 | 牧业增加值 | 普通小学学校数 |
| 行政区域土地面积 | 人均地区生产总值 | 普通中学学校数 |
| 乡及镇个数 | 城镇单位在岗职工平均工资 | 普通小学专任教师数 |
| 乡个数 | 城镇居民人均可支配收入 | 普通中学专任教师数 |
| 镇个数 | 农村居民人均可支配收入 | 普通小学在校生数 |
| 街道办事处个数 | 地方财政一般预算收入 | 普通中学在校学生数 |
| 村民委员会个数 | 各项税收 | 中等职业教育学校在校学生数 |
| 年末总户数 | 地方财政一般预算支出 | 医院、卫生院床位数 |
| 乡村户数 | 城乡居民储蓄存款余额 | 医院和卫生院卫生人员数_卫生技术人员 |
| 年末总人口 | 年末金融机构各项贷款余额 | 医院和卫生院卫生人员数_执业医师 |
| 乡村人口 | 出口额 | 各种社会福利收养性单位数 |
| 户籍人口数 | 实际利用外资金额 | 各种社会福利收养性单位床位数 |
| 年末单位从业人员 | 农作物总播种面积 | 全社会用电量 |
| 城镇单位在岗职工人数 | 常用耕地面积 | 城乡居民生活用电量 |
| 乡村从业人员数 | 机收面积 | 废气中氮氧化物排放量 |
| 农林牧渔业从业人员数 | 设施农业占地面积 | 废气中烟尘排放量 |
| 年末第二产业单位从业人员 | 农用机械总动力 | 工业废气中二氧化硫排放量 |
| 年末第三产业单位从业人员 | 粮食总产量 | 艺术表演场馆数_剧场、影剧院 |
| 农业机械总动力 | 棉花产量 | 公共图书馆总藏量 |
| 固定电话用户 | 油料产量 | 体育场馆机构数 |
| 移动电话用户数 | 肉类总产量 |

