测算方法
本研究参照解洪涛与王嘉庆(2024)发表于《财政研究》的实证框架,立足地方政府数字治理实践,采用计算文本分析方法对地级市政府工作报告进行系统性量化。具体而言,以2003至2025年间各地级市政府工作报告为文本源,构建包含121个核心关键词的词典体系(涵盖“数字技术”与“数字应用”两大维度),统计关键词词频占全文总词数的比例,生成政府数字关注度连续指标(方法学基础参见刘毛桃等,2023)。其中,“数字技术”维度涵盖大数据、云计算、决策支持系统、智能数据分析等技术类术语;“数字应用”维度包含数字政府、政务平台、智能计算中心等治理场景类词汇。为支持后续分组实证检验,依据该指标在全样本中的中位数进行二分处理,划分高关注组与低关注组。
数据范围与质量保障
本数据集覆盖全国290余个地级行政单位,累计整合6000余份政府工作报告文本样本。数据内容包含原始词频统计结果、标准化清洗与计算代码(Python/R)、经校验的最终指标值及分组标识。所有处理流程均遵循可复现性原则,数据经多重逻辑校验与交叉验证,确保指标构建的严谨性与学术应用的可靠性,可供相关领域研究者复现与拓展分析。
参考文献
解洪涛, 王嘉庆. 数字化赋能全过程人民民主:人大预算联网监督改革实践与成效分析[J]. 财政研究, 2024(1): 45–60. DOI:10.19477/j.cnki.11-1077/f.2024.01.006.
(注:关键词词典构建方法亦参考刘毛桃等,2023相关研究)
资源下载
下载价格18 元