A股制造业上市公司智能制造水平量化研究:1992-2024年年报词频数据构建与多维解析

智能制造作为制造业数字化转型的核心范式,是指在新一代信息技术(人工智能、大数据、云计算、物联网、5G等)与先进制造技术(自动化、机器人、工业互联网)深度融合的基础上,通过感知、分析、推理、决策与控制机制,实现制造全流程的自感知、自决策、自执行、自适应,从而显著提高生产效率、产品质量系统稳定性、产线柔性以及全要素资源利用率。

本研究采纳温素彬等(2022) 所提出的文本分析框架,基于1992至2024年间全部A股制造业上市公司的年度报告,利用构建的智能制造专业术语词典,对年报文本进行术语特征提取,构建企业级智能制造发展水平量化指标,并进行系统性发布。


二、数据基本信息

  • 数据名称:A股上市公司—制造业智能制造数据集
  • 时间范围:1992‑2024年(涵盖中国A股市场制造业企业发展的主要阶段)
  • 样本范围:所有A股制造业行业分类下的上市公司
  • 数据结构:面板数据(Excel格式,便于多期追踪分析)
  • 数据来源:ACADCN 数研慧通研究平台

三、指标定义与结构

本数据集共提供以下关键字段,构成智能制造实施强度的量化维度:

字段名称说明
公司名称上市公司法定全称
股票代码上交所/深交所分配的六位证券代码
总文本词数年报文本经分词与清洗后的有效词条总数
匹配词频次年报中属于智能制造术语词典的词条出现次数(绝对强度)
匹配词比重匹配词频次占总文本词数的比例,反映术语密度(相对强度)
年份财务报表对应的报告年份

四、数据处理流程与术语体系

4.1 数据处理步骤

  1. 行业筛选:依据《上市公司行业分类指引》筛选制造业企业;
  2. 文本清洗与分词:采用专业中文分词系统,结合哈工大停用词表对年报全文进行噪声过滤与有效词抽取;
  3. 术语识别与统计:基于预设的智能制造特征词库,识别并统计各企业年报中相关术语的词频,计算其出现频次与词频占比,构建企业—年份二维结构化数据。

4.2 核心术语类别示例

本数据采用的术语体系涵盖智能制造关键技术及业务场景,主要包括以下类别:

  • 人工智能相关术语:如“深度学习”“一体化制造”“无人化产线”“人机协同”;
  • 互联网技术术语:如“工业互联网平台”“移动互联”“电子商务”“移动支付”;
  • 大数据技术术语:如“大数据分析”“数据挖掘”“可视化监控”“虚拟现实”;
  • 价值链制造术语:如“智能计划调度”“生产执行系统MES”“设备智能运维”“智慧仓储物流”。

五、学术依据

温素彬, 张金泉, 焦然.智能制造、市场化程度与企业运营效率——基于A股制造业上市公司年报的文本分析[J].会计研究,2022(11):102‑117

资源下载
下载价格10
0
没有账号?注册  忘记密码?

社交账号快速登录