智能制造作为制造业数字化转型的核心范式,是指在新一代信息技术(人工智能、大数据、云计算、物联网、5G等)与先进制造技术(自动化、机器人、工业互联网)深度融合的基础上,通过感知、分析、推理、决策与控制机制,实现制造全流程的自感知、自决策、自执行、自适应,从而显著提高生产效率、产品质量系统稳定性、产线柔性以及全要素资源利用率。
本研究采纳温素彬等(2022) 所提出的文本分析框架,基于1992至2024年间全部A股制造业上市公司的年度报告,利用构建的智能制造专业术语词典,对年报文本进行术语特征提取,构建企业级智能制造发展水平量化指标,并进行系统性发布。
二、数据基本信息
- 数据名称:A股上市公司—制造业智能制造数据集
- 时间范围:1992‑2024年(涵盖中国A股市场制造业企业发展的主要阶段)
- 样本范围:所有A股制造业行业分类下的上市公司
- 数据结构:面板数据(Excel格式,便于多期追踪分析)
- 数据来源:ACADCN 数研慧通研究平台
三、指标定义与结构
本数据集共提供以下关键字段,构成智能制造实施强度的量化维度:
| 字段名称 | 说明 |
|---|---|
| 公司名称 | 上市公司法定全称 |
| 股票代码 | 上交所/深交所分配的六位证券代码 |
| 总文本词数 | 年报文本经分词与清洗后的有效词条总数 |
| 匹配词频次 | 年报中属于智能制造术语词典的词条出现次数(绝对强度) |
| 匹配词比重 | 匹配词频次占总文本词数的比例,反映术语密度(相对强度) |
| 年份 | 财务报表对应的报告年份 |
四、数据处理流程与术语体系
4.1 数据处理步骤
- 行业筛选:依据《上市公司行业分类指引》筛选制造业企业;
- 文本清洗与分词:采用专业中文分词系统,结合哈工大停用词表对年报全文进行噪声过滤与有效词抽取;
- 术语识别与统计:基于预设的智能制造特征词库,识别并统计各企业年报中相关术语的词频,计算其出现频次与词频占比,构建企业—年份二维结构化数据。
4.2 核心术语类别示例
本数据采用的术语体系涵盖智能制造关键技术及业务场景,主要包括以下类别:
- 人工智能相关术语:如“深度学习”“一体化制造”“无人化产线”“人机协同”;
- 互联网技术术语:如“工业互联网平台”“移动互联”“电子商务”“移动支付”;
- 大数据技术术语:如“大数据分析”“数据挖掘”“可视化监控”“虚拟现实”;
- 价值链制造术语:如“智能计划调度”“生产执行系统MES”“设备智能运维”“智慧仓储物流”。
五、学术依据
温素彬, 张金泉, 焦然.智能制造、市场化程度与企业运营效率——基于A股制造业上市公司年报的文本分析[J].会计研究,2022(11):102‑117
资源下载
下载价格10 元