企业数字化转型MD&A-175个词频、文本统计(2000-2021年)

在前文,对上市公司年报的“数字化转型”相关词频(数据详见前文)进行了统计,受到了广大社区用户的欢迎。在本期附赠数据中,进一步对年报中“管理层讨论与分析”文本,进行词频统计。

MD&A文本筛选规制:2014年及以前主要在“董事会报告”中筛选,2015年主要在“管理层讨论与分析”中筛选,2016年及往后主要从“经营情况讨论与分析”中筛选。

参考管理世界中吴非(2021)的做法,对人工智能技术、大数据技术、云计算技术、区块链技术、数字技术运用五个维度76个数字化相关词频进行统计。

参考财贸经济中赵宸宇(2021)的做法,对数字技术应用、互联网商业模式、智能制造、现代信息系统四个维度99个数字化相关词频进行统计。

统计MD&A全文、以及中英文部分的文本长度。

一、数据介绍

数据名称:企业数字化转型-MD&A报告词频、文本统计

数据范围:4910家上市公司

数据年份:2000-2021年

样本数量:52107条,193变量

年报来源:巨潮资讯网

数据说明:内含数字化转型175个词频、各维度水平、文本统计面板

更新时间:2022年10月

二、整理说明

从巨潮资讯网下载2000-2021年上市公司年报

将原始报告文本整理为面板数据,筛选MD&A文本

2014年及以前主要在“董事会报告”中筛选

2015年主要在“管理层讨论与分析”中筛选

2016年及往后主要从“经营情况讨论与分析”中筛选

统计MD&A全文、中英文部分的文本长度

构建企业数字化术语词典,将词汇扩充到python的jieba库

去除停顿词,统计上述词汇在MD&A文本中出现的次数

计算数字化转型程度、各维度水平

三、指标说明

吴非(2021)的五个维度

人工智能技术
人工智能 商业智能 图像理解
投资决策辅助系统 智能数据分析 智能机器人
机器学习 深度学习 语义搜索
生物识别技术 人脸识别 语音识别
身份验证 自动驾驶 自然语言处理
大数据技术
大数据 数据挖掘 文本挖掘
数据可视化 异构数据 征信
增强现实 混合现实 虚拟现实
云计算技术
云计算 流计算 图计算
内存计算 多方安全计算 类脑计算
绿色计算 认知计算 融合架构
亿级并发 EB级存储 物联网
信息物理系统
区块链技术
区块链 数字货币
差分隐私技术 智能金融合约
数字技术运用
移动互联网 工业互联网 移动互联
互联网医疗 电子商务 移动支付
第三方支付 NFC支付 智能能源
B2B B2C C2B
C2C O2O 网联
智能穿戴 智慧农业 智能交通
智能医疗 智能客服 智能家居
智能投顾 智能文旅 智能环保
智能电网 智能营销 数字营销
无人零售 互联网金融 数字金融
Fintech 金融科技 量化金融
开放银行

赵宸宇(2021)的四个维度

数字技术应用
数据管理 数据挖掘 数据网络
数据平台 数据中心 数据科学
数字控制 数字技术 数字通信
数字网络 数字智能 数字终端
数字营销 数字化 大数据
云计算 云IT 云生态
云服务 云平台 区块链
物联网 机器学习
互联网商业模式
移动互联网 工业互联网 产业互联网
互联网解决方案 互联网技术 互联网思维
互联网行动 互联网业务 互联网移动
互联网应用 互联网营销 互联网战略
互联网平台 互联网模式 互联网商业模式
互联网生态 电商 电子商务
Internet 互联网+ 线上线下
线上到线下 线上和线下 O2O
B2B C2C B2C
C2B
智能制造
人工智能 高端智能 工业智能
移动智能 智能控制 智能终端
智能移动 智能管理 智能工厂
智能物流 智能制造 智能仓储
智能技术 智能设备 智能生产
智能网联 智能系统 智能化
自动控制 自动监测 自动监控
自动检测 自动生产 数控
一体化 集成化 集成解决方案
集成控制 集成系统 工业云
未来工厂 智能故障诊断 生命周期管理
生产制造执行系统 虚拟化 虚拟制造
现代信息系统
信息共享 信息管理 信息集成
信息软件 信息系统 信息网络
信息终端 信息中心 信息化
网络化 工业信息 工业通信

四、数据概览

均值趋势图

数据概览

五、获取数据

本文统计仅包括MD&A文本,若需年报全文的统计:详见前文

0
没有账号?注册  忘记密码?

社交账号快速登录