当前位置: 首页 > article >正文

最全上市公司企业数字创新数据集(2001-2023年)

1.资料名称:2023-2001年上市公司企业数字创新数据

2.测算方式:参考《系统工程理论与实践》郑攀攀(2024)老师的做法,本文基于上市公司年报文本, 结合文本分析和机器学习方法, 测度了企业数字创新(DI) . 具体的测度步骤如下: ①确定企业年报中关于数字创新表述的种子词集. 本文紧扣相关文献对数字创新的定义[2-4,6], 从《中小企业数字化赋能专项行动方案》、《2020 年数字化转型趋势报告》等官方文件中选取种子词集[45], 包括人工智能、数据挖掘电子商务等 45 个词组. ②基于机器学习方法扩充种子词集. 鉴于同一概念或事物的表达, 往往可以采用多个语义相似的词汇, 本文采用机器学习算法扩充关键词词集. 具体地, 使用海量财经文本训练 Word2vec 神经网络相似词算法, 取每个种子词组的前 30 个相似关键词, 去除重复词汇和部分低频词汇, 由三名专业人员根据 Fichman 等[3]提出的定义进行词汇分类筛选以及核验工作, 最终得到 99 个关键词词集, 如表 2 所示. ③测度企业数字创新. 本文对企业年报中关于数字创新的关键词进行抓取, 将数字产品创新 DI_prod、数字流程创新 DI_proc、数字商业模式创新 DI_buss 三个维度词频之和占年报全文总词数比重作为企业的整体数字创新 DI. 为了避免数据量纲过小, 对上述指标作出乘以 100 的处理。

3.资料范围:6.1万个样本,5598家企业,包括原始数据词频和最终计算结果,大家可以验证一下确保准确性!

4.参考文献:郑攀攀,庄子银.知识产权司法保护专门化与企业数字创新[J].系统工程理论与实践,2024,44(05):1501-1521.

5.样例数据及部分代码

cf450d9b3848616229448ed7dd434e6.png

 

de993e98c72d1a86a31c6d7d129ac1e.png

db5dd4f28ed471d94394ef13bdb777c.png

6.包含内容:

7.全部内容下载链接:https://download.csdn.net/download/T0620514/89890020


http://www.kler.cn/a/348799.html

相关文章:

  • 文件IO练习1
  • 数字后端零基础入门系列 | Innovus零基础LAB学习Day1
  • ansible 流程控制
  • 自然语言处理 (NLP) 的 5 个步骤
  • less和sass基本使用
  • 交易所开发:构建安全、高效、可靠的数字资产交易平台
  • Modbus学习笔记
  • 电脑电源要如何检测?
  • 国内外顶级的产品经理,他们都具备哪些能力?
  • neo4j部署保姆级教程
  • 雷池社区版配置遇到问题不要慌,查看本文解决
  • 天通智能平板|智能移动终端|三防|单兵|平板|智能三防手持终端
  • 在vue3中实现祖组件给后代组件传参,可以跨域几层。
  • 游戏服务端架构演进
  • 文件完整性监控:如何提高企业的数据安全性
  • centos7 Oracle 11g rac 静默安装(NFS配置共享存储)
  • Django一分钟:DRF生成OpenAPI接口文档
  • 金融衍生品中的风险对冲策略分析
  • 气动紧急切断阀安装说明
  • linux下查询网卡光纤模块sn序列号