【大数据综合试验区1008】揭秘企业数字化转型:大数据试验区政策数据集大公开!
今天给大家分享的是国内顶级期刊中国工业经济2023年发布的最新期刊《政策赋能、数字生态与企业数字化转型——基于国家大数据综合试验区的准自然实验》文章中所使用到的数据集——国家大数据综合试验区政策数据集以及工具变量数据,该文章基于2009-2019年中国上市企业面板数据,以国家大数据综合试验区为准自然实验,从数字生态视角考察国家大数据综合试验区政策对企业数字化转型升级的影响。研究发现大数据试验区对企业的数字化转型起着促进作用,特别是对企业底层数字技术运用的促进作用更加明显,并且从政府数字补贴、数字发展环境以及数字化企业和人力资本集聚的数字知识溢出三个方面探讨了大数据试验区政策对企业数字化转型的传导机制,并进行了一系列异质性分析,最终得出结论,并给出相应的政策建议。该文章在分析的过程中使用到了国家大数据综合试验区政策以及工具变量数据,我们对这两部分数据进行了整理,并进行了适当的拓展,数据获取请关注公众号“明天科技屋”,打开公众号文章获取文末数字关键词并回复,在该数据发布24小时之内可以通过分享获得。
一、论文讲解

该文章是以中国上市企业为研究对象,以国家大数据综合试验区开展准自然实验,采用双重差分模型考察了大数据试验区设立对企业数字化转型发展的影响,并且从不同层次企业数字化技术分析了大数据政策对企业不同层次数字化水平的影响效应,同时采用多种稳健性检验方法对基准结果结论进行检验,结果依然可靠,并且以数字生态视角从政府数字补贴、数字发展环境以及数字知识溢出三个方面进行了传到极致检验,在异质性分析方面,从所有制性质、企业规模、行业数字化程度、行业要素密集程度以及企业初始数字化水平多角度进行异质性分析,同时金融发展水平、数字基础条件以及制度环境三个方面进行调节效应检验,最终得出结论,给出相应的建议。
(一)模型设定
本文使用了双重差分法考察了大数据试验区设立对企业数字化转型发展的影响,具体模型设定如下:
其中,下标i、j、t分别表示企业、城市和年份。被解释变量表示企业i在t年的数字化水平。
为城市j是否属于大数据试验区的虚拟变量,取值为1表示是,取值为0代表否;
为大数据试验区政策实施前后的虚拟变量,2016年之前为0,2016年之后为1。
表示可能影响企业数字化水平的企业层面随时间变化的控制变量,包括净资产收益率、企业收入、企业总资产、企业年龄、董事长和总经理是否兼任、会计师事务所审计意见、资本密集度、第一大股东持股比例、现金流强度、账面市值比和资产负债率。
表示城市层面的控制变量,包括人均GDP、人口规模、高校数量、外商直接投资额和产业结构(第二产业增加值比重和第三产业增加值比重)。
为企业固定效应,
为时间固定效应,
为随机扰动项。
(二)数据来源与处理
国家大数据综合试验区数据来源于中国政府网,企业数据来自国泰安数据库,样本为2009-2019年沪深A股上市企业数据。
(三)实证分析
1.基准回归
2.不同层次数字化水平检验
将企业数字化水平划分为“底层技术运用”水平和“数字技术应用”水平,考察大数据综合试验区政策对不同层次数字化水平影响
3.机制分析
从政府数字补贴、数字发展环境以及数字知识溢出三个方面考察了大数据综合试验区对企业数字化水平的传导机制。
(四)进一步分析
1.异质性分析
从所有制性质、企业规模、行业数字化程度、行业要素密集度以及企业初始化数字水平多角度考察了大数据综合试验区政策对企业数字化水平的影响。
2.调节效应检验
从金融发展水平、数字基础条件以及制度环境三个方面今天了调节效应分析
(五)结论与启示
期刊征文部分没有提到稳健性检验内容,这部分内容在附录里面,主要也是正常的稳健性检验内容,大家感兴趣可以自行查看,接下来给大家分享我们收集整理的数据集。
二、重要数据
改文章是以企业为研究对象,样本区间为2009-2019年,我们收集整理了国家大数据综合试验区名单,并且在样本区间进来了拓展,得到了2008年-2022年国家大数据综合试验区地级市实施数据,同时论文在进行稳健性检验事使用到了工具变量数据,我们也进行了收集整理,方便大家研究。
(一)国家大数据综合试验区地级市面板数据
国家大数据综合试验区在8个地区不同时间实施,包括城市群、省份以及地级市等地区,我们收集整理了不同地区实施的相关信息,并且将数据保存在“原始数据表”中,大家可以直观了解原始数据,充分相信数据的准确性,其中,京津冀地区包括北京、天津和湖北,珠江三角洲参考论文的处理方式,将整个广东省划分为处理组,我们对原始数据进行了转换,最终得到了2008年到2022年的国家大数据综合试验区200个地级市实施的面板数据,政策实施虚拟变量保存在DID列中,数据保存在“面板数据”表中,数据展示如下:

(二)工具变量数据
论文中选用了地质条件作为政策的工具变量,具体到实际数据为2004-2015年各省7级以上地震次数,该变量能够很好地满足工具变量的有效性,指标越大说明该地区的地质稳定性越差,设立大数据试验区的概率也越低,数据来源于中国统计年鉴,我们对该数据进行了收集整理,并保存在“工具变量”表中,具体数据展示如下:

在实际使用过程中,作者使用了地质稳定性指标与上面提到的post指标乘积作为bigdata*post的工具变量,我们将原始数据按照作者的使用方法进行了转换,并将工具变量数据和政策实施面板数据进行了拼接,这样大家使用起来非常方便,数据保存在“面板数据”表中的工具变量列中,数据展示如下:

以上就是本次分享的全部内容,大家可以看到我们对分享的数据是十分认真和用心的,并且站在使用者的角度考虑,所以大家完全可以相信数据的质量,最后,数据在发布时间起24小时内通过关键词指示操作即可免费获取,关注公众号“明天科技屋”并回复数字关键词了解数据获取方式,该数据由明天科技屋一手整理,版权归明天科技屋所有,未经允许,不得用于商业盈利,否则将追随法律责任!!!
文章关键词为:“1008”
相关文章:
【大数据综合试验区1008】揭秘企业数字化转型:大数据试验区政策数据集大公开!
今天给大家分享的是国内顶级期刊中国工业经济2023年发布的最新期刊《政策赋能、数字生态与企业数字化转型——基于国家大数据综合试验区的准自然实验》文章中所使用到的数据集——国家大数据综合试验区政策数据集以及工具变量数据,该文章基于2009-2019年中国上市企业…...
在 WebGPU 与 Vulkan 之间做出正确的选择(Making the Right Choice between WebGPU vs Vulkan)
在 WebGPU 与 Vulkan 之间做出正确的选择(Making the Right Choice between WebGPU vs Vulkan) WebGPU 和 Vulkan 之间的主要区别WebGPU 是什么?它适合谁使用?Vulkan 是什么?它适合谁使用?WebGPU 和 Vulkan…...
亚马逊云服务器的价格真的那么贵吗?一年要花多少钱?
亚马逊Web服务(AWS)作为全球领先的云计算平台,其定价策略常常引起用户的关注。很多人可能会问:"AWS真的那么贵吗?"实际上,这个问题的答案并不是简单的"是"或"否",…...
Python学习篇:Python基础知识(三)
目录 1 Python保留字 2 注释 3 行与缩进 编辑4 多行语句 5 输入和输出 6 变量 7 数据类型 8 类型转换 9 表达式 10 运算符 1 Python保留字 Python保留字(也称为关键字)是Python编程语言中预定义的、具有特殊含义的标识符。这些保留字不能用作…...
C++字体库开发之字体回退三
代码片段 class FontCoverage { public: using SP std::shared_ptr<FontCoverage>; virtual ~FontCoverage() default; virtual void set(int index, FontTypes::CoverageLevel level) 0; virtual FontTypes::Coverag…...
python vtk lod 设置
在Python中使用VTK库设置Level of Detail (LOD)可以通过vtkLODProp3D类来实现。这个类允许你为一个模型指定不同级别的细节表示,从而在渲染时根据模型与摄像机的距离自动切换到更适合的表示。 以下是一个简单的例子,展示如何使用vtkLODProp3D来设置LOD&…...
Rhino 犀牛三维建模工具下载安装,Rhino 适用于机械设计广泛领域
Rhinoceros,这款软件小巧而强大,无论是机械设计、科学工业还是三维动画等多元化领域,它都能展现出其惊人的建模能力。 Rhinoceros所包含的NURBS建模功能,堪称业界翘楚。NURBS,即非均匀有理B样条,是计算机图…...
Unleashing Text-to-Image Diffusion Models for Visual Perception
mmcv的环境不好满足,不建议复现...
[2024]docker-compose实战 (1)前言
前言 本文用来记录使用docker-compose来实战搭建一个多项目的测试环境. 环境中包含nodejs, php, html, redis, MongoDB, mysql. 在本次部署流程中, 尽量保证原镜像的"干净简洁", 尽量不会往镜像中加入各种软件和插件, 所有的配置尽可能的在宿主机映射进去. 项目…...
并发编程面试题3
一、CountDownLatch,Semaphore的高频问题: 1.1 CountDownLatch是啥?有啥用?底层咋实现的? CountDownLatch 本质上是一个计数器,用于协调多个线程之间的同步。主要应用场景是在多线程并行处理业务时,需要等待其他线程处理完再进行后续操作,例如合并结果或响应用户请求…...
Movable antenna 早期研究
原英文论文名字Historical Review of Fluid Antenna and Movable Antenna 最近,无线通信研究界对“流体天线”和“可移动天线”两种新兴天线技术的发展引起了极大的关注,这两种技术因其前所未有的灵活性和可重构性而极大地提高了无线应用中的系统性能。…...
Polkadot 安全机制揭秘:保障多链生态的互操作性与安全性
作者:Filippo Franchini,Web3 Foundation 原文:https://x.com/filippoweb3/status/1806318265536242146 编译:OneBlock Polkadot 是一个创新的多链区块链平台,旨在实现不同区块链之间的互操作性和共享安全性。本文将详…...
python将多个文件夹里面的文件拷贝到一个文件夹中
网上可以搜到很多方式,有的好使,有的不好使,亲测如下脚本可用,并可达到我想要的效果,只将多个文件夹里的文件拷贝到一个文件夹中,不拷贝文件夹本身,如果需要文件夹也拷贝打开注释行即可 import…...
docker私有仓库harbor部署
docker私有仓库harbor部署 概述 Docker 官方镜像源被中国大陆政府封锁,导致无法在中国大陆的计算机上直接使用 Docker 拉取镜像,导致使用者一下子手足无措了,的确一开始会有很大的影响,为了应对这种影响我们可以自己构建私有仓库&…...
如何在Java中实现函数式编程
如何在Java中实现函数式编程 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿! 在Java中,函数式编程是一种编程范式,它将计算视为数学函数…...
二叉树与堆相关的时间复杂度问题
目录 满二叉树与完全二叉树高度h和树中节点个数N的关系 向上调整算法: 介绍: 复杂度推导: 向下调整算法: 介绍: 复杂度推导: 向上调整建堆: 介绍: 复杂度推导:…...
goLang小案例-获取从控制台输入的信息
goLang小案例-获取从控制台输入的信息 1. 案例代码展示 package mainimport ("bufio""fmt""log""os" )var pl fmt.Printlnfunc main() {//控制台输出欢迎提示pl("Hello Go")fmt.Print("what is your name? ")…...
1-5题查询 - 高频 SQL 50 题基础版
目录 1. 相关知识点2. 例题2.1.可回收且低脂的产品2.2.寻找用户推荐人2.3.大的国家2.4. 文章浏览 I2.5. 无效的推文 1. 相关知识点 sql判断,不包含null,判断不出来distinct是通过查询的结果来去除重复记录ASC升序计算字符长度 CHAR_LENGTH() 或 LENGTH(…...
Modbus协议转Profinet协议网关模块连智能仪表与PLC通讯
一、现场需求:PLC作为控制器,仪表设备做为执行设备,执行设备能够实时响应PLC传来的指令,并且向PLC回馈数据,从而达到PLC对仪表设备进行控制和监测,实现对生产过程的精准控制。 二、解决方案:通过…...
新手必学:TikTok视频标签的使用方法
想让你的TikTok视频火起来,就得用对标签。标签能帮你的作品被更多人看到,也更有利于推广,可以为品牌增加曝光度、吸引更多观众、提高转化率和借势热门话题。那么应该如何选择标签并使用标签呢,看完这篇分享你或许会有所启发&#…...
MPNet:旋转机械轻量化故障诊断模型详解python代码复现
目录 一、问题背景与挑战 二、MPNet核心架构 2.1 多分支特征融合模块(MBFM) 2.2 残差注意力金字塔模块(RAPM) 2.2.1 空间金字塔注意力(SPA) 2.2.2 金字塔残差块(PRBlock) 2.3 分类器设计 三、关键技术突破 3.1 多尺度特征融合 3.2 轻量化设计策略 3.3 抗噪声…...
树莓派超全系列教程文档--(61)树莓派摄像头高级使用方法
树莓派摄像头高级使用方法 配置通过调谐文件来调整相机行为 使用多个摄像头安装 libcam 和 rpicam-apps依赖关系开发包 文章来源: http://raspberry.dns8844.cn/documentation 原文网址 配置 大多数用例自动工作,无需更改相机配置。但是,一…...
阿里云ACP云计算备考笔记 (5)——弹性伸缩
目录 第一章 概述 第二章 弹性伸缩简介 1、弹性伸缩 2、垂直伸缩 3、优势 4、应用场景 ① 无规律的业务量波动 ② 有规律的业务量波动 ③ 无明显业务量波动 ④ 混合型业务 ⑤ 消息通知 ⑥ 生命周期挂钩 ⑦ 自定义方式 ⑧ 滚的升级 5、使用限制 第三章 主要定义 …...
Admin.Net中的消息通信SignalR解释
定义集线器接口 IOnlineUserHub public interface IOnlineUserHub {/// 在线用户列表Task OnlineUserList(OnlineUserList context);/// 强制下线Task ForceOffline(object context);/// 发布站内消息Task PublicNotice(SysNotice context);/// 接收消息Task ReceiveMessage(…...
使用分级同态加密防御梯度泄漏
抽象 联邦学习 (FL) 支持跨分布式客户端进行协作模型训练,而无需共享原始数据,这使其成为在互联和自动驾驶汽车 (CAV) 等领域保护隐私的机器学习的一种很有前途的方法。然而,最近的研究表明&…...
工业自动化时代的精准装配革新:迁移科技3D视觉系统如何重塑机器人定位装配
AI3D视觉的工业赋能者 迁移科技成立于2017年,作为行业领先的3D工业相机及视觉系统供应商,累计完成数亿元融资。其核心技术覆盖硬件设计、算法优化及软件集成,通过稳定、易用、高回报的AI3D视觉系统,为汽车、新能源、金属制造等行…...
Typeerror: cannot read properties of undefined (reading ‘XXX‘)
最近需要在离线机器上运行软件,所以得把软件用docker打包起来,大部分功能都没问题,出了一个奇怪的事情。同样的代码,在本机上用vscode可以运行起来,但是打包之后在docker里出现了问题。使用的是dialog组件,…...
JVM 内存结构 详解
内存结构 运行时数据区: Java虚拟机在运行Java程序过程中管理的内存区域。 程序计数器: 线程私有,程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都依赖这个计数器完成。 每个线程都有一个程序计数…...
安全突围:重塑内生安全体系:齐向东在2025年BCS大会的演讲
文章目录 前言第一部分:体系力量是突围之钥第一重困境是体系思想落地不畅。第二重困境是大小体系融合瓶颈。第三重困境是“小体系”运营梗阻。 第二部分:体系矛盾是突围之障一是数据孤岛的障碍。二是投入不足的障碍。三是新旧兼容难的障碍。 第三部分&am…...
深度学习之模型压缩三驾马车:模型剪枝、模型量化、知识蒸馏
一、引言 在深度学习中,我们训练出的神经网络往往非常庞大(比如像 ResNet、YOLOv8、Vision Transformer),虽然精度很高,但“太重”了,运行起来很慢,占用内存大,不适合部署到手机、摄…...
