《数据资产对企业创新投入的影响研究.docx》由会员分享,可在线阅读,更多相关《数据资产对企业创新投入的影响研究.docx(17页珍藏版)》请在三一办公上搜索。
1、第45卷第12期 2023年12月Vol. 45 No. 12Dec. 2023外国经济与管理ForeignEconomics&ManagementDOI:10.16538ki.fem.20230201.401数据资产对企业创新投入的影响研究李健;董小凡;张金林:陶云清(1.山东财经大学金融学院山东济南2514;2.中南财经政法大学金融学院.湖北武汉4373;3.北京大学国家发展研究院数字金融研究中心,北京100091)摘要:数据资产已成为企业和国家的重要战略资源和核心生产力。本文运用20112020年中国A股上市公司数据,通过量化企业数据资产,考察了短g资产对创新投入的影响及其机制。研究发现
2、,翔S资产能够显著提升企业的创新投入。在使用工具变量、双重差分等-系列稳健性检验后,研究结论仍然成立。异质性分析表明,数据资产对企业创新投入的是升作用在中小民营企业、融资依赖度较高的企业、技术密集型企业,以及金融科技水平低和创新不足的地区的企业更显著。此外,黝E资产不仅可以通过缓解企业融资约束提高企业创新意愿,而且能够加强企业间研发合侏展企业创新资源,进而有利于提升企业创新投入。本文为厘清数据价值对企业创新的作用与路径提供线索,也为我国数据资产的发展提供政策依据。关键词:辘资产;仓惭投入;副演约束;研发合作中图分类号:F270文献标识码:A文章编号:1001-4950(2023)12-0018
3、-16一、引言伴随着大数据、区块链、人工智能字化技术的快速发展,数字经济成为驱动我国经济发展的关键动力。田妗经济时代,数据资源已成为关键生产要素。其原因在于,数据资源具有无限供给的禀赋,破除了传统生产要素对经济增长的供给制约,为经济可持续增长提供了可能。当前,数据作为新型生产要素,正向经济社会各领域加速渗透,并涌现出瘫驱动型的产业、业柳商业簸(戚聿辆肖旭,2020)。对此,党的十旗四中全会首次提出将数据”作为生产要素,并参与收入分配机制。2022年4月,中共中央、国务院印发关于构建更皖善的要素市场化配置体制机制的意见,进/明确了数据作为第五种新型生产要素。翔圄乍为新型的核心生产力,其资产化过程
4、已成为必然趋势,但如何发挥辘资产价值已成为企业亟待解决的收稿日期:2022-09-21基金项目:国家社会科学基金重大项目(22&ZD115);国家社却学基金重大项目(21ZDA010);国家自然科学基金地区项目(72261028)作者简介:李健(1992),男,山东财经大学金融学院讲师(通讯作者,IeeyksO215);董小凡(1996-),女,中南财经政;扶学金融学院博士研究生;张金林(1964),男,中南赃掰法学金I蜉降授,博士生导师;陶云清(IW-),男,1晾大学国家发展研究院数字金融研究中心博士后。难题,也是学术界研究的重点问题(Leonelli,2019)e针对数据资产的概念仍未形成
5、共识,但数据资产化的基础是“数据”发挥生产力的过程(许宪春等,2022)。可以说,数据是所发生过的事件、时间、交易等信息的电子记录(AkOff1989)。随着信息化技术的快速发展,数据已从小规模增长转向爆发增长、海量集聚的特点,该特点也是I螭资产化过程的基础(HanniIa等,2022)。根据数据资产管理实践白皮书(5.0版)中的定义,数据资产是指企业通过采集、存储与分析所形成的海量信息型的资源,且未来能够给企业带来经济价值(陈国青等,2020).总的来说,数据资产在更多的情况下是企业在生产经营过程中以电子形式所记录的信息,其本身不直接参与产品生产,但却蕴含着巨大的使用价值(JOnes和Ton
6、etti,2020),并能够在未耕导企业生产活动,帮助管理者进行决策。创新是我国现代化建设的核心。“十四五”规划强调,以创新引领发展,力Dt夬建设科技强国。同时,党的二十大报告强调,创新是第一动力。客观来说,我国科技创新取得了巨大进步,但仍存在着自主创新能力相对不足、核心鼓术“卡脖子”的突出问题(李健等,2022)。突破创新发展瓶颈、顺利实施创新驱动战略,关键在于能够激发微观主体的创新意愿和创新资源(江轩宇,2016)。那么,数据资产作为新型生产要素能否提高企业创新投入?从已有相关研究来看,一方面,数据资产对企业的影响主要体现在成本管理、组织建设、风险管控等(Kiron,2013;SiVara
7、jah等,2017);另一方面,激活企业数据资产能够驱动企业价值,提升企业核心竞争力(HUang和VonMieghem,2014)。现有研究主要从理论上讨论了数据资产化的价值,理据资产对企业创新行为的影响仍然较少,尤其是数据资产对企业创新投入影响路径有哪些?本文研究有助于回答数据资产在微观层面的价值,厘清数据资产对企业创新投入的作用。本文可能的责献在于:一是数据资产已成为重要的战略资源,但相关的研究并不多,且现有研究主要从宏观视角讨论了数据资产的价值、核算方式以及交易机制等方面的问题(彭刚等,2022;许宪春等,2022),而探讨数据资产对企业创新的W究较少。因此,本文从微观视角考察数据资产对
8、企业创新投入的影响,从而丰富数据资产微观领域的研究。二是现有研究侧重于理论探潼据资产对企业的影响(NguyenffiPaczos,2020;徐涛等,2022),缺少实证方面的研究,目数据资产测度方式仍处于探索阶段。据此,本文通过讨论企业数据资产化的过程量化数据资产,从而补充了蜂资产的量化研究。三是国内外学者从理论模型上分析了数据给企业带资产对企业创新行为的影响路径。来的变化(Tan等,2015;Hariri等,2019),少有研究分析对此,本文将分析视角进行拓展,从创新意愿和创新资源的视角出发,揭示罐资产对企业创新投入的影响路径,有助于补充罐资产的理论与实证研究。二、文献回顾与研究假说随着大数
9、据、人工智能、物联网在生产生活中的广泛运用,雌资产已成为数字经济时代重要的战略资产。在价值创造过程中,数据资产是能够重复应用于生产,且具有经济价值的数据(RaRSiel等,2019),有助于指导企业生严谓并创造社会效益(许宪春等,2022)。首先,作为信息与事实的载体,健资产有助于帮助企业更好地进行生产经营与管理决策,提高信息与知识雌化蝠鼠三saa艺福呈翔升产品品质,提胡丑蛹价三B,进磁得更多的经福I润(Veldkam评DChUng,2019;徐野腮墨非,2020),为需要大圜S入的企业技术仓惭提供了可能。其次,辘资产相较于其他种类要素具有更强的正外部性,不仅能够提升企业的生事率,还能借助信息
10、流、技术流、资金流以及物资流形成数字产业集群,进而实现数字化协同联动与正反馈效应(FaAoodi等,2019),有助于提升企业财务稳定性,为企业创新活3)奠定物质基础。最后,钠字经济背景下,产业数字化亵字产业化已成为创新发展的必然要求。处理运用数据资产能力较高的企业往往能够以较低的成本获取资金,借助数据资产与资本、劳动等传统生产要素的深度融合,有助于充分激发经济发展新动能,带动企业创新意愿与创新资源的提升(BCgCnaU等,2018)。此外,随着数字化技术向各行业中的深度发展,资产会与劳动力、tt,资产等传统生产要素全面融合(AUto噂,2020),促进了所有生产要素的协同和联动,从而释放各类
11、生产要素在创新活动中的潜能,推动企业创新变革。据此,本如是出如下假设:Hl:黝籁产筋吁提蜂业创新SA。从创新意愿角度看,企业的睡资产能够提升外部资金的筹集能力,保证了企业充裕合理的创新活动流动性,有助于提升企业主观创新意愿与客观创新能力,进而以更高的财务稳定性提升创新投入。当前,我国企业普遍面临融资约束的问题,极大地削弱了企业的创新意愿(张璇等,2019)。首先,创新活9)本身具有高投入、高风险、长周期等特征,对资金具有高度依赖性(Holmstrom,1989),而创新研发结果的襁定性较高,难以与传统商业银行的信贷安全性要求相匹配,会企业技术创新容易受制于融资约束问题。然而,数据资产对传统资产
12、构成蹴的补充,催生了金融市场的新模式与新业态,有助于金融机构更充分地掌握企业生产经营状况与资信能力,缓解银企信息不对称导致的逆向选择与信贷风险,从而解决企业融资成本高等问题,缓解企业融资约束,提升信贷市场运行效率与资源供需的匹配性(BegenaU等,2018;CaiTiere-SwallowffiHaksar,2019)。其次,在产业数字化与数字产业化趋势下,拥有数据资产的企业往往被认为在生产经营管理中更具有竞争优势,更育缴得投资者青睐(Kiron,2013)o最后,当企业拥有足够的现金流0,企业的创新活动会顺使用内部资金(Bmwn等,2009)。而数据资产作为企业战略性资产,能够提升企业运营
13、效率,降低生产经营成本(GoOdridgC和Haskel,2015),谶字化供应链管理等多场景平台优化解决方案,赋能价值创造,为企蝴术创新提供了稳定的现金流作为研发物质基础。据此,本文提出如下假设:H2:企业数据资产会通过缓解融资约槐升企业创新投入。从创新资源角度看,翔骸产的虚拟性特征能够破除企业合作的时间与地域限制,带动了企业间合作形式的革新,从而有助于企业间提升创新合作质效,以更为高效的合作、共享共赢提升自主创新能力,推动企业创新资源与创新投入的提升。首先,数据资产具有共享性、交换性以及非消耗性等特征(ACqUiSti等,2016),可以实现企业间的资源共享与交换,进而标好企业管理者产生新
14、的产品创意(Tan等,2015),提升企业创新投入。其次,数字经济M发展碰升客户交互与业务运作效率的同时,也推进了市场需求的快速转变与创新技术的更新迭代,企业仅凭借自有资源开展技术创新活动将难以适应复杂多变的市场需求(李健等,2022)。然而,企业通过对共享的数据资产进行大数据分析可以更准确地刻画消费者画像,从而能够有针对性地改进现有产品,提升产品服务和质量,这也可以将数据资产看作是提高生产效率的资产(FarboOd和VeIdkamP,2020)。最后,数据资产导熔技术深度融合有助于推进企业技术创新,研蟋雌的采集、加工、储存、分析与运用贯穿于企业创新全流程中,以雌试错替代实物试错,有利于形成企
15、业间的数据网络与研发合作,对于形成以期g驱动企业间创新合作的新路径具有重要意义(AkCigi而LiU,2016)。据此,本灯黜如下假设:H3:企业健资产会通过增进企业间研发合作提升企业创新投入。三、数据资产的量化与特征分析(一)嘘资产形成机制与量化为量化企业数据资产,本文认为有必要探讨了解数据资产的形成机制。因此,本文借鉴RaSSie噂(2019)的研究,从“数据收集、数据存储、数据分析以及数据应时四阶段的数据价值转变形态,探t擞据资产形成机制。数据资产化过程中的第一阶段是数据收集,该阶段是企业将生产信息、交易信息等方面从手工记录转为数字化记录的过程,而这一阶段需要企业收集大量的数据才会凸显出
16、数据的价值。第二阶段是嘘存储,该阶段是企业将收集来的嘘通过编码、脱敏等过程后形成标准化的辘,并存储于月的器中,以供企业进行后续分析。第三阶E殳毁据分析,该阶E殳是企业研发人员采用数据挖掘、机器学习等数字化分析技术对存储数据进行分析,其目的在于提瞬据中的关键信息和知识点。第四阶段是数据应用。该阶段是数据资产实现价值的重要阶段,其目的在于通过第三阶段的数据信息挖掘辅助企业进行生产运营,帮助企业构建产品创意。基于雌资产形成机制,本文资产形成阶段,结合企业财务报表附注中所披露的数据数掘据现现 数据分析、数大挖数拟强掘、本虚善挖型析文能、其1 、智析、 数据分据、分实数据储存数据存储、服务器、数据资源、
17、 数据共享、数据管理、数据库、 数据仓库、数据中心、数据健、 数据服务、数据信息、网络资 源、系统集成、数字化、数字 平台、数字网络企业数络技术、数据 /管理、信息 技术、信息服 务、信息网 络、信息化管 理、信息系 统、信息平台 、信息共享、 信息资源、 信息沟通、信 息安全、信 息管理系统、 信息化、通信 技术、通信网 络、移动通信年末固定资产、无形资产明细中与嘘资产化过程相关的项目占固定资产、无形资产的比例来测度企业类据资产。具体而言,当企必斤披露的固定资产、无形资产支出明细中出现图1所示关键词时,则初步判定为企业数据资产化过程,再将该企业同一年度锄据资产化过程相关的固定资产、无形资产进
18、行求和,并计算其占固定资产和无形资产总额的比例,以此作为企蟠据收集、数据者、辘分析以及数资产的代三变量(DigaS)。企四孀资产的形成应涵盖据应用四个阶段。对此,本文进行人工复核,只有当企业的数据资产化过木艇历完整的四个阶段才会判定为企业数据资产。此外,为保证本文数据资产变量的合理性,本文在后续的稳健性移动互联网、工业互联网、产业互联网、互联网、互联网+、互联网技左、互联网应用、互联网商业模式、互联网平台、互联网营销、互联网里务、子裔务、在实、云计算、 云服务、云平 台、物联网、 人工智能、商 业智能、机器 学习、深度学 习、自然语 言处理、生物 识别技术、分 布式计算数 据 收 集 工业智能
19、、移 动智霰高端 智能、智能 终端、智能系 统、智能科 技、餐能硬件 、智能管理、 智能家居、智 能穿戴、智能 农业、智能智能建筑、智 能制造、智能 机器人、互 联网医疔、智 能化、智慧化、智慧 城市、移动支 付、数字曾 销、数字控制 、数字通信图1企业数据资产指标特征词谱21数据资产对企业创新投入的影响研究检验中,采用文本挖掘法对图1所示关键词词频进行挖掘,并使用燧值法权,最终可得到企业数字资产指数。(二)企业数据资产的典型事实随着数字化技术的快速发展,数字经济已成为经济发展的新动能。根据国务院发布的携手构建网络空间命运共同体白皮书指出,截至2021年,中国数字经济规模占国内生产总值比重高达
20、39.8%。得益于数字经济的快速发展,不仅利于了各类资源要素的加速流动,而且实现了各类微观主体的跨界融合,这为数据资产的发展奠定了基础。与之相伴的是,数字经济的快速发展也成为推动实体经济恢复发展和创新的重要手段。由此,本文绘制了企世蜩资产和创新投入的20112020的变化趋势,如图2所示。研究发现,数据资产一直呈现上桐势,尤其是党的十九大后更呈现出明显的增长态势(图1所示)从企业研发活力视角看,企业研发投入呈现缓慢的增长,但在2017年后企业创新投入增长较为明显(图2b所示)。0.0070.006忙 0.005 0.004翼 0.003禄 0.0020.001 0201120132015201
21、72019(a)数据资产发展趋势0.0400.0350.0300.0250.020春).()150.0100.005 020112013201520172019(b)创新投入发展趋势图2企业数据资产与创新投入情况数据资产的核心特14是虚拟性(JonesfflTonetti,2020),数据资产必须要结合其他生产要素才能发挥价值。目前来看,企业对于辘资产的运用更多的是查询与分析等,并没有完全发资产的价值,且雌资产多存在于IC俨业中(徐涛等,2022)。表1展示了按证监会行业分类的拥有辘资产企业的行业均值。研究发现,数据资产较多地分布于信息技术业、传播与文化产业、综合类以及批发和零售贸易等行业,而
22、采掘业、农、林、牧、渔业以及电力、煤气及水的生产和供应业等劳动密集型行业中拥有数据资产较少。表1各行业数据资产均值行业均值行业均值农、林、牧、渔业0.0008建筑业0.0013制造业0.0021交通运输、仓储业0.0015信息技术业0.0191采掘业0.0005综合类0.0036传播与文化产业0.0091批发和零售贸易0.0035社会服务业0.0023电力、煤气及水的生产手喉应业0.0010拥有数据资产的企业与未拥有企业可能存在明显区别,表2展示了企业是否拥有数据资产的相关变量组间差异检验结果。研究发现,拥有数据资产企业的规模显著高于未拥有罐资产企业。从盈利能力上看,拥有甥S资产企业的净资产收
23、益率明显高于未拥有数据资产企业,这表明拥有蝇资产企业在市场竞争中更具有优势。从创新活动上看,拥有数据资产企业的专利数量显著高于未拥有数据资产企业,且未来成长能力更强。因此,拥有数据资产企业属于竞争优势较强、创新能力较强、成长能力较好的企业。表2数据资产企业的经营特征类别企业规模盈利能力成长能力研发能力拥有数据资产的企业21.92960.03572.39831.8377未拥有数据资产的企业22.53460.02482.19760.9179三s0.605()0.01090.20060.9198四、研究设计与变量选取数据来源本文选取20112020年中国A股上市公司作为研究对象。数据来源主要包括:一
24、是上市公司数据资产指数通过收集样本期间的年报,采用手工量化的方式得到。二是上市公司的其余变量均通过Wind和CSMAR数据库进行采集。同时,本文按照已有研究文献剔除了金融行业、STSrST血吸缺失严重的企业。通过上述处理,本文共获得8100个观测值。1 .被解释变量。本文借鉴黎文靖等(2021)的研究思路,分另睬用研发支出占销售收入的比重(痴)与研发支出占总资产的比重(Inm)作为被解释变量。同时,本文发现样本期内大部分企业未披露研发经费的支出情况。为避免被解释变量缺失引起的估计偏误,本文参考刘诗源等(2020)的研究,将企业未披露研发经费支出的情况按照O值处理。2 .核心解释变量。本文通过查
25、找企业年报中披露的固定资产、无形资产支出明细量化数据资产的拥有程度,并在后续的稳健性检验中采用文本挖掘法挖掘特征词词谱出现的频率,采用燧值法进行赋权,具体量化方法见第三部分。3 .控制变量。参考已有研究文献(唐松等,2020;宋敏等,2021),本文分别选取企业规模(Size)、企业年龄(Ag)、资产负债率(5)、总资产收益率(R仅)、股权集中度(S/丽)、企业成长性(Tohinq)、两职合一(Merge)和审计意见(Oplin)o具体变量定义见表3所示表3变量定义变量名变量符号衡量方法创新投入Inn研发支出,销售收入Inn2研发支出/资产总额企业数据资产程度Digas见数据资产指标量化企业规
26、模Size总资产的对数值企业年龄Age观测年份减去成立年份后取对数值资产负债率Lev总负债/总资产总资产收益率Roa净利润/总资产股权集中度Share前五位大股东持股数/总股数成长性Tohinq(股票市值M艇总额)/总资产两职合一Merge董事长与总空i为同一人取I,否则为0审计意见Optin标准无保留意见取。,否则为1()iSi+为验证本文的研究假设,本文的基准模型如下:Inn=Oo+1DigaSit+aControls+z+,+(1)其中,/代表企业创新投入,包括历和?2,。欣尔代表企业数据资产,CWs代表一系列)控制变量,玳表随机扰动项。为缓解遗漏变量带来的影响,本文还D了企业固较血,和
27、年份固定效应,且回归结果的标准误均经过企业层面聚类调整。(四)描述性统计表4展示了主要变量的描述性统计结果。结果显示,两种方式计算的企业创新投入均值分别为0.0287和0.0155,标准差分别为0.0405和0.0179,这说明企业间的创新投入存在显著差异。企业数据资产的均值和标准差分别为OOO32和0.0075,这表明不同企业所拥有数据资产程度存在较大差异,也为本文的回归分析奠定了良好基础。表4变量描述性统计变量样本数均值标准差最小值最大值InnI81000.02870.040501.2591Inm8I(X)0.01550.017900.1622Digas8I(X)0.00320.00750
28、0.()4775Size810022.48911.299619.871326.2241Age81002.93880.27761.38623.7376Lev81000.46580.20210.06260.9076Roa81000.03490.0578-0.20290.2097Share81000.54390.153700.9614Tobinq81002.21271.56840.82099.6767Merge81000.02660.161101Optin81000.19280.394501五、实证分析(一)埴回播果表5展示了基准模型的回归结果。其中,被解释变量分别为面和历2,每列回归均控制了企业和
29、年份固定效应,且标准误均经过企业层面聚类调整。研究发现,第(1)与(2)列加入企业财务特征控制变量的实证结果显示,Digas的估计系数在1%水平上为正(分别为0.0358与0.0842);第(3)和(4)列加入全部的控制变量的实证结果显示,Digas的估计系数依然显著为正(分别为0.0354与0.0259)。实验果表明,数据资产能够显著提高企业创新投入,假设Hl得到验证。此外,控制变量的结果与已有文献基本一致。表5企业数据资产与创新投入变量(I)加?I(2)Inn2(3)Irm1(4)InniDigaS0.0358(5.01)0.0842(5.43)0.0354m,(4.94)0.0259-(
30、6.88)Size0.0009*(242)-0.0017,t4(-8.57)0.0009*(219)-0.001704(-7.75)Age-0.0081,(-181)-0.0014(-0.62)-0.0091,1,(-1.99)-0.0007(-0.29)Lev-0.011*(-6.52)-0.0001(-0.11)-0.0112(-6.54)-0.0002(-0.30)Roa-0.0357”,-9.76)0.0079-(4.11)-0.0359”,-9.49,0.006(3.05)Share-0.0036,(-165)0.(X)23*(202)Tobinq-0.0001(-0.74)0.00
31、01”(203)Merge-0.0026”(-2.37)-0.0013-(-2.36)Optin0.0005(0.91)-0.0001(-0.33)常数项0.0258,(1.75)0.0529(6.83)0.0306*(204)0.0495*w(6.26)时间固定效应YESYESYESYES企业固定效应YESYESYESYESN8100810081008100R20.09250.0770.09770.0930注:括号内为值,.、分别代表10%、5%、l%a渊吓显者,下表同此本文进一步考察了数据资产指标分解回归以及滞后回归,见表6所示。表6中的PMe/A展示了产指标分解回归,其中,DigaS_d
32、co、DigaS_dst、DigaS_da以及DigaS_dap分别资产形成机制的四个阶段,即数据收集、数据存储、数据分析以及翻瓠甩从中可看出,企业数据资产形成机制中的每一阶段的估计系数均在I%显著水平上显著为正(/|与2的结果均To,这表明睡资产化过程会对企业创新投入产生影响。表6中的。的R4展示了健资产指标滞后回归。从中可看出,随着时间的推移,黝g资产对创新投入的影响效力在逐渐转弱(加?I与02的结果均一致)。具体而言,在10%显著水平上,滞后I至3期飕据资产对创新投入的影响显著为正,但滞后瑚后没有统计上的显著性影响。可见,数据资产展现出了时间朝上白悯忌三减瓠,这觇资产的时效性特点(许宪春
33、等,2022)。表6特征分析:企业数据资产与创新投入PanelA(1)hmI(2)bun(3)Inn(4)Imn(5)binI(6)Inn2(7)Inn1(8)InniDigaS_dco0.0442(5.59)0.0359(8.57)Digas_dst0.0115,(4.71)0.0053,m,(4.12)Digasdan0.0183(4.88)0.0097*(4.88)DigaSjaP0.011L(2.95)0.005f(256)控制变量YESYESYESYESYESYESYESYES时间固定雄YESYESYESYESYESYESYESYES企业固定效应YESYESYESYESYESYESY
34、ESYESN810081810081008100810081008100R20.07780.09000.07960.05750.06190.05400.06590.0533PanelB(I)InnI(2)Inm(3)Inn1(4)Inn2(5)Inn1(6)Inn2(7)Inn1(8)InmL1.Digas0.0292(3.88)0.0235(6.06)L2.Digas0.0219”(2.64)0.0238*,(5.67)L3.Digas0.0103*(2.04)L4.Digas0.0192(3.89)0.0121(101)0.0183(3.08)控制变量YESYESYESYESYESYESY
35、ESYES时间固定效应YESYESYESYESYESYESYESYES企业固定效应YESYESYESYESYESYESYESYESN72907290648064805670567048604860R20.08280.06820.05940.05250.04020.02500.01640.0059(二)内生性问题处三数据资产对企业创新投入的影响可能受到内生性影响,具体而言:一是逆向因果的影响。尽管本文从动态视角考察了翔S资产对创新投入的影响,能够在一定程度上缓解逆向因果带来的内生性问题,但可能会出现创新投入相对较高的企业更倾向于资产产生影响。因此,为拥有较大程J宴的数据资产,这也可以说是,企业创
36、新投入反过来对避免逆向因果带来的内生性问题,本文将选用工具变量法弱化潜在影响。参考ChOng等(2013)和唐松等(2020)的研究思路,本文选用企业所在行业的其他企业数据资产的平均值作为工具变量。值得注意的是,选用与该企业在同一行业内的其他企业数据资产平均值作为工具变量,从第一阶段的检验中可发现,工具变量的WaIdF统计量为227.83,这说明本文选取的工具变量不存在弱工具变量问题,且在1%显著水平上工具变量的估计系数显著为正。第二阶段的检验结果显示,在1%显著水平上核心解释变量。收心仍然显著为正,这表明本文核心结论仍然成立,即数据资产例升企业创新投入(见表7)。表7工具变量的检验结果(1)
37、AwI(2)Irun第一阶段第二阶段第一阶段第二阶段IV0.969(25.18)0.969(25.18)Digas0.462”(19.07)0.2126(1435)常数项-0.038(-3.82)0.0701(8.49)-0.038-(-3.82)0.0503(11.07)控制变量YESYESYESYES时间固定效应YESYESYESYES企业固定效应YESYESYESYESF-招”(第一阶段)227.83227.83LM统计量(潼)0.00000.0000N8100810081008100R20.02020.0125同时,本文也采用双重差分法来解决内生性问题。2016年工信部发布了大数据产业
38、发展规划(20162020年)。该规划鼓励各行业强化大数据产品应用和研发,建设大数据标准体系。该政策对于各行业而言是促进其数据应用和创新的一Wa中击。为此,本文将大数据产业发展规划(2016-202阵)作为典型的夕阳中击,并以各企业异质性构建实验组和对照组。ST此,粗构谶口下庭Inn=o+ITreatuPOSt+KControlsit+,+/+(2)其中,77K代表对照组和实验组的区分标记,以2016年各企业数据资产发展水平的中位数进行分组,企业所在行业2016年末的数据资产小于当年所有行业的中位数,则记为实验组,赋值为1,否则记为对照组,赋值为0。RM代表年份虚变量,即201弹及以后为1,否
39、贝脑0。同时,为保证双重差分模型结果的稳健性,本文还加入了平行趋势检验。表8展示了双重差分模型的估计结果。从第(1)和(2)列可看出,TreatPast的估计系数在1%水平上显著为正,这表明在该政策出台后,企业数据资产呈现出增长的态势,且实验组中的企业S据资产增长更为明显。从第(3)和(4)列可看出与事前年份的虚变量均不显著,而刀文与当年及事后年份的交互项在1%的水平上显著为正,这表明在该政策出台前,企业在创新投入上并没有差异,模型的平行势假定通过检验。尽管本文已尽可能地控制了样本偏差问题,但仍存在蝌偏差问题。对此,本文考虑运用HeCkman两阶段模型缓解样本选择偏差的问题。其中,HeCkma
40、n模型中的第一阶段,本文将按照该企业数据资产是否超过同行业年度中位数设置哑变量,即该企业超过同行业年度中位数则赋值为1,否则为0,并以第一阶段的Pmbit模型估tt果计算逆米尔斯比率(IMR)9表9中第(1)和(2)列够B果显示,在1%显著性水平上,核。解较量戊网估计翘仍然显著为正,这表明本文的研究结论是稳健的。除企业自身特征影响创新投入外,地区的生产总值、产业结构、政府干预程度等方面会影响企业的创新投入。同时,企业所在行业随时间的变化趋势也会影响企业创新活动。因此,本文在模型(1)白蟒制变量中加入了地区经济发展水平(各省份生产总值的又擞值)、地区产业结构(各省份第二产业产值/生产总值)、政府
41、干预度(各省份财政收入/财政支出)以及控制了,行业时间的高阶联合固敬应,结果见表10中第(3)和(4)列所示。结果显示,核心解释变量Oiga,的估计系数在1%显著水平上依然为正,这表明本文的实验结果仍然成立。表8大数据产业发展规划与企业创新投入双重差分估计F行趋势检验(I)Inn(2)bt2(3)InnI(4)Zw2TreatXPost0.0032(4.14)0.0016(323)TreatXyear20140.0009(057)0.0007(1.03)Treatyear20150.0017(0.79)0.0005(0.44)Treatyear20160.0033,(1.98)0.0009(1
42、.03)TreatXyear20170.0041“(241)0.0013(295)Treatyear20180.0053”.(322)0.002L(3.03)控制变量YESYESYESYES时间固定媚YESYESYESYES企业固定效应YESYESYESYESN8I(X)8I(X)8I(X)8I(X)R20.03380.02430.Q4260.0379表9内生性检验结果HeCkman两阶段模型控制遗漏变量(2)Inni(3)Inn1(4)ht2Digas0.035L(4.89)0.0258-(685)0.1783-(21.65)0.078L(1735)IMR-0.6296*(-2.54)-0.
43、1713*(-2.21)控制变量YESYESYESYES时间固定效应YESYESNONO企业固定效应YESYESNONO行业X年份固定效应NONOYESYESN8100810081008100R20.08310.07820.37810.3284表IC)稳健性检验结果更换量化方式剔除部分样本更换估计模型(I)Zfm(2)bui2(3)痴I(4)hn(5)Inn1(6)Itun0.14320.08370.019740.02090.05350.035LDigas(4.86)(5.40)(2.59)(5.12)(6.74)(8.19)常数项0.0295”0.04680.0397”0.06443.0.075”0.074L(1.97)(5.94)(2.50)(7.55)(4.99)(9.57)控制变量YESYESYESYESYESYES时间固定效应YESYESYESYESYESYES企业固定效应YESYESYESYESYESYESN810081006860686081008100R20.08680.07660.07740.0776(三)Wffi佥验除进行内生性碰外,本文进行了一系列的稳健性检验。具体而言一是替换核心解释变量的测度方式。本文进一步采用文本挖掘法对图1所示关键词词频进