会计论文数据分析.ppt

上传人:小飞机 文档编号:6080258 上传时间:2023-09-21 格式:PPT 页数:53 大小:204.50KB
返回 下载 相关 举报
会计论文数据分析.ppt_第1页
第1页 / 共53页
会计论文数据分析.ppt_第2页
第2页 / 共53页
会计论文数据分析.ppt_第3页
第3页 / 共53页
会计论文数据分析.ppt_第4页
第4页 / 共53页
会计论文数据分析.ppt_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《会计论文数据分析.ppt》由会员分享,可在线阅读,更多相关《会计论文数据分析.ppt(53页珍藏版)》请在三一办公上搜索。

1、2023/9/21,浙江工商大学 裘益政,数据分析,数据库应用讲座,2023/9/21,管理型财会人才与研究能力的培养本课程是一门方法论的课程,2023/9/21,专业研究数据库与其他数据来源之间的关系:使用专业数据库研究效率更高;可以直接下载批量数据专业数据库的很多数据非原始数据,如股票回报率的数据;系统性风险测量的数据(贝塔值);公司财务指标(如净资产收益率、资产负债率等);公司市场价值的测量(tobin q)等;可以大大减少研究工作量专业数据库为公开数据,使经验研究的可靠性大为提高,因为数据来源公开使得经验研究具有可复制性。专业数据库由于是海量数据,在人工制作前提下存在错误也许在所难免,

2、因此,在下载数据之后,需要首先检查数据的真实合理性,如果发现数据有问题,可以采取的策略是多个数据库资源之间的核对;此外,可以通过其他途径获取真实可靠的信息。,2023/9/21,CCER数据库应用介绍,CCER(色诺芬)数据库应用要求:全面熟悉色诺芬财务数据库的特点和内容,了解字段的具体内容,掌握提取和处理数据的基本方法,并且能够初步应用色诺芬数据库进行案例分析和大样本实证研究。,2023/9/21,色诺芬数据库的特点,专业:每个数据库中不仅仅提供原始的数据,同时更多的提供衍生的数据内容,比如,治理结构数据库中高管情况以及治理会议等的很多字段、价格受益数据库中的很多统计信息等。精确易用:(1)

3、在线帮助功能;(2)互联网下载数据,2023/9/21,实验仪器设备及软件电脑(连接INTERNET)、色诺芬数据库实验内容、操作程序实验内容:包括了解数据库结构、检索、下载数据和数据的基本处理操作程序:首先进入;在输入账号和密码后进入数据库中,根据题目要求检索数据库,下载需要的字段数据。,2023/9/21,使用数据注意事项,如果论文需要发表,必须注明所使用数据来自色诺芬数据库,2023/9/21,色诺芬数据库的内容与应用,(一)非金融上市公司数据库1.数据库结构的简要说明,详细介绍字段定义。2.例题:2.1 请列出所有上市公司(非金融类)2007年度的资产负债率、资产周转率和应收账款周转率

4、以及该年度的审计意见,在表中注明公司名称、股票代码、三项财务指标,所有数据下载到excel文件中,并分别进行排序(升序)处理。2.1数据处理结果,2023/9/21,2.1解释说明:(1)应收账款周转率有不同的计算方法,分母可以是:平均应收账款余额(教材)、期末应收账款余额(2008年注会教材)、平均应收账款与应收票据余额。在采用数据库给定的财务比率时应当首先观察其公式是否符合研究要求。,2023/9/21,2.2 计算行业平均财务比率,分析不同行业资产周转率是否存在显著差异,2023/9/21,2.3 请从财务报表中提取数据,计算上市公司2007年度的偿债能力比率:流动比率(流动资产/流动负

5、债)和速动比率(流动资产存货)/流动负债;盈利能力比率:净资产收益率和主营业务利润率,并分别计算其均值和中位数。测定这些变量是否符合正态分布。2.3处理结果解释说明:在方差分析和回归分析中都要求因变量呈现正态分布,因此对数据进行分布检验,严格地说,是必要的。如果检验失败,可以考虑对数据做对数变换,使得数据接近正态分布。,2023/9/21,利用SPSS检验样本分布的正态性,单个样本的K-S检验,主要是对单个样本的分布特征进行检验的过程。它是根据样本的经验分布来确定总体是否服从某种理论分布的检验。SPSS非参数检验的1-Sample K-S子过程可以检验总体是否服从正态分布(Normal),这是

6、系统默认选项。此外还可以对单个样本是否服从均匀分布(Uniform)、泊松分布(Poisson)和指数分布(Exponential)。操作过程:Analyze Nonparametric tests1-sample k-s注意:原假设是样本分布为正态分布,如果检验显著,则原假设被拒绝。,2023/9/21,2.4.请找出所有2007年度资产负债率超过60%的制造业上市公司,并统计这些上市公司的资产收益率的均值;同时也找出资产负债率低于30%的制造业上市公司,并统计这些上市公司的资产收益率的均值。请对这两组均值进行比较。2.4处理结果解释说明:本例题一是解释数据库高级查询的应用;二是练习均值比较

7、技术。,2023/9/21,检索步骤:1.点击高级查询2.选择输出字段:“债务资产比率”、“资产收益率”等。3.第一查询条件为“债务资产比率”大于60%;第二查询条件为“财务报告日期”以2008开头;第三查询条件为“CSRC行业”以C开头;4.第一查询条件为“债务资产比率”小于30%;第二查询条件为“财务报告日期”以2008开头;第三查询条件为“CSRC行业”以C开头;5.将步骤3与4形成的EXCEL文件合并。,2023/9/21,两组独立样本的等均值检验选择Analyze Compare meansIndependent-samples T Test将资产收益率作为分析变量,类别作为分组变量

8、(事先将低资产负债率界定为1;高资产负债率界定为2)单击“Define Groups”按钮来设置分组规则,这里在两个矩形框中分别输入1和2,单击“continue”返回对话框,单击“OK”就可以了。通过分析你得出了什么结论?,2023/9/21,独立样本等均值检验注意的问题,注意在独立样本等均值检验中包含了等方差的检验、等方差时的t检验和异方差时的t检验结果。读这个表时先看等方差的检验结果(前两栏)。如果P值小于显著性水平(如5%),则认为总体是异方差的,接下来在t检验中要使用方差不等时的检验结果;如果方差检验中认为两个总体是等方差的,则在t检验中使用方差相等时的检验结果。在这个例子中,方差检

9、验的p值等于0.284大于0.05,因此认为两组样本是等方差的。接下来的t检验中使用方差相等的检验结果(上面的一行),检验的p值等于0.000,因此认为两组样本的均值不相等。,2023/9/21,2.5.1 金融危机影响了上市公司绩效吗:将2007年与2008年的公司财务业绩对比分析2.5.2 基于行业的对比分析,2023/9/21,2.6.请找出所有2007年度资产负债率超过60%的制造业上市公司,并统计这些上市公司的资产收益率的中位数;同时也找出资产负债率低于30%的制造业上市公司,并统计这些上市公司的资产收益率的中位数。请对这两组中位数进行比较。,2023/9/21,Analyze No

10、nparametric tests2 independent samples test对话框Wilcoxon test,2023/9/21,(二)价格收益数据库,1.价格收益数据库的结构,详细介绍字段定义2.例题 2.1 股本的大小会影响到股票回报率吗?2.1处理结果解释说明:本例题考虑使用单方差分析。解题步骤:(1)使用2007年的上市公司股本和回报率数据;(2)将股本按照规模排序,分为五等分,分别取值1-5(单方差分析中因素最多可以有50个分组)。,2023/9/21,方差分析的实质是检验多个总体均值是否有显著性差异,在实际应用中,方差分析用来处理各种因素对一个因变量是否有显著影响。其中单

11、方差分析则可以分析一个因素对因变量是否产生影响。使用SPSS的单因素方差分析步骤如下:单击“Analyze”Compare means“One-Way ANOVA”;在对话框中将变量“回报率”选入“Dependent List”框,将变量“类别”移入Factor栏。单击对话框中的“options”按钮,在弹出的对话框中选中“descriptive(描述统计)”、“Homogeneity of variance test(方差齐性检验)”和“Means plot(均值的图形)”复选框。,2023/9/21,单击主对话框中的“Post Hoc(事后多重比较)”,选中“LSD(最小显著差异方法)”复

12、选框(当方差分析F检验否定了原假设,即认为至少有两个总体的均值存在显著性差异时,需要进一步确定是哪两个或哪几个均值显著不同,则需要进行多重比较来检验。多重比较是指在因变量的三个或三个以上水平均值之间进行的两两比较检验,LSD主要用于组间两两比较)。单击OK,得到分析结果。【分析结论】股本规模对回报率有影响,股本规模越大,其回报率越高,但是该影响不够显著。【练习】请用单因素方差分析方法分析行业因素对股票回报率的影响。,2023/9/21,如何利用EXCEL将已知样本分成五组(每组样本数据大致相等)EXCEL“工具”“数据分析”-“排位与百分比排位”“输入区域”(标志在第一行)-“输出区域”(选定

13、列)输出后使用IF语句嵌套函数:=IF(N2=20%,1,IF(N2=40%,2,IF(N2=60%,3,IF(N2=80%,4,5);可将所有数据分为五等分,并按大小赋值。,2023/9/21,双因素方差分析,在实际问题的研究中,有时需要考虑两个因素对实验结果的影响。例如饮料销售,除了关心饮料颜色之外,我们还想了解销售地区是否影响销售量。若 把饮料的颜色看作影响销售量的因素A,饮料的销售地区则是影响因素B。对因素A和因素B同时进行分析,就属于双因素方差分析的内容,双因素方差分析是对影响因素进行检验,究竟是一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不显著。,2023/9/21

14、,双因素方差分析有两种类型:一个是无交互作用的双因素方差分析,它假定因素A和因素B的效应之间是相互独立的,不存在相互关系;另一个是有交互作用的双因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应。例如,若假定不同地区的消费者对某种颜色有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景;否则,就是无交互作用的背景。,2023/9/21,2.2 请使用2007年的数据分析是否发行B股、资产负债率对公司系统性风险(贝塔系数)的影响。解释说明:本例题采用双因素方差分析(如果有两个因素影响某一个因变量的试验结果,则称为双因素方差分析,此时需要对两个因素进行

15、检验,分析是一个因素在起作用,还是两个因素都起作用,还是两个因素都不起作用,还是两个因素搭配起来同时起作用即所谓的交互作用。对于无交互作用的双因素方差分析,其结果与对每个因素分别进行单因素方差分析的结果相同。),2023/9/21,从菜单上依次点选AnalyzeGeneral Linear ModelUnivariate命令将因变量“贝塔系数”移入Dependent Variable框内,并将变量“资产负债率”(十分位变量)和“发行B股”(零一变量)放入Fixed Factor(s)框内。单击右侧绘图plots按钮,将Factors框中的变量“资产负债率”移入Horizontal Axis框内

16、,作为横轴,另外将另一变量移入Separate lines框内,这时激活下方PLOTS旁的Add按钮。另,在options中选择Homogeneity tests(方差齐性检验)。点击OK。,2023/9/21,2.3 请说明SIGMA系数的含义,并指出2007年SIGMA系数最高和最低的十家公司,并分析资产负债率、股本规模、系数与SIGMA系数的相关性(运用相关性分析)。解释:本例题要求运用数据字典查询字段确切含义(数据字典34页);2.3分析结果,2023/9/21,在SPSS中选择AnalyzeCorrelateBivariate,打开相关分析的主对话框,把需要分析的变量选入Variab

17、les框,其余采用默认值,就可以计算变量之间的两两pearson相关系数(简单相关系数),以及相应的假设检验的p值。偏相关系数是在对其他变量的影响进行控制的条件下,衡量多个变量中某两个变量之间的线性相关程度的指标。如在控制收入影响的条件下,分析价格对需求的影响(试分析控制资产负债率后系数对SIGMA的影响)。pearson相关系数与偏相关系数有时相差很大,有的甚至符号相反。但是对于多变量的相关程度的测定,偏相关系数更能反映两个变量之间的本质联系,因此它常常用于多元线性回归分析之中,以便分析自变量间的共线性是否排除。,2023/9/21,2.4分析资产负债率(分类变量)、股本规模、系数与SIGM

18、A系数的相关性(运用spearman相关性分析)解释说明:spearman相关性分析必须有一个变量为定序变量。,2023/9/21,(三)证券市场指数数据库,1.证券市场指数数据库的结构,详细介绍字段定义。2.例题:2.1 请利用万科案例说明代理权竞争对股东财富的影响。解释:本例题主要是掌握事件法的应用。,2023/9/21,事件研究法(event study)介绍:多用于研究各个经济或管理事件对企业产生的影响,如企业的并购行为、盈利信息的发布、新债券的发行或宏观经济事件对企业的股价或绩效的影响。事件研究法的基本步骤:1.界定所关注的事件,辨别、确定与之相关的事件期间或者事件窗(event w

19、indow),即事件可能对因变量(如股价、盈利)产生影响的时间段。通常事件窗包括事件产生前后的一段时间。因为事件发生后一段时间的信息能够显示因变量(如股价、盈利)等变化情况;同时考察事件发生前一段时间的股价,有利于捕捉事件前期预兆和事前泄露信息造成的影响。2.将上市公司代理权竞争的首次公告日(事件发生日)定义为第0 天,计算窗口期(-20,10)的累计平均异常收益CAR。,2023/9/21,计算步骤为:(1)窗口期内每家公司每天的预期正常收益率Rm 以当天大盘的收益率(当天收盘指数-昨天收盘指数)/昨天收盘指数来替代。(2)每家公司每天的异常收益Rt,等于每家公司当天的实际收益率Ri(当天收

20、盘价-昨天收盘价)/昨天收盘价减去预期正常收益率,即Rt=Ri-Rm。(3)对窗口期内每天各公司的异常收益求平均数,即得该样本当天的平均异常收益ARt=1/N Rt,N 为样本中的公司数量。(4)将窗口期内每天的ARt 进行求和,得到累计平均异常收益CAR=ARt。CAR(T1,T2)表示在T1T2 窗口期内上市公司代理权竞争给流通股股东带来的超过市场平均收益的利润率,即流通股股东的财富效应。,2023/9/21,1.数据库结构与字段定义。2.例题:2.1 请描述中国上市公司2000-2007年公司第一大股东平均持股比例的变化:中国的上市公司是国有股一股独大吗?解释说明:使用excel的分类汇

21、总统计每年的第一大股东平均持股比例;使用SPSS的描述性统计,分析2007年上市公司各类实际控制人所占比重,并用饼图说明;使用SPSS的单因素方差分析(首先选择样本为国有上市公司),分析年度对国有第一大股东持股比例的影响。2.1处理结果股东类别为:国有控股0;民营控股1;外资控股2;集体控股3;社会团体控股4;职工持股会控股5;不能识别6。,(四)公司治理数据库(重点),2023/9/21,2.2 股东户数减少是否意味着回报率的增加(股东户数减少必然引起人均持股量的增加,不少人认为这是公司股价上涨的一个重要信号),请用2007年中国上市公司的数据进行经验分析。解释:本例题主要用于练习(1)数据

22、库合并;(2)使用SPSS测算新变量:股东户数变化率;(3)使用偏相关分析,控制公司股本规模的影响。2.2处理结果通过分析得出了什么结论?,2023/9/21,2.3 浙江上市公司2007年是否都设立了审计委员会、战略委员会、薪酬委员会和提名委员会?解释:本例题主要是了解浙江上市公司董事会治理的现状,在数据检索时应当采用高级检索的方法。在条件项选择“公司注册地”包含“浙江”。2.3处理结果,2023/9/21,(五)关联交易数据库,1.介绍数据库结构与字段定义。2.1例题:请计算2007年中国上市公司关联交易金额占总销售收入的比例;并分析独立董事比例是否对上述指标产生影响,运用单变量回归分析。

23、解释:本例题旨在练习(1)利用EXCEL分类汇总;(2)利用SPSS提取汇总数据;(3)练习回归分析技术。2.1 处理结果(说明:关联交易金额剔除上市公司为其他公司提供的担保以及其他公司为上市公司提供的担保,因为上述事项不会直接对收入和损益产生影响),2023/9/21,(六)上市公司再融资数据库,1.数据库结构与字段定义:包括上市公司增发、配股、可转债发行等。2.例题:请计算2000-2002年上市公司权益融资成本解释:本例题主要是掌握最新关于权益资本成本计算的方法3.小练习,2023/9/21,权益资本成本的计算:以往的研究在计算股权融资成本时,一般以当年每股股利或当年每股收益除以股票市价

24、作为股权融资成本,其不足是没有考虑企业股利和收益在未来年度的变化。,2023/9/21,Gordon&Shapiro在其股权成本模型中增加了一个固定的股利增长率,然而,该模型仍存在一定缺陷,因为很少有公司能够做到使其股利增长率保持稳定不变,而且有关实证研究结果也并不支持该模型(Wippern,1966)。为了克服上述缺陷,Gebhardt,Lee 和Swaminathan(2003)引入了剩余收益折现模型来计算股权融资成本,其研究结果显示,该模型在对股权成本的预测能力方面要优于传统的股权成本计算模型。为此,大量文献采用该模型来计算我国上市公司的股权融资成本。,2023/9/21,剩余收益折现模

25、型的含义是:企业面临的股权成本,即为使企业未来净现金流现值与当前股票价格相等的内含报酬率。从数学角度而言,剩余收入模型等价于我们熟悉的股利折现模型。根据股利折现模型,股票价格为其预期股利的现值,即:,2023/9/21,假定企业的收益和所有者权益账面值采用“干净盈余”(cleansurplus,干净盈余要求影响所有者权益账面值的所有收益和损失都已包含在净收益数据中,即各期之间的所有者权益账面值的变化等于净收益减去股利支付。)会计方法,则不难证明,上述等式可以改写为:,其中:Bt=第t 期的所有者权益账面值;Et.=根据第t 期的信息所进行的预测;NIt+i=第t+i期的净收益;re=权益资本成

26、本;ROEt+i=第t+i期的净资产收益率(这里的ROEt+i计算公式为NIt+i/Bt+i-1)。股票价格等于账面价值+权益增加值(实际收益能力超过权益资本成本的部分),2023/9/21,上述等式以一种无穷期限的方式来预测企业价值,但在实际计算过程中,我们必须确定有限的预测期,对于预测期之外的收益流,则以一个终值(terminalvalue)来反映。为此,我们采取如下公式来计算企业的权益资本成本:,2023/9/21,预测区间一般为12 期(即T=12),并假设第12 期之后的ROE 一直维持在行业平均ROE水平上,即从长期来看,企业的收益水平将与行业平均水平趋同,这个假设与微观经济学中的

27、厂商长期利润平均化的理论相符。同时,假设第t+4 期至第t+11 期的ROE 向行业平均ROE 直线回归。在计算行业平均ROE 时,我们采用上海和深圳证券交易所的分类方法,将所有上市公司分成21 类行业。行业平均ROE 为1991 2000 年间同行业所有公司的平均ROE。在计算时,舍弃了亏损年份的ROE,因为从长期来看,亏损公司最终要退出该行业,从而盈利年份的ROE 能够更好反映行业长期均衡收益率。同时,应剔除个别异常的年收益率数据(如剔除了某公司某年6000%的净资产收益率)。,2023/9/21,(九)民营上市公司数据库(重点),1.数据库结构与字段定义。2.1例题:浙江民营上市公司民营

28、化途径分析;浙江民营上市公司控股股东的现金流量权和控制权分析,2023/9/21,2.2例题:在2007年的上市公司中找出由创始家族控制的上市公司,它应当具有如下特征:(1)它是民营上市公司;(2)创始家族上市公司应当是通过IPO方式上市;(3)公司的CEO是创始人或者创始人的亲属;(4)创始家族所拥有的股权比例为总股权的10%以上;(5)董事会成员中创始家族成员所占的比例高于一定标准。前两个条件必须满足,后三个条件可以选择其中之一满足。,2023/9/21,2.3 创始家族上市公司与非创始家族上市公司的信息披露质量的中位数比较。,2023/9/21,专题四:数据分析软件及其应用,常用数据分析

29、软件数据分析软件的选择学习数据分析软件应注意的问题,2023/9/21,4.1 常用数据分析软件,SPSS(statistical package for social sciences)在方差分析和多元统计分析方面功能突出,有强大的图形功能。许多初学者都喜欢SPSS,因为它非常容易使用(以及误用)。SAS(statistical analysis system)由于其功能已经远远超出了统计分析的范围,“SAS”已经变成一个单纯的商标。其强大的功能和可编程性使其成为超级用户的首选。其特点是功能强大,但是也较难以掌握。EXCEL:提供包括描述统计、概率计算、假设检验、方差分析和回归分析等多种统计

30、功能,但是处理复杂计算(如缺失值问题)误差较大STATA:在回归分析和回归诊断部分功能非常强大,几乎能估计统计学和计量经济学的所有回归模型,而在多元统计分析方面功能稍弱。,2023/9/21,4.2 软件的选择,对于一些具体的实际问题可能有的软件会比其他软件更合适。如,你在进行一些多元统计分析时可能会选择SAS,处理抽样调查数据时可能会选择STATA,做方差分析时可能会选择SPSS,进行统计应用开发时会选择SAS。因此这些软件最好都纳入你的工具箱中。作为入门的软件,易学易用的SPSS可能是较好的选择,一开始学习复杂的统计软件可能令人沮丧。EXCEL为我们处理数据和对数据进行初步分析提供了良好的

31、条件。许多用户喜欢用EXCEL准备数据,然后用专门的统计软件进行统计分析,有时候还会把结果转回EXCEL中作图。,2023/9/21,4.3 学习使用统计软件的几点建议,正确使用统计软件和分析方法。使用软件获得分析结果易如反掌,但是获得正确结果并不容易。不要试图立即搞清软件的全部输出结果。不要不加分析地把软件的全部输出结果直接复制到分析报告中,大部分输出结果可能对你研究的问题是不必要的。学习统计软件的最好方法是在应用中学习。软件的帮助文件是软件最好的说明书。,2023/9/21,EXCEL数据分析工具的使用,(1)通过工具选项加载“分析工具库”(有随身光盘);或者在安装office时选择自定义

32、安装,再选中“选择应用程序的高级自定义”选择框,选择下一步,会弹出一个对话框,在EXCEL的加载宏中把“分析工具库”的安装方式改为“从本机运行”。(2)如果你的电脑上面没有“分析工具库”,可以在安装了“分析工具库”的电脑中找到一个名为“Analysis”(一般路径为“C:Program FilesMicrosoft OfficeOffice11LibraryAnalysis”),将其拷贝到U盘上。需要使用“分析工具库”时双击运行文件夹中的ANALYSIS32.XLL就可以了。,2023/9/21,建议阅读参考书,毛炳寰,用EXCEL和SPSS学习统计学,北京:中国财政经济出版社,2005年9月第1版李怀祖,管理研究方法论,西安:西安交通大学出版社,2004年1月第2版(管理类研究生、博士生必读),

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号