统计学案例集.doc_三一办公31ppt.com

资源描述

《统计学案例集.doc》由会员分享，可在线阅读，更多相关《统计学案例集.doc（48页珍藏版）》请在三一办公上搜索。

1、统计学教学案例集统计学精品课建设小组2004年11月【案例一】全国电视观众抽样调查抽样方案一、调查目的、范围和对象1.1 调查目的准确获取全国电视观众群体规模、构成以及分布情况；获取这些观众的收视习惯，对电视频道和栏目的选择倾向、收视人数、收视率与喜爱程度，为改进电视频道和栏目、开展电视观众行为研究提供新的依据。1.2 调查范围全国31个省、自治区、直辖市(港澳台除外)中所有电视信号覆盖区域。1.3 调查对象全国城乡家庭户中的13岁以上可视居民以及4-12岁的儿童。包括有户籍的正式住户也包括所有临时的或其他的住户，只要已在本居（村）委会内居住满6个月或预计居住6个月以上，都包括在内。不包括住

2、在军营内的现役军人、集体户及无固定住所的人口。二、抽样方案设计的原则与特点2.1 设计原则抽样设计按照科学、效率、便利的原则。首先，作为一项全国性抽样调查，整体方案必须是严格的概率抽样，要求样本对全国及某些指定的城市或地区有代表性。其次,抽样方案必须保证有较高的效率，即在相同样本量的条件下，方案设计应使调查精度尽可能高，也即目标量估计的抽样误差尽可能小。第三，方案必须有较强的可操作性，不仅便于具体抽样的实施，也要求便于后期的数据处理。2.2 需要考虑的具体问题、特殊要求及相应的处理方法2.2.1 城乡区分城市与农村的电视观众的收视习惯与爱好有很大的区别。理所当然地应分别研究，以便于对比。最方便

3、的处理是将他们作为两个研究域进行独立抽样，但代价是，这样做的样本点数量较大，调查的地域较为分散，相应的费用也就较高。另一种处理方式是在第一阶抽样中不考虑区分城乡，统一抽取抽样单元（例如区、县），在其后的抽样中再区分城、乡。这样做的优点是样本点相对集中，但数据处理较为复杂。综合考虑各种因素，本方案采用第二种处理方式。在样本区、县中，以居委会的数据代表城市；以村委会的数据代表农村。2.2.2 抽样方案的类型与抽样单元的确定全国性抽样必须采用多阶抽样，而多阶抽样中设计的关键是各阶抽样单元的选择，其中尤以第一阶抽样单元最为重要。本项调查除个别直辖市及城市外，不要求对省、自治区进行推断，从而可不考虑样本

4、对省的代表性。在这种情况下，选择区、县作为初级抽样单元最为适宜。因为全国区、县的总数量很大，区、县样本量也会比较大，因而第一阶的抽样误差比较小。另外对区、县的分层也可分得更为精细。本抽样方案采用分层五阶抽样。各阶抽样单元确定为：第一阶抽样：区（地级市以上城市的市辖区）、县（包括县级市等）；第二阶抽样：街道、乡、镇；第三阶抽样：居委会、村委会；第四阶抽样：家庭户；第五阶抽样：个人。为提高抽样效率，减少抽样误差, 在第一阶抽样中对区、县采用按地域及类别分层。在每一层内前三阶抽样均采用按与人口成正比的不等概率系统抽样（PPS系统抽样），而第四阶抽样采用等概率系统抽样，即等距抽样，第五阶抽样采用简单随

5、机抽样。2.2.3 自我代表层的设立根据要求，本次调查需要对北京、上海两个直辖市以及广州、成都、长沙与西安四个省会城市进行独立分析，因而在处理上将这些城市（包括下辖的所有区、县）每个都作为单独的一层处理。为方便起见，以下把这样的层称为自我代表层。考虑到在这样处理后，全国其他区县在分层中的一些具体问题以及各地的特殊情况，将天津市也作为自我代表层处理。另外，鉴于西藏情况特殊，所属区县与其它省（自治区）的差别很大，因此也将它作为自我代表层处理。这样自我代表层共有8个，包括以下城市与地区：北京市、天津市、上海市；广州市、成都市、长沙市、西安市；西藏自治区。三、样本区、县的抽选方法3.1 全国区、县的调

6、查总体根据2001年的全国行政区划资料，全国（港澳台除外）共有787个市辖区，此外有5个地级市（湖州、东莞、中山、三亚、嘉峪关）不设市辖区，若将它们每个都视同一个市辖区，则共有792个区；全国共有1674个县（包括自治县及旗、自治旗、特区与林区等）、400个县级市,县级行政单位的总数为2074个，这中间包括福建省的金门县，不能进行调查，因此除金门县以外的所有2865个区、县(792个区及2073个县)构成此次调查的调查总体。3.2区、县分层为便于调查后的资料分类汇总及提高精度，应将全国区、县进行分层。分层可以按多种标识进行，从理论而言，分层标识应选取与调查指标相关程度较高的那些变量。在本次调查

7、中也就是应选取与观众收视行为、习惯与爱好等密切相关的变量。关于这方面已有一些相应的研究结果,例如观众的年龄、性别、文化程度、职业、居住地的生活习惯与气候等。不过注意到我们不可能按观众的个体来分类，只能按观众居住的区、县来分类。而对于区、县，许多表示人口特征（除人口总数）及经济文化发展指标（除所在省的人文发展指数及县的人均GPT）的资料都无法得到，经过多方研究，我们对区县的分层按以下两种标识进行。(1)地域我国幅员广大，各地经济、社会、文化与气候的地域差异极大，而所有这些因素都与电视观众的收视行为密切相关。我们首先将所有县按所在省（自治区、直辖市）的地理位置分成3大层13个子层，各省括号内的数字

8、为它们的人文发展指数(Human Development Index，简称HDI)，在全国的排位，参见附表。地域分层如表1：表1 全国区、县的地域分层大层所含省、自治区、直辖市第一大层（东部地区）子层10：上海(1)、北京(2)、天津(3)（每个都作为自我代表层）子层11：辽宁(5)、山东(9)子层12：江苏(7)、浙江(6)子层13：福建(8)、广东(4)、海南（13）第二大层（中部地区）子层21：黑龙江(10)、吉林(12)子层22：河北(11)、河南(18)、山西(16)子层23：安徽(20)、江西(23)子层24：湖北(14)、湖南(17)第三大层（西部地区）子层31：内蒙古(21)、

9、新疆(15) 、宁夏(26)子层32：陕西(25)、甘肃(28)、青海(29)子层33：重庆（22）、四川（24）子层34：广西（19）、云南(27)、贵州(30)子层30：西藏（自我代表层）需要说明的是以上划分的层，还考虑了其他一些因素，各省按联合国制定的标准计算的人文发展指数仅是考虑因素之一。例如，按人文发展指数，广西（第19位）实际上可划在第二大层（中部地区），但考虑到国家西部大开发的范围将广西划入西部地区，我们的划分与它一致，这样便于资料的汇总发布。又如海南，根据人文发展指数（第13位）放在第一大层稍为勉强，但是根据它的地理位置以及它以旅游为主业，就观众行为而言，与广东、福建划在一子层

10、内是合理的。(2)区、县类别同一大层的各市辖区与所隶属的城市的规模、在城市中的地理位置（市区或郊区）和居民成分构成（非农业人口占总人口的比例）有较大差异，各县也因经济文化发达程度有较大差异。我们将各大层中所有的区、县除已划为自我代表层的以外，（如下称抽样总体）分成以下5类，每类组成1个小层：一类区，二类区，县级市，一类县，二类县。全国抽样总体中所有区县共分成115=55个小层。其中区的划分标准为区中非农业人口占总人口的比例，比例高于标准的为一类区，比例低于标准的为二类区；县的划分标准为人均国内生产总值，高的为一类县，低的为二类县。区县划分类别的标准在三大层中各不相同，具体标准如下：区类别的划分

11、标准：东部地区与中部地区：非农人口在总人口中的比例大于或等于80%为一类区，小于80%为二类区；西部地区：非农人口在总人口中的比例大于或等于70%为一类区，小于70%为二类区。县类别的划分标准：东部地区：人均GDP在5000元以上为一类县；5000元以下为二类县。中部地区：人均GDP在4000元以上为一类县；4000元以下为二类县。西部地区：人均GDP在3000元以上为一类县；3000元以下为二类县。3.3自我代表层的区、县情况根据最新行政区划，自我代表层中的7个城市所辖的区、县构成情况如表1。表2 自我代表城市的辖区、县构成城市一类区二类区直辖市中的县及其它县级市县总计北京市855-18

12、天津市774-18上海市973-19广州市552-12成都市524819长沙市23139西安市440513西藏自治区包括1个地级市（拉萨市，下辖一个城关区）、一个县级市（日喀则市）及71个县。3.4 抽样总体区县情况按3.2划分标准，全国除自我代表层以外的抽样总体各小层的区、县数及人口在（抽样总体）总人口中的比例如表3与表4所示。表3 抽样总体中各小层的区县数地域子层一类区二类区县级市一类县二类县合计东部地区114362471968239东部地区123047533137198东部地区132441515942217中部地区215626403632190中部地区22396756140148450中

13、部地区232634193195205中部地区242044394269214西部地区31278349161221西部地区3211161551131224西部地区33542145585201西部地区3419273074175325合计3004143986299432684表4 抽样总体各小层人口占总人口的比例（%）地域子层一类区二类区县级市一类县二类县合计东部地区111.35122.27663.17280.76723.629511.1972东部地区120.69921.64873.88321.41052.28099.9226东部地区130.5083 1.2187 3.4437 2.3497 1.71

14、50 9.2354 中部地区211.0200 0.5023 1.7709 1.1035 1.0037 5.4004 中部地区220.9263 1.9128 2.7858 4.5291 6.3593 16.5133 中部地区230.5272 1.1800 1.0682 1.1637 4.9385 8.8776 中部地区240.6106 1.5928 2.5415 2.2757 3.2519 10.2726 西部地区310.4343 0.2219 0.7319 1.2265 1.3692 3.9838 西部地区320.2976 0.5513 0.4257 0.7233 3.0567 5.0546

15、西部地区330.1454 2.1132 0.9581 1.8715 3.8961 8.9843 西部地区340.3629 0.9478 1.3254 2.6499 5.2722 10.5582 合计6.8831 14.1662 22.1072 20.0705 36.7730 100.00003.5 区、县的抽样方法及样本量抽样总体中各层（指小层,下同）内对区、县的抽样采用按人口的PPS系统抽样，样本量一般为2；少数人口较多的小层样本量定为3。样本量的具体分配见表5。样本区、县总量为121个。表5 各小层的区县样本量的分配地域子层一类区二类区县级市一类县二类县合计东部地区112332212东部地

16、区122232211东部地区132232211中部地区212222210中部地区222233313中部地区232222311中部地区242222210西部地区312222210西部地区322222311西部地区332222311西部地区342222311合计2223262327121四、抽样总体中样本区、县内的抽样方法4.1 样本区内的抽样每个一类样本区内采用街道（镇）、居委会、家庭户及个人的4阶抽样；每个二类样本区内采用街道（乡、镇）、居（村）委会、家庭户及个人的4阶抽样,样本量皆为90。具体方法如下。4.1.1 对街道（乡、镇）的抽样样本区内对街道（乡、镇）抽样采用按人口的PPS系统抽样，

17、每个样本区抽3个街道（乡、镇），其中一类区不抽乡。4.1.2 对居委会的抽样样本街道、镇（乡）内对居（村）委会的抽样采用按人口的PPS系统抽样，每个样本街道、镇、乡各抽2个居（村）委会（其中一类区不抽村委会）。为操作方便，这里的人口数也可用户数。4.1.3 对家庭户的抽样样本居（村）委会内对家庭户的抽样采用随机起点的等概率系统抽样，即等距抽样。每个居（村）委会固定抽取15户。在抽样时，必须首先清点居（村）委会管辖范围内的实际家庭户数,且规定排列的顺序。4.1.4 样本户内具体调查对象的确定对每个被抽中的样本户，在13岁以上（含13岁）的成员中，完全随机地确定一名为具体调查对象。为确保家庭成员中

18、的每一个这样的成员都有相等的概率被抽中，采用二维随机表来确定。表 6 确定户内调查对象的二维随机表序号姓名性别年龄1234567891011121111111111111221211221121233211322131234413223143241554123412354266315243514627714362525743884571263753199514382765281010359417286941111615104983276121272941161831054.2 样本县（县级市）内的抽样每个样本县内采用乡（镇）、村（居）委会、家庭户及个人的4阶抽样，样本量为60。具体方法如下。4

19、.2.1 对乡、镇的抽样确定县城所在的镇（城关镇）为必调查镇，对其余乡（镇）采用按人口的PPS系统抽样，再抽2个乡（镇），每个样本县共调查3个乡（镇）。4.2.2 对村（居）委会的抽样在每个城关镇中用按人口PPS抽样抽取2个样本居（村）委会。对其它两个样本乡、镇内，也用同样的方法抽2个村委会。为操作方便,这里的人口数也可用户数。4.2.3 对家庭户的抽样样本村（居）内对家庭户的抽样与样本居委会内对家庭户的抽样完全相同，仍采用随机起点的等概率系统抽样，即等距抽样。每个村（居）固定抽取10户。4.2.4 具体调查对象的确定在样本户中确定具体对象的方法与4.1.4中情形完全相同，即用二维随机表来确定

20、。4.3 儿童样本的确定在城乡每个样本户中，除抽取一位13岁以上的观众作为调查对象外，如果还有412岁的儿童，则需要抽取1位进行儿童观众的调查。如果符合年龄的条件多于1位，则仍按二维随机表的方法确定。对于自我代表的7个城市中，为保证儿童的样本量，对每个样本户，调查所有满足年龄的儿童。五、自我代表层中的抽样方法5.1 自我代表城市的抽样方法每个需要进行推断的城市皆作为自我代表层，在层内也进行分层抽样，层的划分标准与其它子层中的区、县标准基本相同。只不过不再对县分类，且将县级市（仅长沙市有一个）也作为一般县处理。这样每个城市皆分为一类区、二类区及县三层。考虑到上海市浦东新区的特殊性(既包括完全城

21、市化的市区,也包含相当广泛的农村)，将该区作为自我代表层处理。考虑到在一个城市范围内的调查，交通比较方便，故为提高效率，根据每个城市的实际情况，保证（或适当增加）样本区的数量，减少每个样本区、县内的的样本量。每个样本区县规定都抽2个街道(乡、镇)，每个样本街道、乡、镇抽2个居（村）委会。样本区内每个居（村）委会样本量仍为本15户，样本县（县级市）内每个村（居）委会样本量仍为10户。如果有可能,对一类区也可不对区进行抽样，直接对街道进行抽样。根据每个必调查城市所属的区县数，确定样本区、县数如下表（表中的数字为样本区、县数，括号中的数字为每个区、县的样本户数）：表7 自我代表城市的样本量城市一

22、类区二类区县总样本量北京市4(60)2(60)2(40)440天津市3(60)2(60)2(40)380上海市4(60) 3(60)2(40)500广州市3(60)2(60)2(40)380成都市3(60)2(60)2(40)380长沙市2(60)3(60)2(40)380西安市4(45)2(60)2(40)380总计13209605602840其中浦东新区在商业区抽一个街道,在农业区抽一个镇。成都、西安两市由于一类区数量较少，故对一类区进行全数调查，其中西安市每个一类区中抽1个街道，每个街道抽3个居委会。若有条件在每个区中直接抽3个居委会最好。5.2 西藏自治区的抽样方法西藏自治区的抽样也采

23、用分层抽样法，其中拉萨市城关区抽4个居委会,日喀则市除城关镇外,再抽两个乡镇,共6个居(村)委会。以上两市均作为自我代表层，每层各抽取60户；其余71个县则采用按人口的PPS抽样抽2个县，每个县调查40户。西藏自治区总样本量为200户。六、总样本量与抽样误差的估计6.1 总样本量根据前述抽样设计，本方案13岁以上观众总的样本量为：1）自我代表层共28402003040户，其中区样本为2400户，县样本为640户。2）抽样总体分11个子层，55个小层，样本区县共121个，其中样本区45个，样本县（县级市）76个。每个样本区抽90户，故区样本为4050户；每个样本县抽60户，县样本共4560户，共

24、计8610户。3）全国总样本量为11650户，其中区样本为6390户，县样本为5260户。 6.2 抽样误差的估计本方案的设计效应deff估计为2.0, 相当于简单随机抽样的样本量n0 =5825, 在95%置信度下比例型目标量的绝对误差限d，经计算约为 1.28%。七、目标量的估计及其方差估计根据方案设计，（小）层内样本是近似自加权的，因此层目标量的估计及其方差估计较为简单。而地区（大层）与全国目标量的估计则可用表4中的人口比例为权加权并汇总自我代表层得出，相应的方差估计也随之可得。具体公式另给。参考文献1 冯士雍，倪加勋，邹国华，抽样调查理论与方法，中国统计出版社，1998.2 中华人民

25、共和国民政部编，中华人民共和国行政区划简册，中国地图出版社，2001。3 联合国开发计划署，中国人类发展报告-1999，中国财政经济出版社，19994 胡鞍钢, 邹平等，中国发展报告社会与发展中国社会发展地区差距研究，浙江人民出版社，2000。5 L. 基什（L.Kish）著，倪加勋等译，抽样调查，中国统计出版社，1997。附表： 1997年全国各省市人类发展指数 (HDI)省、市自治区平均预期寿命指数教育指数国内生产总值指数人类发展指数人类发展指数排位上海0.8320.8240.9750.8771北京0.7980.8400.9630.8672天津0.7890.8100.9570.8523广

26、东0.7920.7890.9490.8434辽宁0.7540.8010.9390.8315浙江0.7800.7350.9490.8216江苏0.7730.7350.9450.8177福建0.7260.7370.9440.8028山东0.7600.7020.8490.7709黑龙江0.7000.7900.8090.76610河北0.7560.7590.6760.73011吉林0.7160.8040.6100.71012海南0.7500.7450.6320.70913湖北0.7040.7610.6550.70714新疆0.6270.7730.6560.68515山西0.7330.7820.5220

27、.67916湖南0.6990.7760.5110.66217河南0.7530.7450.4870.66118广西0.7290.7410.4780.64919安徽0.7410.7130.4820.64620内蒙古0.6780.7400.5170.64521重庆0.6890.7270.4890.63522江西0.6850.7640.4550.63523四川0.6890.7230.4410.61724陕西0.7070.7410.4040.61725宁夏0.6990.6690.4400.60326云南0.6420.6650.4420.58327甘肃0.7040.6670.3390.57028青海0.5

28、930.5450.4450.52829贵州0.6550.6590.2330.51630西藏0.5770.4350.3450.45231【案例二】请对下面的问卷客观地评价汽油的销售本次调查由国家汽油代理商组织，希望更多地了解消费者购买汽油时的期望。所有信息都会被保密。表格填好后请返回给我们。1 姓名和地址2 年龄和性别3 婚姻状况4 年龄状况：21岁以下 2140岁 4060岁 60岁以上5 大多数汽油是由您购买的还是您的妻子买的？6 去年您买了多少汽油？5000升以上 500010000升 100002000升 20000升以上7 您的汽油油箱容积多大？8 在您选购汽油时，价格的重要程度

29、如何？9 请您尽可能充分地陈述什么原因使得您购买一种品牌的汽油而不买另外一种？10.您喜欢那些免费提供礼物的加油站,是不是?11.当您用车执行公务时,您将获赠的礼物或赠券留给自己,还是上交给您的雇主?12.您每年行驶的里程是长是短?谢谢您的合作。根据您对上述问题的回答，重新起草上面的调查问卷。【案例三】某市造纸行业产品产量与结构分析某市造纸业在“十五”期间的产品产量、原材料消耗量、专用设备技术状况以及调查预测的2006年各类产品的需求量等资料如下：表1 “十五”期间各类产品产量单位：万吨产品名称产量预测的1996年需求量2001年2005年印刷用纸6.510.513.39书写用纸5.0

30、4.96.86技术配套用纸0.71.11.33包装用纸5.98.210.12其他用纸1.12.03.33生活用纸7.51331.56纸板6.211.428.78 其中：白纸板0.40.61.23箱纸板1.32.04.32 挂面纸板0.050.51.20 瓦楞纸板 2.32.47.89合计26.739.766.59表2 “十五”期间主要原材料消耗量单位：万吨原材料原材料消耗量2001年2005年木浆5.56.7苇浆2.83.6蔗渣浆0.91.2竹浆0.40.5废纸浆4.18.6麻、布、棉浆1.83.2禾草浆9.915.6其他浆0.71.0合计26.140.4表3 专用设备技术状况

31、单位：台专用设备合计国际水平国内先进水平国内一般水平国内落后水平磨木机 531蒸球19011674蒸锅5122造纸设备170343124 要求：根据以上资料，对该市造纸行业的产品产量和结构进行分析。分析方法说明：（1）对产品产量与结构进行分析，首先需要利用数字资料描述产品产量及其结构现状以及发展趋势，其次根据一定的研究目的分析产品结构的合理性。（2）分析研究可以采用静态分析与动态分析相结合的办法。静态分析主要是研究产品结构的现状，分析当前的产品结构是否满足社会需要，是否适应现有的生产力发展水平，从中确定哪些是合理的，哪些是不合理的；同时通过动态分析，反映产品结构演变的历史过程，预测产品结

32、构将沿着什么方向发展，这种发展是否适应经济发展的客观需要。在研究过程中，要结合本地区或本企业的实际情况，如原材料供应、设备状况、技术力量、企业管理水平等，进行多因素的对比分析，找出调整产品结构与提高产品产量的症结所在，并提出切实可行的措施。【案例四】时间序列分析在经济预测中的应用一、案例简介为了配合统计学课程时间序列分析部分的课堂教学，提高学生运用统计方法分析解决实际问题的能力，我们组织了一次案例教学，其内容是：对烟台市的未来经济发展状况作一预测分析，数据取烟台市19781998年国内生产总值（GDP）的年度数据，并以此为依据建立预测模型，对1999年和2000年的国内生产总值作出预测并检

33、验其预测效果。国内生产总值是指一个国家或地区所有常住单位在一定时期内生产活动的最终成果，是反映国民经济活动最重要的经济指标之一，科学地预测该指标，对制定经济发展目标以及与之相配套的方针政策具有重要的理论与实际意义。在组织实施时，我们首先将数据资料印发给学生，并讲清本案例的教学目的与要求，明确案例所涉及的教学内容；然后给学生一段时间，由学生根据资料，运用不同的方法进行预测分析，并确定具体的讨论日期；在课堂讨论时让学生自由发言，阐述自己的观点；最后，由主持教师作点评发言，取得了良好的教学效果。经济预测是研究客观经济过程未来一定时期的发展变化趋势，其目的在于通过对客观经济现象历史规律的探讨和现状的研

34、究，求得对未来经济活动的了解，以确定社会经济活动的发展水平，为决策提供依据。时间序列分析预测法，首先将预测目标的历史数据按照时间的先后顺序排列成时间序列，然后分析它随时间的变化趋势及自身的统计规律，外推得到预测目标的未来取值。它与回归分析预测法的最大区别在于：该方法可以根据单个变量的取值对其自身的变动进行预测，无须添加任何的辅助信息。本案例的最大特色在于：它汇集了统计学原理中的时间序列分析这一章节的所有知识点，通过本案例的教学，可以把不同的时间序列分析方法进行综合的比较，便于学生更好地掌握本章的内容。二、案例的目的与要求（一）教学目的1 通过本案例的教学，使学生认识到时间序列分析方法在实际

35、工作中应用的必要性和可能性；2 本案例将时间序列分析中的水平指标、速度指标、长期趋势的测定等内容有机的结合在一起，以巩固学生所学的课本知识，深化学生对课本知识的理解；3 本案例是对烟台市的国内生产总值数据进行预测，通过对实证结果的比较和分析，使学生认识到对同一问题的解决，可以采取不同的方法，根据约束条件，从中选择一种合适的预测方法；4 通过本案例的教学，让学生掌握EXCEL软件在时间序列分析中的应用，对统计、计量分析软件SPSS或Eviews等有一个初步的了解；5 通过本案例的教学，有助于提高学生运用所学知识和方法分析解决问题的能力、合作共事的能力和沟通交流的能力。（二）教学要求1 学生必须

36、具备相应的时间序列分析的基本理论知识；2 学生必须熟悉相应的预测方法和具备一定的数据处理能力；3 学生以主角身份积极地参与到案例分析中来，主动地分析和解决案例中的问题；4 在提出解决问题的方案之前，学生可以根据提供的样本数据，自己选择不同的统计分析方法，对这一案例进行预测，比较不同预测方法的异同，提出若干可供选择的方案；5 学生必须提交完整的分析报告。分析报告的内容应包括：选题的目的及意义、使用数据的特征及其说明、采用的预测方法及其优劣、预测结果及其评价、有待于进一步改进的思路或需要进一步研究的问题。三、数据搜集与处理时间序列数据按照不同的分类标准可以划分为不同的类型，最常见的有：年度数据、

37、季度数据、月度数据。本案例主要讨论对年度数据如何进行预测分析。考虑到案例设计时的侧重点，本案例只是对烟台市国内生产总值进行预测，故数据的搜集与处理过程相对简单。我们通过查阅烟台统计年鉴、烟台五十年等有关的资料获得烟台市19492000年23年的国内生产总值资料数据（原始数据详见表3）。该指标是反映国民经济发展情况最重要的指标之一，我们选择该指标进行预测具有较强的实用价值。此外，预测的方法具有普遍的适用性，使用者也可以将其应用于其它的研究领域。资料数据是预测的依据和基础，一般是根据确定的预测目标及影响因素搜集有关的资料和数据，并结合初步拟定的预测模型，对所搜集的数据进行分析和处理，然后再选取适当

38、的预测模型。我们可以将整个数据处理过程概括如下，见图1。明确预测目的确定预测内容收集和整理资料选择预测方法结果是否合理计算预测结果推荐预测结果进行综合评价精度的约束时间的约束资金的约束YN图1 经济预测流程图四、建议使用的预测分析方法（一）确定性时间序列分析法1 指标法：平均增长量法、平均发展速度法；2 趋势预测法：移动平均法、指数平滑法、曲线拟合法。（二）随机性时间序列分析法1 ARIMA模型预测；2 组合模型预测。五、案例分析过程（一）确定性时间序列分析法1 平均增长量法该方法是利用历史资料计算出它的平均增长量，然后再假定在以后各期当中，它仍按这样一个平均增长量去增长，从而得出在

39、未来一段时期内的预测值。根据烟台市的国内生产总值1949年1998年的观察值，我们计算出GDP的平均增长量为150647.69万元（水平法）和38437.81万元（总和法），利用其对烟台市1999年和2000年的GDP值进行预测并与实际GDP值1 1999年为8010000万元，2000年为8700000万元。比较，结果见表1。表1 平均增长量法预测结果1999年2000年GDP预测值（万元）预测相对误差（%）GDP预测值（万元）预测相对误差（%）水平法7550647.75.697701295.412.44累计法7438437.87.107476875.615.00教师点评：平均增长量法不仅得

40、到了GDP数据未来取值的预测值，而且还让学生更加深刻地认识到平均增长量在计算时水平法与总和法的区别所在，图1较明显地反映出平均增长量计算水平法与累计的区别，即水平法仅考虑首尾年份的数值，而不考虑中间年份的数值变化，因而有；而总和法则考虑了整个样本区间上的总体变化情况，有，从而图2中A的面积和B的面积应该相等。A图2 由平均增长量推算出的时间序列变化图2 平均发展速度法该方法就是利用时间序列资料计算出它的平均发展速度，然后再假定在以后各期当中，它仍按这样一个平均发展速度去变化，从而得出时间序列的预测值。我们计算出GDP在1978年1998年间的平均发展速度为118.277%（几何法）和118.170%（方程法）2 在该问题中几何法与方程法计算出的平均发展速度差别不大。，利用其对烟台市1999年和2000年的GDP进行预测得到结果见表2。表2 平均发展速度法预测结果1999年2000年GDP预测值（万元）预测相对误差（%）GDP预测值（万元）预测相对误差（%）几何法8364664-4.479455081.6-7.

展开阅读全文