单变量描述统计.ppt

上传人:牧羊曲112 文档编号:6222184 上传时间:2023-10-06 格式:PPT 页数:41 大小:371.50KB
返回 下载 相关 举报
单变量描述统计.ppt_第1页
第1页 / 共41页
单变量描述统计.ppt_第2页
第2页 / 共41页
单变量描述统计.ppt_第3页
第3页 / 共41页
单变量描述统计.ppt_第4页
第4页 / 共41页
单变量描述统计.ppt_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《单变量描述统计.ppt》由会员分享,可在线阅读,更多相关《单变量描述统计.ppt(41页珍藏版)》请在三一办公上搜索。

1、资料的统计与初步分析(之一),单变量描述统计,一、单变量统计类型,二、描述统计(一)集中趋势分析 1、频数分布与频率分布主要适用于定类尺度变量的描述,单变量分析,2、集中趋势分析的概念:是用一个典型值或代表值来反映数据的一般水平,或者说反映这组数据向这个典型值集中的情况。3、常用集中量数,(二)离散趋势分析 1、含义 2、常用离中量数,(三)相关操作如何利用SPSS生成频数/频率表实例:对变量“文化程度”进行频数统计。操作步骤:单击AnalyzeDescriptive StatisticsFrequencies,此时会出现Frequencies对话框:,将变量“文化程度”从对话框左边的变量列表

2、选入右边的方框内点击OK,便可得到如下频数与频率表。,统计表中的英中文对译:Frequency:频次Percent:百分比Valid Percent:有效百分比Cumulative Percent:累计百分比Valid:有效值Missing:缺失值Total:合计,如何利用SPSS求集中量数实例:求“年龄”这一变量的集中量数。操作步骤如下:第一步:单击AnalyzeDescriptive StatisticsFrequencies,此时会出现Frequencies对话框,将变量“年龄”从对话框左边的变量列表选入右边的Variable(s):框内OK,如下图所示:,第二步:单击“Statisti

3、cs”按钮,出现如下对话框:,第三步:根据需要选择集中趋势统计量由于“年龄”是一个定距级以上的变量,所以从理论上讲刚才所介绍的集中量数都可以选择。不过实务操作中一般不选Mode和Sum(请同学们思考这是为什么)。第四步:单击“Continue”“OK”即可。,统计表中的英中文对译:Percentile Values(百分位计算)框Quartiles(四分位数)Cut points for:equal groups(若干等分位数,默认为10分位数)Percentile(s):不定分位数,如求第5%和95%位置上的值。Central Tendency(集中趋势测量的统计量)框Mean(均值)Med

4、ian(中位数)Mode(众数)Sum(总和),如何利用SPSS求离中量数实例:求“年龄”这一变量的离中量数。操作步骤如下:第一步:操作与前面所讲的求“年龄”这一变量的集中量数完全相同。第二步:操作与前面所讲的求“年龄”这一变量的集中量数完全相同。统计表中的英中文对译:Dispersion(离散趋势测量的统计量)框Std.deviation(标准差)Variance(方差)Range(全距)Minimum(最小值)Maximum(最大值)(均值的标准误)第三步:根据需要选择离散趋势统计量由于“年龄”是一个定距级以上的变量,所以从理论上讲刚才所介绍的离中量数都可以选择。不过实务操作中一般不选异众

5、比率(请同学们思考这是为什么)。第四步:单击“Continue”“OK”即可。,实训,单变量描述统计上机操作。,资料的统计与初步分析(之二)单变量推论统计之区间估计,区间估计1、含义 就是在一定的可信度(置信度)下,用样本统计值的某个范围(置信区间)来“框”住总体的参数值。2、常用的置信度:90%,95%、99%,对应的允许误差分别为10%,5%,1%。置信度P1,3、总体均值的区间估计公式:样本均值 置信度为 所的Z值 S 样本标准差 N 样本规模,例1:调查某厂职工的工资状况,随机抽取900名工人作样本,调查得到他们的月平均工资为186元,标准差为42元。求在95%的置信度下,全厂职工的月

6、平均工资的置信区间是多少?,学生练习:,从某工厂随机抽取400名工人进行调查,结果表明女工的比例为20%,现在要求90%的置信度下,估计全厂工人中女工比例的置信区间。,4、总体百分比的区间估计公式:P样本中的百分比,例:调查某厂职工的工资状况,随机抽取900名工人作样本,调查得到他们的月平均工资为186元,标准差为42元。求在95%的置信度下,全厂职工的月平均工资的置信区间是多少?,课堂练习,1、根据居民区100户抽样家计调查,居民用于食品费用占总收入的比例平均为75,比例的标准差为20,求食品费用占居民总收入比例的区间估计(置信度为95时)。,资料的统计与初步分析(之三)单变量推论统计之假设

7、检验,假设检验,1、假设含义:此是指和抽样手段联系在一起,并且依靠抽样调查的数据进行验证的经验层次的假设,即统计假设。(与理论假设不同)2、假设检验:就是先对总体的某一参数作出假设,然后样本的统计量去进行验证,以决定假设是否为总体所接受。3、基本思想依据:小概率原理(即“小概率事件在一次观察中不可能出现”原理),4、步骤建立虚无假设(H:M=或P=)与研究假设(:或 P、)选择适当的显著性水平(即小概率的大小)=0.05、=0.01等。统计值的计算公式:Z Z=根据样本数据计算统计值,并根据显著性水平查出对应的临界值。比较统计值与临界值,若统计值的绝对值 或,则接受虚无假设:若 或,则接受研究

8、假设。,例如:(1)总体均值的假设检验某单位职工上月平均收入为210元,本月调查了100名职工,平均月收入为220元,标准差为15元。问职工总体的收入本月与上月相比有无变化?解:设H:M=210:210选择显著性水平=0.05,查Z检验表得Z 1.96根据样本数据计算统计值,代入公式得 Z 样本均值 M 原值(总体原均值)s 样本标准差 n 样本规模由于Z6.67Z 1.96,所以拒绝虚无假设,接受研究假设。即从总体上说,职工本月收入与上月收入有变化。,例如:(2)总体百分比的假设检验某校全体学生中抽烟比例为35%,经过戒烟宣传后,随机抽取100名学生进行调查,结果发现抽烟比例为25%。问戒烟

9、宣传有效吗?解:设H:P=0.35:P 0.35 选择=0.05,查Z检验表得Z 1.65统计值Z 由于 Z 1.65所以,拒绝虚无假设,接受研究假设。即戒烟宣传有效。,实训,单变量推论统计假设检验上机操作。,资料的统计与初步分析(之四)双变量相关分析,学习目标:培养资料的统计与分析能力,函数关系:事物之间具有完全确定的关系,即一一对应的关系。相关关系:一个变量发生变化时(或取不同值时),另外一个变量也随之发生变化(或取值也不同),反之也一样。A、方向:正相关:当两个变量的取值变化具有相同的变化的相关关系。负相关:当两个变量的取值变化具有相反方向变化相关关系。B、大小:利用相关系数因果关系:当

10、其中一个变量变化时,会引起或导致另外一个变量也随之发生变化,但是反过来,当后一个变量发生变化时,却不会引起前一个变量的变化。(是特殊的相关关系),一、变量关系类型,二、交互分类(Gross classification)【只适用于定类、定序变量】,交互分类表的形式要求:(1)规范简洁,最好不用竖线。(学术论文中常用三线表)(2)如果计算的是百分比,则要在表的下端用括号标出每一纵栏所对应的频数。(3)常以自变量作纵栏标题,以因变量作横行标题,并取纵栏%,即自变量为基准计算%。(4)两个变量的变量值应有所限制。不能同时具有多个变量值。如果变量值都多,那么可采将某些变量值进行合并的方法减少变量值,以

11、缩小交互分类的规模。,X检验的具体步骤:,建立两变量间无关系的假设,即两变量相互独立,互不相关。计算出X值。根据自由度df=(r-1)(c-1)和给出的显著性水平(值),查X分布表,得临界值。将计算出的X值与查得的临界值对比:若X值临界值,则进入否定域,称差异显著,并拒绝两变量独立的假设,即承认两变量间有关系;若X值临界值,则称差异不显著,并接受两变量独立的假设,即两变量间无关系。说明:X临界值,表明统计差异不在抽样误差允许的范围内,即总体实际上存在差异,相关,不独立;X临界值,表明统计差异是由抽样误差造成的,总体实际上无显著差异,不相关,无关系。,三、定序变量与定序变量之间的相关测量,1.G

12、amma系数(G或)公式:G(N-同序对,N-异序对)N=左上角频数右下角频数N=右上角频数左下角频数2.Gamma系数的检验Z检验Z检验的步骤:先将G值标准化为Z值,公式为:Z选择不同的显著性水平,并查Z检验表,假定0.05,检Z表得,Z=1.96。将计算所得的Z值与查得的Z进行对比。若Z Z,则进入否定域,说明在总体中两变量之间存在相关关系;若Z Z,则说明在总体中两变量之间不存在相关关系。,四、定类(序)变量与定距变量之间的相关测量,1.相关比率(Correlation Ratio)(记作E),又称Eta平方系数。,2.E的检验F检验法,五、定距变量与定距变量间的相关测量1.皮尔逊相关系

13、数(皮尔逊积差相关系数)(r),2r的检验F检验法和T检验法,相关操作,交互分析打开SPSSAnalyzeDescriptive StatisticsCrosstabs 将待分析的两个变量分别选入Row(s):与Column(s):框中,点击OK键即可得到交互分析表。,例如:性别与文化程度之间的关系分析。将性别与文化程度分别从左边的变量名列表中,选入右边的Row(s):与Column(s):框中,点击OK键,即可得到性别与文化程度的交互分析表。,统计的同时,还可以点击Statistics按钮,在对话框中选择Chi-square(卡方检验)。点continueOK,得卡方检验结果,如下表。,实训,双变量相关分析上机操作,小结,掌握变量关系类型,交互分析以及双变量相关分析上机操作。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号