《基本统计分析的报表制作.ppt》由会员分享,可在线阅读,更多相关《基本统计分析的报表制作.ppt(60页珍藏版)》请在三一办公上搜索。
1、第三章 基本统计分析的报表制作,第一节 Reports菜单名义、定序属于分类变量,用百分比表示定距、定比变量,报告分析(Report)主要针对定量资料产生记录报表,报告分析(Report),1、OLAP 在线分析处理过程(分层)2、Case Summaries 观测记录汇总分析过程3、汇总报告分析过程(1)Report Summaries in Rows 行形式汇总报告(2)Report Summaries in Column 列形式汇总报告,按AnalyzeReportsOLAP Cubes顺序单击打开如下对话框:,汇总变量框:进入此框变量为数值型变量,分层变量框:进入此框变量为数值型或字符
2、型变量,一、OLAP(在线分析处理过程)有助于我们对于数据更好的了解,可选择的统计量:Sum 总和Number of Cases 观测量数目Mean 均值 Standard Deviation 标准差Percent of Total Sum 占总和的百分比Percent of Total N 占观察量总数的百分比Medina 中位数Grouping Median 分组中位数Std.Error of Mean 均值标准误Minimum 最小值Maximum 最大值Range 范围First 首值Last 尾值Variance 方差 Skewness 偏度Std.Error of Skewness
3、 偏度的标准误Kurtosis 峰度Std.Error of Kurtosis 峰度的标准误Harmonic Mean 调和均数Geometric Mean 几何均数,标题 对话框,输入统计量的标题,输入注解,这些注解将显示在统计量输出栏的下面,例:不同文化群体游客的满意度统计,操作步骤:1)按AnalyzeReportsOLAP Cubes顺序单击打开OLAP Cubes对话框2)打开数据文件“案例”,将allsatisf变量选入Summary Variable框中,将citizen变量作为分组变量选入Grouping Variable 框中;3)单击Statistics按钮,在 Stati
4、stics框中选择Sum、Mean等项作为要输出的统计量;4)单击Title按钮,在Title框中输入“不同文化群体游客满意度分层报告”,单击Continue返回;单击OK,观测记录汇总,说明观测量的一些基本情况,包括总个数、有效值个数和缺省值个数。,输出结果及分析,上表是分层报告,输出了总和、均值等统计量。,Difference对话框,比较Anglo(1)和Asia(2)满意度的差异,可以选择多个分组变量,二、观测记录汇总分析过程,主要功能 计算指定变量的分组统计量,分组变量可能是一个,也可以有多个。如是多个,则将所有水平进行交叉组合。每个组中,变量值可以显示或不显示。观察记录汇总分析 按A
5、nalyzeReportsCase Summaries顺序单击打开Case Summaries 对话框。,可在参数框中输入数值,该数值表示分析过程只对前几个观测记录进行带有缺失值的观测记录不被显示在列出观测记录的同时,显示观测记录的序号,可选择一个或多个变量进入此框,分组变量可是数值型或短字符型变量。,Summarize CASES 对话框,见下页,输入脚注,在输出结果中显示各分组统计量的标题在分析过程中剔除带有缺失值的观测记录键入一个字符以便在输出结果中标记缺失值,输入标题,Options 对话框,例:对数据文件“案例”进行观测记录汇总分析。,1)打开Case Summaries 对话框 2
6、)打开数据文件“案例”,将allsatisf变量选入 Variable框中,作为汇总分析的变量,将citizen和sex变量选入grouping 框中作为分组变量。3)清除Display cases复选框。4)单击Statistics按钮,在 Statistics框中选择Number of cases、Mean、Median项作为要输出的统计量;单击Continue返回。5)单击OK,操作步骤,观测记录处理汇总,上表说明观测记录的总个数、有效值个数和缺省值个数以及各占的百分比。,输出结果及分析,交叉分组统计量,主要功能 把观测记录的统计结果用一种简单扼要的表格打印出来有助于更好的把握数据特征。
7、(一)行形式汇总报告按AnalyzeReportsReport Summaries in Rows顺序,打开Summaries in Rows 对话框。,三、汇总报告分析过程,将要分析的变量选入此框,每选一个变量进入框内,则需单击Format按钮,打开Format对话框,设置该变量输入格式。,进入该框中的变量作为分组变量,可有多个。选中变量后激活Summary、Options、Layout、Titles。,输出一个单独的观测记录列表。,只输出报告的第一页,Summarize in Rows 对话框,输入变量的列标题,不输入则将输出变量的标签或名称,选择列标题对齐的方式,选择变量值所处的位置以缩
8、进的形式输出,可输入缩进数值;变量值位于列中央,键入列宽数值,如不设列宽,则:如输出数值标签,则列宽为数值标签中的最长者;如输出变量值,则列宽为变量所定义的宽度;如设置了列标题,则列宽为标题的最长者;如未设置列标题,则列宽为输出的变量标签的最长者;,选择输出的内容:将输出变量值将输出变量标签,Format 对话框,输出列变量之和。输出列变量的均值。输出列变量中的最小值。输出列变量中的最大值。输出列变量中观测记录的数目。,输出列变量中高于Value框中设定值的观测量占总数的百分比输出列变量中低于Value框中设定值的观测量占总数的百分比输出列变量中位于Low和Hight框中设定值的观测量占总数的
9、百分比,输出标准差。输出输出峰度。输出方差。输出偏度。,Summary对话框,Report栏的Option 对话框,进行缺失值和输出页码的设置:剔除带有缺失值的观测记录输入一个代表系统的和用户的缺失值字符设置报告的起始页码,可进行页面设置:可输入分组变量间的间距行数(不超过20)每个分组变量都在新的一页输出在新的一页输出下一个分组变量,并接着上一页的页码输出下一页的页码输入设置分组标题和报告内容之间的间距,最多可插入20行空白,Break Column 中的Options对话框,所输数值表示报告的每一页输出从第几行开始所输数值表示报告的每一页输出在第几行结束规定每一页输出的左边间距规定每一页输
10、出的右边间距选择报告输出内容的对齐方式,设置页面的标题、脚注和页面的距离:设置标题与报告的距离设置注脚与报告的距离,决定分组变量显示的位置:所有的分组变量值均位于第一列,激活Indent an each break参数框在此框中设置分类变量值缩进的位置。默认为2空格,设置列标题的输出格式:在标题下添加下划线设置列标题下的空白行(默认为2)选择列标题的对齐方式,设置分组变量的显示位置:显示在统计量的上一行显示于统计量的同一行,并覆盖统计量标题设置分组变量与统计量之间的空白行数,Report栏的Layout对话框,按Next进入下一行的设置,按 Previous返回上一行,对齐方式,选择特殊变量的
11、值作为标题与注脚,在此对话框可规定标题与注脚的输出内容和格式,可设置最多10行,Report栏的Titles 对话框,(二)列形式汇总报告,列形式与行形式汇总报告不同在于,行变量为分组变量值,列变量为进行分析的变量。按AnalyzeReportsReport Summaries in Column 顺序,打开Summaries in Column 对话框。,Summaries in Column对话框,将要分析的变量选入此框,每选一个变量进入框内,则需单击Format按钮,打开Format(见下图)对话框,设置该变量输入格式。,1、Data Columns栏 1)Summary 对话框与行形式
12、基本同,不同是只能选择一个统计量 2)Format 对话框与行形式同 3)Insert Total按钮,按Summary按钮,出现Summary对话框,Insert Total按钮的Summary 对话框,选择要计算和的变量将其移入右边变量框,至少挑选2个变量。,在Summaries in Column 对话框中单击Insert Total按钮,新增Total变量,,1)Options对话框 2)Format对话框与“行形式”同 3)Sort Sequence拦:确定分组变量升降排序规则 4)Data are already sorted复选框,已将分组变量排序,Break Columns栏中
13、的Options对话框,显示每一类分组变量小计结果,在Label框中键入分组变量的标签,在此栏中设置页面:输入不超过20分组变量间的间距行数每个分组变量都在新的一页输出在新的一页输出下一个分组变量,并接着上一页顺序编写页码,在此栏中设置小计前的空白行数,3、Preview复选框:只输出报告的第一页,便于用户预览4、Report栏 Options如下图 Layout对话框与“行形式”同 Titles对话框与“行形式”同,Options对话框,在每一页的底部显示该列的总和,在Label框中键入标签剔除带有缺失值的观测量输入一个代表系统和用户的缺失值的字符设置报告的起始页,以数据文件“案例2.2.s
14、av”进行分析:先做行形式报告输出,再做列形式报告输出。,例题分析,1、单个分组变量的行形式报告按AnalyzeReportsReport Summaries in Rows顺序,打开Summaries in Rows 对话框。挑allsatisf变量进入Data框,citizen变量进入Break框。单击Break Columns栏的 Summary按钮,打开 Summary Lines for citizen对话框,选中Sum of Values、Number of Cases复选框,再按Continue返回 Summaries in Rows对话框。选中Display cases复选框。
15、单击Titles 按钮,打开Titles对话框,在标题栏的Center 框中输入标题“分组统计”,再按返回。单击“OK”完成,输出结果见下表。,观测记录分组报告,列出了按文化分组后的观测记录表,打开Summaries in Rows 对话框,挑allsatisf变量进入Data框,citizen、sex变量进入Break框。选中Break 栏中的sex变量,单击 Summary按钮,打开 Summary Lines for sex 对话框,选中Mean of Values、Number of Cases、Minimum Value和 Maximum Value 复选框,再按Continue返回
16、。选中Break 栏中的citizen变量,单击 Summary按钮,选中Mean of Values、Number of Cases复选框,再按Continue返回。单击“OK”完成,输出结果见表。,2、两个分组变量的行形式报告,多分组统计量(行形式),性别有缺失值有缺失值的记录单独为一组统计,性别有一个缺失值,无法计算标准差,3、两个分组变量的列形式报告,打开Summaries in Columns 对话框,挑allsatisf变量进入Data框,单击 Summary按钮,选中Mean of Values,再按Continue返。先后挑选sex、citizen 变量进入Break框。单击R
17、eport 栏中的Options对话框,选中Display grand total复选框,再按Continue返回。单击Titles 按钮,打开Titles对话框,在标题栏的Center框中输入标题“分组统计”,再按Continue返回。单击“OK”完成,输出结果见下表。,多分组均值表(列形式),行形式,4、多列分析报告,重复四次选择变量allsatisf,依次单击Summary按钮,选择统计量,第二节 Custom Tables 菜单,属于table模块,要另行购买,Tables模块可同时处理定量资料和分类资料,Tables 子菜单包含四个过程:Basic tables:可以针对定量资料,也
18、可以针对定性资料,功能非常强大。可以编制复杂的报表。General tables:可以在同一张表格里同时针对定量资料和定性资料进行汇总分析;可以对多选题数据进行分析。Multiple response tables:专门针对多选题进行的分析。Tables of frequencies:在同一张表格中同时对多个分类变量进行频数描述,第三节 多选题分析Multiple response菜单,多选题的三种情况,一种是任选几项,不限定选择项数;一种是限定最多选择几项,比如最多选择三项;第三种也是是限定选择的项数,但与排序相结合,比如依次选择三项,最重要,其次重要,第三重要。,第一种情况:不限定选择项数
19、时,多重二分法:为每一个选项定义一个变量,如果选中的则录入1,没有选择的则录入为0。有多少个选项则拆分出多少个变量来,因此选项异常多的情况下此种方法有点麻烦。,数据格式,在某次市场调查中收集了北京、上海和广州三个城市的受访者对几种常见饮料的喜好情况,可选的饮料有茶、牛奶、咖啡、果汁、矿泉水。请分析:1.受访人群中最受欢迎的饮料是哪种?2.男、女喜爱的饮料有无差异?3.三个城市的人群对饮料的喜好有无差异?,SPSS实现,AnalyzeMultiple Response,(1)定义多选题变量集 AnalyzeMultiple ResponseDefine Sets,(2)频数分析 AnalyzeM
20、ultiple ResponseFrequencies,(3)阅读结果,(4)制作列联表 AnalyzeMultiple ResponseCrosstabs,根据需要选择 Options 中的选项,多重分类法,例如:在市场调查中,我们希望了解目标人群对哪些品牌的信任度较高,在问卷中列出了 20 个品牌,让受访者从中选择他认为最著名的几个,最多列 5 个。20 个选 5 个,显然,绝大部分品牌被选中的频率都会较低,如果仍然使用多重二分法录入,则大部分数据都是 0,非常不方便。此时一般都会采用多重分类法的格式来记录数据。,多重分类法数据库格式,多重分类法数据库的分析与多重二分法大同小异。唯一的区别
21、在于定义多选题变量集时,变量编码按分类变量选择,并定义取值范围。,案例:皖南旅游区调查,将第二种格式数据转换为第一种,File-New-Syntax输入命令COUNTNew_attraction1=attraction1 attraction2 attraction14(1).New_attraction2=attraction1 attraction2 attraction14(1).New_attraction14=attraction1 attraction2 attraction14(1).EXECUTE,限定选择的项数+排序,第一赋值10,第二赋值7,第三赋值4,其余0均值、因子分析,