应用1随机抽样与数据显示.ppt

上传人:小飞机 文档编号:6279884 上传时间:2023-10-13 格式:PPT 页数:24 大小:890.50KB
返回 下载 相关 举报
应用1随机抽样与数据显示.ppt_第1页
第1页 / 共24页
应用1随机抽样与数据显示.ppt_第2页
第2页 / 共24页
应用1随机抽样与数据显示.ppt_第3页
第3页 / 共24页
应用1随机抽样与数据显示.ppt_第4页
第4页 / 共24页
应用1随机抽样与数据显示.ppt_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《应用1随机抽样与数据显示.ppt》由会员分享,可在线阅读,更多相关《应用1随机抽样与数据显示.ppt(24页珍藏版)》请在三一办公上搜索。

1、语言研究中的统计学()2009年4月,山西大学数学科学学院,1,第三章 数理统计基础,统计学的分类,2,统计以其功能可以分为两类:1、描述统计目的:对数据进行整理、归纳和总结,便于研究者把握期一般的特征和全貌。内容:特征数和统计图表2、推断统计目的:以概率论为基础通过样本对总体做出更科学的判断。内容:一方面根据样本特征值对总体进行推断或估计;另一方面估计或假设进行检验。,山西大学数学科学学院,第三章 数理统计基础,数据的基本分类,3,1、简单随机抽样2、分层随机抽样3、多级抽样,山西大学数学科学学院,第三章 数理统计基础,单机抽样,1、简单随机抽样,4,(1)抽签(2)随机数表法Step1 根

2、据总体规模确定随机数表中的实际分组大小Step2 从随机数表中任意一个地方开始,从左到右或从上到下顺序寻找,将有效数字记下来(重复的不再记),直到满足所需的样本容量为此。Step3 将所记的有效数字和实物(研究对象)对应,从而选取出样本。,山西大学数学科学学院,第三章 数理统计基础,随机数表,5,随机数表是由0-9十个数随机排列的若干组数字组成。,山西大学数学科学学院,第三章 数理统计基础,有效数字自然是不超过总体规模的数字。,随机数表,6,例如:我们要从450人(总体规模)中抽取一个20人(样本容量)的样本,我们将随机数表中每3个数(分组规模)分为一组。假如从第3行第2组的数字(26)开始,

3、从左到右选取,每3个数字为一个号,选取20个不重复的有效数字即可。结果如下:269,370,(602),235,(851),(513),(920),山西大学数学科学学院,第三章 数理统计基础,1、简单随机抽样,7,(3)系统随机抽样只要求所抽取样本的第一个单位按真正的随机方法进行选取,余后单位则按等距抽取(抽取间距的大小视样本的大小而定)。例如,从1000个英语句子中抽取50个作为样本加以研究,抽取间距为1000/50=20。首先从随机数表中选取一个不超过20的数字作为第一个单位,如18,则以后应抽取的句子数依次为38,58,78,98,998。由于第二个及其以后的单位并不独立于第一个单位,所

4、以严格来说,并不是真正的随机样本。,山西大学数学科学学院,第三章 数理统计基础,2、分层随机抽样,8,Step1 根据所研究的自变量把总体分成若干组或层,所分成的组或层(stratum)也称为次总体;Step2 在各个部分(层)中分别进行简单随机抽样;Step3 将所抽取的分样本合并起来,就得到一个总样本。如果从各层中抽取得分样本在总样本中所占的比例与各层在总体中所占的比例相同,那么这种抽样就称为比例分层随机抽样。否则称为非比例分层抽样。,山西大学数学科学学院,第三章 数理统计基础,分层随机抽样实例,9,例如:要从一个年级(男女不等)中抽取一个样本,考虑到男女比例,进行比例分层随机抽样。,山西

5、大学数学科学学院,第三章 数理统计基础,3、多级抽样,10,多级抽样就是逐级进行抽样,把每一级所抽取的样本看成下一级抽样的总体。例如:要从某个作家的作品(小说)中抽取10000个词加以研究,山西大学数学科学学院,第三章 数理统计基础,数据的基本分类,11,1、范畴型数据又称属质型数据,即按变量的性质或类别来区分的数据2、数值型数据数值型数据的基本处理方法1、排序2、分组,山西大学数学科学学院,第三章 数理统计基础,频数分布表,12,包括:每个样本值出现的次数、频数(次数)、相对频数(频率)、百分比频率、累积频数和累计百分比频率等。【例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调

6、查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1非常不满意;2不满意;3一般;4满意;5非常满意。,山西大学数学科学学院,第三章 数理统计基础,频数分布表,13,山西大学数学科学学院,第三章 数理统计基础,分组频数分布表,14,包括:分组区间、组中值、组频数、组频率,累积频数、累计频率(百分数),山西大学数学科学学院,第三章 数理统计基础,分组频数分布表,15,说明:明端点归属的问题,不能重复统计也不能遗漏;组中值是每组两端点的平均值;从小到大的累积(百分比)频率就是样本分布函数,其对应的数值即为分位数(点)。,山西大学数学科学学院,第三章 数理统计基础,分组频数分布图,1

7、6,一、直方图,山西大学数学科学学院,第三章 数理统计基础,分组频数分布图,17,二、茎叶图,山西大学数学科学学院,第三章 数理统计基础,Stem and Leaf display:21,24,24,26,27,27,30,32,38,41,分组频数分布图,18,山西大学数学科学学院,第三章 数理统计基础,频数多边形图,19,又称折线图,山西大学数学科学学院,第三章 数理统计基础,140,150,210,190,200,180,160,170,220,230,240,分组频数分布图,20,经验结论:1、如果总体是正态分布的,分组数K由下式计算:其中N为样本容量。2、如果20N300,茎叶图最大行数不超过:,山西大学数学科学学院,第三章 数理统计基础,作图指导,第三章 数理统计基础,21,山西大学数学科学学院,SPSS 作图指导,山西大学数学科学学院,22,第三章 数理统计基础,Excel作图小结,山西大学数学科学学院,23,第三章 数理统计基础,Exercise,第三章 数理统计基础,24,山西大学数学科学学院,找一组数据:1、作频数分布表2、作分组频数分布表3、直方图4、茎叶图并观察图表特征。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号