语言测试的功能与分类.ppt

资源描述

《语言测试的功能与分类.ppt》由会员分享，可在线阅读，更多相关《语言测试的功能与分类.ppt（19页珍藏版）》请在三一办公上搜索。

1、第二章语言测试的功能与分类,教学目标,了解语言测试的两大功能了解语言测试的分类及各类测试的特点与性质了解常模及差异显著性的含义数据的类型数据分布的集中趋势与离散程度常模、标准化及差异的显著性,2.1 考试、测量与评估,Test,Measurement,Evaluation,一、语言测试功能,1 教学功能,入学,课程,结业,入学,课程,结业,考试,考试,一、语言测试的功能,2 研究功能研究问题及假设（Questions&Hypotheses）研究对象及抽样（Objects&Sampling）研究方法与过程（Methods&Procedures）实验设计、测量工具、变量及类型、分析方法研究结果与

2、讨论（Results&Discussions）描述（统计图表）、解读（结果及原因）,二、语言测试的类别,测试目的水平测试（Proficiency Test）学业测试（Achievement Test）学能测试（Scholastic Aptitude Test）分级测试（Placement Test）诊断测试（Diagnostic Test）测试方式直接测试（Direct Test）间接测试（Indirect Test）,测量形式分离式测试（Discrete-point Test）综合式测试（Integrative Test）考分解释常模参照测试（Norm-referenced Test）标准参

3、照测试（Criterion-referenced Test）考试时间速度测试（Speed Test）难度测试（Power Test）影响力度高风险测试（High-stakes Test）低风险测试（Low-stakes Test）,数据的类型及分布,定类(nominal scale)：“”或“”，如姓名、类别定序(ordinal scale)：“”或“”，如学号、排名定距(interval scale)：“”或“”，如年龄、成绩定比(ratio scale)：“”或“”，如比率、权重SPSS（统计产品及服务解决方案，Statistical Product and Service Solutio

4、ns）软件中仅有三种：名义、序号和度量,分布的集中趋势(central tendency),算术平均数(Mean)众数(Mode)Mo:数列中出现次数最多的数中位数(Median)Me:位于数列中间位置的数,分布的离散程度(dispersion),极差/全距(Range)平均差(Average deviation)方差(Variance)标准差(Standard deviation),标准差系数（标准差相对于均值的量）标准误（抽样的平均误差，等于抽样均值的标准差）,n 1为自由度,自由度（degree of freedom/df),定义当以样本的统计量来估计总体的参数时，样本中独立或能自由变化

5、的数据的个数。公式df=n k，n为样本量，k为被限制的条件数或变量个数。,df=n，对总体均值的估计没有限制条件，样本中的每个x 都可以自由变化(k=0),df=n-1，对总体方差的估计，由于受样本均值的约束，只有 n-1 个 x 可自由取值(k=1),频数分布（Frequency),成绩频数分布表,成绩频数分布曲线图,成绩频数分布直方图,分布的正态性(normality)、偏度(skewness)和峰度(kurtosis),正偏移,负偏移,峰度值越大，标准差越小,三值归一，对称分布,标准正态分布、标准化和标准分(Z Score)、T Score、GRE Score、IQ,不同平均值的正态分

6、布,1,2,3,-1,-2,-3,标准正态分布,不同标准差的正态分布,。,。,标准正态密度函数,*,*,*,*,*,*,*,*,*,*,34%,34%,13.5%,13.5%,2%,2%,0.5%,0.5%,*,*,*,*,*,*,*,*,预测时，置信度与准确度、精确度（说服力）的关系怎样？,原始分与标准分对比,甲、乙二考生相比，甲的总分高但标准分却低，请解释为什么？如果总分服从近似正态分布，丙的排名如何？,求综合成绩排名,如下表所示，已知某两位毕业生的三科成绩、各科成绩的平均分和标准差、综合标准化成绩的平均分和标准差。试结合概率分布表求两人在100名毕业生中的排名。,-.25,2.5,1.5

7、,-.38,1.9,2.5,4.15,3.62,1.15,.62,F(z)乙=.47,F(z)甲=.75,(1-.75)/2100=13,(1-.47)/2100=27,假设检验（Hypothesis Testing）,4、做出决策如果p 值比更小，则说明H0几乎不可能成立，完全有理由拒绝H0而接受H1；相反，如果p 值大于，则说明拒绝H0的理由还不够充分，只能接受H0。,置信度(Confidence level,1-)-1,1 F=0.6827-2,2 F=0.9500-3,3 F=0.9973,2、确定显著水平（Significance level,Sig./），通常为小概率，如.05（

8、5%)，.01(1%)，.001(1/1000)等；分单双侧检验（单侧仅考虑一个方向的变化）。,1、提出假设：原（零、虚无）假设（Null Hypothesis）H0：大概率事件，通常用来被拒绝备择（对立）假设（Alternative Hypothesis）H1：小概率事件，通常为期望结果,3、计算抽样的统计量或概率值 p。,注意：如果p值不大，即使接受H0，结论的说服力也不强；如果p值为大概率，那么接受H0同样具有说服力。,两类错误,弃真的概率为显著性水平，弃真也称错误。由于为一个很小的概率，所以犯弃真错误的可能性很小。纳伪的概率用表示，纳伪也称错误。,“拒绝才有说服力”：H0通常为大概率

9、事件，对于大概率事件，通过逻辑推理即可得出结论而没有必要进行假设检验，所以假设检验中的H0通常是用来被拒绝的，并且弃真的可能性很小。小概率原理：若能证实小概率事件（H1），证明一般情况下不可能发生的事情确实发生了，那就意味假设中的“小概率”事实上很可能不是小概率，H1的发生肯定是有原因的。,假设检验例析,如果一般情况下不可能发生的事情通过实验证明确实发生了，说明实验说服力强。如果大家普遍接受的理论被证明确实有误，则证伪很有说服力。如果嫌疑人的指纹跟罪犯在现场留下的指纹一致，则嫌疑人正是罪犯。如果考生在高考中的排名位于前十万分之一，则加20分很有说服力。,一、试用假设检验的“小概率”原理分析以下现象：,二、试分别列出下列检验的H0、H1和期望的p值：,正态分布检验（Test of Normality)方差齐性（同质性）检验（Test of Homogeneity of Variance）评分员之间的一致性检验（Test of Inter-Rater Consistency)数据的相关性检验（Test of Correlation）,

展开阅读全文