《医学统计学重点和习题.doc》由会员分享,可在线阅读,更多相关《医学统计学重点和习题.doc(44页珍藏版)》请在三一办公上搜索。
1、医学统计学习题集 上海中医药大学预防医学教研室医学统计学绪论习题一、名词解释1.同质和变异2.总体和样本3.抽样误差和误差4.概率和频率5.计量资料、计数资料和等级资料二、最佳选择题1.统计工作的前提与基础是:A.设计 B.收集资料 C.整理资料 D.校对资料 E.分析资料2.统计工作四个基本步骤是:A.设计,收集资料、整理资料和分析资料 B.收集日常生活资料,报告卡片,分析资料,总结C.收集统计报表,日常医疗工作资料,分析资料,描述资料D.收集专门内容报告卡片,进行整理,分析资料,核对资料E.收集病历,日常医疗工作资料,分析资料,归组3.统计中所说的样本是指:A.随意从总体中抽取出的部分个体
2、 B.依照研究者要求从总体中抽取出有意义的部分个体C.按照随机原则抽取总体中有代表性的部分个体D.依照研究者要求从总体中抽取的部分个体E.按分布的顺序抽取部分个体4.统计中所说的总体是指:A.随意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体C.根据时间来划分的研究对象的全体 D.根据地区来划分的研究对象的全体E.根据人群来划分的研究对象的全体5.总体的要求是:A.大量的 B.同质的 C.随机的 D.固定的 E.对称的6.对观察单位按某项指标等级顺序分组,再清点各组观察单位的个数所得资料称作:A.计量资料 B.计数资料 C.配对资料 D.相关资料 E.等级资料7.对观察单位用定量的
3、方法测量某项指标所得的资料是:A.计量资料 B.计数资料 C.配对资料 D.相关资料 E.等级资料8.样本指标值与总体指标值之差主要是指:A.随机测量误差 B.过失误差 C.容许误差 D.抽样误差 E.系统误差9.由于各种偶然的因素影响,造成同一对象的测定结果不完全一致,往往是有的稍高,有的稍低,这种差异是:A.系统误差 B.随机测量误差 C.抽样误差 D.偏倚误差 E.标准误差10.统计学上说的系统误差、测量误差和抽样误差三种误差,在实际工作中有:A.三种误差都不可避免 B.系统误差和抽样误差不可避免C.系统误差和测量误差不可避免 D.测量误差和抽样误差不可避免E.三种误差都可避免11.抽样
4、误差是指:A.个体值和总体参数值之差 B.个体值和样本统计量值之差C.样本统计量值和总体参数值之差 D.样本统计量值和样本统计量值之差E.总体参数值和总体参数值之差12.某事件发生的概率为1,即意味着:A.某事件发生的可能性为1% B.某事件可能发生C.某事件可能不发生 D.某事件必然不发生E.某事件必然发生13.除哪项外,是随机抽样方法:A.单纯随机抽样 B.系统抽样 C.分层抽样 D.整群抽样 E.随意抽样14.随机事件概率P值应是:A.1 B.0 C.01 D.0.5 E.11015.一时性资料主要来源:A.日常工作记录 B.专用报告卡 C.统计报表 D.专题调查 E.病例档案16.抽样
5、调查是指:A.从总体中随机抽取有代表性的一部分进行调查 B.从总体中任意选择一部分进行调查C.从总体中选择典型进行调查 D.选择某一地区进行调查E.调查总体所包含的每一个个体17.医疗卫生工作对原始统计资料的要求:A.完整,准确,及时,要有适当的数量,代表性和对比条件B.字迹清楚 C.填写工整 D.避免重复 E.没有遗漏18.同性三胞胎的身长、体重均有不同,认为是_。A.变异 B.同质 C.系统误差 D.抽样误差 E.随机测量误差19.某医生对100名高血压病人采用某新疗法进行治疗,该研究的总体是_。A.全院收治的高血压病人 B.这100名高血压病人C.该医生收治的所有病人 D.接受该新疗法的
6、所有高血压病人E.所有高血压病人。20.某研究这在社区进行了1000名退休人员的冠心病患病率的抽样调查,计算的患病率为_。A.社区冠心病患病率参数 B.这1000名退休人员的冠心病患病率参数C.所有退休人员的冠心病患病率参数 D.所有退休人员的冠心病患病率统计量E.这1000名退休人员的冠心病患病率统计量三、思考题1.某地一批人的血红蛋白值资料,比色法测得的具体值(如135g/L),为何类资料?根据测得值进行分类(如“贫血”),为何类资料? 2.某疫苗皮下注射免疫结果观察对象抗体滴度目测判断抗体水平免疫效果观察11:40+无效21:60+有效为何类资料? 为何类资料? 为何类资料? 3.数据类
7、型的相互转换:如年龄(岁),为何类资料? 转换为“未成年、成人”,是何类资料? 再转换为“婴幼儿、青年、中年、老年”则又是何类资料?如治疗效果分类“无效、好转、显效、痊愈”为何类资料? 分别给予编码0,1,2,3后又为何类资料?。4.某医科大学抽查了100名健康女大学生的血清总蛋白含量(g/L),检查结果如下:74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 73.5 75.0 72.0 64.3 75.8
8、 80.3 69.7 74.3 75.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 74.0 72.0 76.5 74.3 76.5 77.6 67.3 72.0 73.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 75.8 73.5 75.0 72.7 70.4 77.2 68.8 67.3 75.8 73.5 75.0 72.7 73.5 72.7 81.6 73.5 75.0 72.7 70.4 76.5 72.7 77.2 84.3 75.0 71.2 71.2 69.7 73.5 70.4 75.0 72.7 67.3 70.3
9、 76.5 73.5 78.0 68.0 73.5 68.0 73.5 68.0 74.3 72.7 73.7试回答以下问题: 1.这是总体还是样本资料? 2.上述资料的观察单位是什么?是数值变量还是分类变量? 3.怎样对这样一个资料(分布规律)进行简单描述?参考答案二、最佳选择题1、A 2、A 3、C 4、B 5、B 6、E 7、A 8、D 9、B 10、D11、C 12、E 13、E 14、C 15、D 16、A 17、A 18、A 19、D 20、E统计表与统计图一、最佳选择题1、欲比较两地20年来冠心病和恶性肿瘤死亡率的上升速度,最好选用( )。A.普通线图 B.半对数线图 C.条图
10、D.直方图 E.圆图2、调查某地6至16岁学生近视情况,需描述近视学生的年龄分布可用( )。A.普通线图 B.半对数线图 C.条图 D.直方图 E.圆图3、比较某地在两个年份几种传染病的发病率可用( )。 A.构成比条图 B.复式条图 C.线图 D.直方图 E.圆图4、图示7岁男孩体重与胸围的关系,宜绘制( )。A.条图 B.百分条图 C.散点图 D.线图 E.直方图5、表示某地区某年死因的构成比,可绘制( )。A.条图 B.圆图 C.直方图 D.统计地图 E.线图6、关于统计表的制作,不正确的叙述是( )。A.统计表不用竖线和斜线分隔表、标目和数据 B.统计表的标题放在表的上方C.统计表包含
11、的内容越多越好 D.统计表中的数字按小数点位次对齐E.统计表一般用纵标目和横标目说明数字的意义和单位7、关于统计图的制作( )。A.统计图的标题放在图的上方 B.线图中的线条越多越好C.直条图的纵轴必须从零开始 D.直方图的组距不必相等E、以上都不对8、比较1955年某地三种传染病白喉、乙脑、痢疾的病死率,选择的统计图是( )。 A线图 B半对数线图 C直方图 D条图 E百分条图9、下列哪种统计图纵坐标必须从0开始( )。 A半对数线图 B散点图 C条图 D线图 E百分条图10、比较19491957年间某市儿童结核病和白喉的死亡率(l10万)(两种疾病死亡率数量相差很大),宜采用( )。 A条
12、图 B直方图 C线图 D半对数线图 E散点图11、要反映某一城市连续五年甲肝发病率的变化情况,应选用( )。 A条图 B直方图 C线图 D散点图 E百分条图12、关于统计表的列表原则,哪项是错误的( )。 A标题在表的上端,“简要说明表的内容” B横标目是研究对象,列在表的右侧;纵标目是分析指标,列在表的左侧 C线条主要有顶线,底线及纵标目下面的横线,不宜有斜线和竖线 D数字右对齐,同一指标小数位数一致,表内不宜有空格 E备注用“*”标出,写在表的下面13、下列哪些统计图适用于计数资料( )。 A条图、直方图 B线图、半对数线图 C条图、百分条图 D散点图、线图 E百分条图、直方图14、半对数
13、线图( )。 A以对数的12值作纵横轴尺度 B必须以纵轴为对数尺度,横轴为算术尺度 C必须以横轴为对数尺度,纵轴为算术尺度 D纵横轴之一为对数尺度,另一为算术尺度 E纵横轴都必须为对数尺度15、分析胎儿娩出时的不同体重(g)和围产儿死亡率的关系,宜绘制( )。 A散点图 B条图 C线图 D半对数线图 E直方图16、关于半对数线图,哪项是错误的( )。 A纵轴为对数尺度,横轴为算术尺度 B纵坐标没有零点 C通过绝对差值而不是相对比来反映事物发展速度 D纵坐标各单元等距,但同一单元内不等距E当事物数量相差悬殊时,比普通线图更适宜比较事物的发展速度17、编制统计表的基本原则A简单明了,层次清楚 B表
14、式多样,标题合理 C主谓分明,系统全面D排列规则,数字工整 E表格整齐美观18、对于绘制统计图的说法,较正确的是A纵坐标的起点一律为0B直条图是以各直线的面积大小来表示各指标的数值C是以各直线的面积大小来表示各指标的数值标题应简明扼要,一般放在图的上方D图例可放在图内任何地方,不宜太大E在绘制线图和直条图时,纵横坐标的长度的比例以5:7为宜19、应用统计图必须根据资料的性质和分析目的,正确选择适宜的图形是:A连续性分组资料宜选用直条图B比较两种和两种以上事物变化速度,宜选用普通线图C表示某现象数量随另一现象而变动的幅度和趋势宜选用半对数线图D无连续关系的,相互独立的分组资料宜选用方图E要表示构
15、成比与分布,可选构成图20、列频数表时,分的组段数一般为:A510个 B1015个 C1030个 D1520个 E20个二、简答题1、在统计描述中,统计表和统计图分别起着什么作用?2、统计表的制作原则和要求有哪些?3、统计图的制作原则和要求有哪些?4、常用的统计图有哪几种,各适用于什么类型资料?5、统计表与统计图有何联系和区别?三、计算分析题1、对下表提出意见,并绘制改进后的统计表职业性别例数发病率例数%工人男女合计10280182320232.925.012.6农民男女合计77861637299.12.35.5职员男女合计1079119818102816.811.014.12、评价下表是否符
16、合统计表的制作原则,并请改进。某地EB病毒抗体阳性人群药物干预治疗后EB病毒抗体阳性例数第一疗程第二疗程1月2月3月1月2月3月检查人数血清学指标检查人数血清学指标检查人数血清学指标检查人数血清学指标检查人数血清学指标检查人数血清学指标VCAEADNAseVCAEADNAseVCAEADNAseVCAEADNAseVCAEADNAseVCAEADNAse3282528452315237784630622962282831925622272168442026614438183、某地两年三种死因别死亡率资料如下表,请绘制适合的统计图描述该资料。某地两年的三种死因别死亡率(1/10万)死因1952年
17、1992年肺结核163.224.7心脏病72.583.4恶性肿瘤57.2156.34、某医生统计某市机械工业生产性外伤例数见下表,请用适当的统计图描述。1992年某市机械工业生产性外伤分类外伤类型病例数百分比(%)创伤38140.57挫伤30532.48眼外伤11812.57烧伤929.80其他434.58合计939100.005、某医生在冠心病药物的动物实验中得到以下结果,试用适当的统计图描述。家兔服药后血清总胆固醇的变化组别服药前服药后2周4周6周8周10周12周实验组53.6815.8898.71298.91232.51179.41096.8对照组50.8818.11081.11464.
18、51645.51620.11411.06、某医生统计168例甲状腺功能亢进患者的年龄,结果如下表,请绘制合适的统计图。甲状腺功能亢进患者的年龄分布年龄0102030405060合计例数11351613561168练习题解答一、最佳选择题解答1、B 2、D 3、B 4、C 5、B 6、C 7、C 8、C 9、D 10、D11、C 12、B 13、C 14、D 15、A 16、C 17、A 18、E 19、E 20、B三、计算分析题解答1、答:该题没有标题,行的层次多,不应该有竖线,修改如下。表1 某年某地不同职业居民高血压发病率职业男女合计例数发病数发病率(%)例数发病数发病率(%)例数发病数发
19、病率(%)工人10232.9802025.01822312.6农民7779.18622.316395.5职员1071816.8911011.01982814.12、答:该表的层次太多,描述资料不清楚,不方便比较。表的外框和竖线应该去掉。修改如下。表2 某地EB病毒抗体阳性人群药物干预治疗后EB病毒抗体阳性例数随访时间第一疗程第二疗程检查人数VCAEADNAse检查人数VCAEADNAse1月328252845228319256222月315237784627216844203月306229622826614438183、该资料是比较两个年度三种死因的变化,适宜用直条图,绘制如下。4、答:该资料
20、是描述生产性外伤的构成比,适宜用圆图或构成比直条图,绘制圆图如下。5、答:该资料是比较两组家兔的血清总胆固醇随时间变化而变化的趋势,适宜用线图。绘制如下。6、答:该资料是描述甲状腺功能亢进患者的年龄分布,适宜用直方图,绘制如下。计量资料的统计描述一、名词解释1.中位数2.四分位数间距3.标准差4.变异系数5.正态分布二、是非题1不论数据呈什么分布,都可以用算术均数和中位数表示其平均水平。( )2少数几个数据比大多数数据大几百倍,一般不宜用算术均数表示其平均水平。( )3只要单位相同,用s和用CV来表示两组资料的离散程度,结论是完全一样的。( )4四分位数间距也是描述连续分布数据离散度的指标。(
21、 )5理论上,对于正态分布资料,总体百分位数的P5P95和1.96范围内都包含95%的变量值。( )三、最佳选择题1、描述一组偏态分布资料的变异度,以( )指标较好。A.全距 B.标准差 C.变异系数 D.四分位间距 E.方差2、用均数和标准差可以全面描述( )资料的特征/A.正偏态分布 B.负偏态分布 C.正态分布 D.对称分布 E.对数正态分布3、各观察值均加(或减)同一数后( )。A.均数不变,标准差改变 B.均数改变,标准差不变C.两者均不变 D.两者均改变 E.以上都不对4、比较身高和体重两组数据变异度大小宜采用( )。A.变异系数 B.方差 C.极差 D.标准差 E.四分位间距5、
22、偏态分布宜用( )描述其分布的集中趋势。A.算术均数 B.标准差 C.中位数 D.四分位间距 E.方差6、各观察值同乘以一个不等于0的常数后,( )不变。A.算术均数 B.标准差 C.几何均数 D.中位数 E.变异系数7、( )分布的资料,均数等于中位数。A.对数正态 B.正偏态 C.负偏态 D.偏态 E.正态9、最小组段无下限或最大组段无上限的频数分布资料,可用( )描述集中趋势。A.均数 B.标准差 C.中位数 D.四分位间距 E.几何均数10、血清学滴度资料最常用来表示其平均水平的指标是( )。A.算术均数 B.中位数 C.几何均数 D.变异系数 E.标准差11、中位数是表示变量值_的指
23、标。A.平均水平 B.变化范围 C.频数分布 D.相互间差别大小 E.以上都不对12、某项指标仅以过高为异常,且资料呈偏态分布,则其95%的参考值范围为 。A.P95 B.P97.5 C.P5 D.P2.5P97.5 E. P2.513、在同一总体中随机抽样,样本含量n越大,则理论上_越小。A.样本标准差s B.中位数 C.标准误 D.第95百分位数 E. .变异系数14、计算平均潜伏期宜用:A.算术均数 B.全距 C.离均差积和 D.中位数 E.变异系数15、正态分布有两个参数与,_曲线的形状越扁平。A. 越大 B. 越小 C. 越大 D. 越小 E. 与越接近016、在医学和卫生学研究中,
24、下面_不是近似正态分布:A.正常成人的血铅含量 B.正常成人的身高 C.正常成人的红细胞数 D.正常成人的血清总蛋白含量 E.正常成人的脉搏数17、在抽样研究中“总体均数”,“总体标准差”:A.一般是不知道的 B.不知道但可以由样本推论 C.总是知道的 D.是给定的两个已知量 E二者相等18、对120名大学生的身高进行了测量,每个测量值减去均数所得的差值再除以标准差,所得数值的分布是_A.正态分布 B.标准正态分布 C.正偏态分布 D.负偏态分布 偏态分布19、若一组数据呈正态分布,其中大于的变量值占_A.99.5% B.99% C.1% D.0.5% E.5%四、简答题1、对于一组近似正态分
25、布资料,除样本含量n外,还可以计算,S和 土1.96S,问各说明什么?2、试述正态分布、标准正态分布及对数正态分布的联系和区别。3、说明频数分布表的用途,并思考频数表的组段数是否越多越好?4、试述正态分布的面积分布规律。5、医学中参考值范围的涵义是什么?确定的原则和方法是什么?五、计算分析题组段频数0.610.730.890.9131.0191.1251.2181.3131.491.551.61.71合计1161、根据1999年某地某单位的体检资料,116名正常成年女子的血清甘油三脂(mmol/L)测量结果如下表,请据此资料: (1)描述集中趋势应选择何指标?并计算之。 表1 甘油三脂(mmo
26、l/L)测量结果 (2)描述离散趋势应选择何指标?并计算之。 (3)求该地正常成年女子血清甘油三脂的95%参考值范围。 (4)试估计该地正常成年女子血清甘油三脂在0.8mmol/L以下者及1.5mmol/L以下者各占正常女子总人数的百分比。2、某地微丝蚴血症者42例治疗后7年用间接荧光抗体试验测得抗体滴度如下。求平均抗体滴度。抗体滴度的倒数10204080160例数51213753、测得某地300名正常人尿汞值,其频数表如下。试(1)请计算算术平均数、标准差和中位数。(2)以双侧正态分布法和百分位数法估计95%变量值所在范围。(3)以正态分布法和百分位数法估计95%变量值在什么数值以下。(4)
27、如果要制定正常值范围,你建议用哪一种方法?什么理由。300例正常人尿汞值(g / L)频数表尿汞值例数尿汞值例数尿汞值例数04924164834272895208583295621250364600164540564020224406814、100名健康成年女子血清总蛋白含量(g/L)如下表,试对资料进行描述。 100名成年健康女子血清总蛋白含量73.574.378.878.070.480.584.368.869.771.272.079.575.678.872.072.072.775.074.371.268.075.075.074.375.865.067.378.871.269.773.573
28、.575.864.375.880.381.672.074.373.568.075.872.076.570.471.267.368.875.070.474.370.479.574.376.577.681.276.572.075.072.773.576.574.765.076.569.773.575.472.772.767.273.570.477.268.874.372.767.367.374.375.879.572.773.573.572.075.081.674.370.473.573.576.572.777.280.570.475.076.5练习题解答三、最佳选择题1、D 2、C 3、B 4、
29、A 5、C 6、E 7、E 8、D 9、C 10、C 11、A 12、A 13、C 14、D 15、C 16、A 17、B18、 19、A 20、D五、计算分析题 1、解 (1)=1.16 (mmol/L) (2)S=0.20 (mmol/L)(3)土1.96S=(0.77,1.55) (mmol/L) (4) u1= - 1.80 u2= 1.70 该地正常成年女子血清甘油三脂在0.8mmol/L以下者占总人数的3.59%,1.5mmol/L以下者各占总人数的95.54%。2、解:G=36.8 故42例微丝蚴血症者治疗后7年平均抗体滴度为1:36.8。3、解:=15.08 (g / L) M
30、 = 13.28 (g / L) P95 = 36.0(g / L)自己联系SPSS统计软件4、解:(1)根据上述资料编制频数表,并SPSS作图如下:(2)根据频数表初步判断上述资料为 分布。(3)计算均数、标准差、CV、极差、P25、P75及95%可信区间。自己联系SPSS统计软件总体均数的估计与假设检验一、名词解释1.抽样误差2.标准误3.置信区间4.第一类错误5.第二类错误二、是非题1即使变量偏离正态分布,只要样本含量相当大,样本均数也近似正态分布。( )2同一批计量资料的标准差不会比标准误大。( )3两次t检验都是对两样本均数的差别做统计检验,一次P0.01,另一次0.01P,则接受H
31、0犯错误的可能性很小C、采用配对t检验还是两样本t检验是由试验设计方案所决定的D、检验水准只能取0.0511、第1类错误的概念是( )A. H0是对的,统计检验结果未拒绝H0 . H0是对的,统计检验结果拒绝H0C. H0是不对的,统计检验结果未拒绝H0 D. H0是不对的, 统计检验结果拒绝H0E. 以上都不对13、在研究两种药物治疗高血压效果的配对t检验中,要求( )A.两组样本的方差相等 B.数据呈双变量正态分布 C.差数d服从正态分布 D.差数d的方差为0 E.n比较小14、由两样本均数的判别来推断两总体均数的差别,所谓差别有显著性是指:A.两样本均数差别有显著性 B.两总体均数差别有
32、显著性 C.两样本均数和总体均数的差别都有显著性 D.其中有一个样本均数和总体均数的差别有显著性E.两样本均数和一个总体均数的差别有显著性15、统计推断的内容是( )A.计算样本率 B.检验统计上的“假设” C.计算样本均值 D.计算标准化率 E.估计参考值范围 16、在同一总体随机抽样,其他条件不变,样本含量越大,则_。A.样本标准差s越大 B.样本标准差s越小 C.总体均数的95%可信区间越窄D.总体均数的95%可信区间越宽 E. 样本标准差s越小,总体均数的95%可信区间越窄17、在同一总体随机抽样,样本含量n固定时,越小,总体均数可信区间_。A.越宽 B.越窄 C.宽窄不变 D.宽窄还与有关 E.以上说法都不对18、在随机抽样中,其他条件不变时,“增大样本含量能平均起来使_”是错误的。A . u变小 B.变小 C.可信区间变窄 D. 变小 E.