《R语言在遗传统计学中的应用课件.ppt》由会员分享,可在线阅读,更多相关《R语言在遗传统计学中的应用课件.ppt(22页珍藏版)》请在三一办公上搜索。
1、,遗传与疾病,人类的某些性状及部分疾病与人体的遗传因素密切相关阐明遗传因素与人体疾病或健康状态的关系有非常重要的意义遗传统计学在这其中起着至关重要的作用,遗传与疾病,疾病的易感基因研究,研究的特点,收集的数据即包含一般的表型数据也包含基因型数据数据分析时需要用到不同的遗传模型需要一些遗传统计特有的分析方法:的计算,家系图的绘制等,在遗传统计中的应用,数据整理获取位点的基本信息平衡检验连锁不平衡的计算关联研究常用分析方法家系图的绘制,数据整理,中的包专门为基因型数据提供一个新的类 函数是包里最基本的函数,可以将以下四种形式的初始基因型数据转换成便于分析的带有类的数据,以一个字符分隔的向量 (,
2、,). 可以按某一位置分隔的向量 (,). 两个分开的向量 (,) (,) (, ),. 数据框或矩阵中的两列 ( (,), (,) ($) 或 ( (,), (,) (),获取位点的基本信息,多态位点的基本信息包括:位点分型成功率 ( )、等位基因频率、基因型频率、杂合度和多态信息含量 ()一个简单的例子:载入数据() 获取位点的基本信息($),: () : ( ) : () . .,定律,定律是由英国数学家哈迪(. )和德国医生温伯格(. )于年分别独立发现的,也称遗传平衡定律( )该定律可以简单描述为,遗传平衡群体的等位基因频率与基因型频率在世代间维持恒定该定律的适用条件是:随机婚配,群
3、体足够大,没有突变、选择、迁移和遗传漂变,平衡检验,关联研究中平衡检验常被用来评价基因分型的质量。我们通常对病例和对照组分别进行平衡检验如果某一位点在对照组中不符合平衡,我们通常会怀疑该位点的基因型鉴定的质量如果该位点在对照组平衡而在病例组出现不平衡,则该位点可能和疾病有关,平衡检验,包里面提供两种不同的检验方法一种是 ,可以用函数进行该检验,另一种是 ,对应于函数常用于较高、样本量较大的场合;较低的位点建议使用函数,的计算,连锁不平衡则是指人群中两个位点处在同一个单体型的频率比期望值高评价连锁不平衡程度的指标包括、等包提供计算各种指标的函数,并能以文字和图形两种形式显示位点间的连锁不平衡程度
4、,的计算,用函数计算位点间的 () 用文字显示值(, )用图形显示结果(, ) ,关联研究常用分析方法,卡方检验回归线性回归,卡方检验, () 首先载入数据 ( () : , , ( () : , ,回归,. 共显性模型 ( , , ):( , , ) : : . () () * * * *,回归,. 加性模型( (,) , , ):( (, ) , , ) : : . () () *(, ) * *,回归,. 显性或隐性模型 ( (,) , , ):( (, ) , , ) : : . () () *(, ) * *,家系图的绘制,() 载入包 () ()() (,)()($, $, $, $, $)(),谢谢各位,