《《状态转移模型》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《状态转移模型》PPT课件.ppt(39页珍藏版)》请在三一办公上搜索。
1、4.3 马氏链模型,随着人类的进化,为了揭示生命的奥秘,人们越来越注重遗传学的研究,特别是遗传特征的逐代传播,已引起人们广泛的注意。无论是人,还是动、植物都会将本身的特征遗传给下一代,这主要是因为后代继承了双亲的基因,形成自己的基因对,由基因又确定了后代所表现的特征。本节将利用数学的 马氏链方法来建立相应的遗传模型等,并讨论几个简单而又有趣的实例。马氏链(马尔柯夫链)研究的是一类重要的随机过程,研究对象的状 态s(t)是不确定的,它可能 取K种 状态si(i=1,k)之一,有时甚至可取无穷多种状态。在建模时,时间变量也被离散化,我们希望通过建立两个相邻时刻研究对象取各种状态的概率之间的联系来研
2、究其变化规律,故马氏链研究的也是一类状态转移问题。,例4.6中的关系既可用一转移矩阵表示,相应的转移矩阵 为:,且Sj+1=SjM,首先,任一转移矩阵的行向量均为概率向量,即有(1)(I,j=1,n)(2)(i=1,n)这样的矩阵被称为 随机矩阵。,常染色体遗传模型,下面给出双亲体基因型的所有可能的结合,以及其后代形成每种基因型的概率,如 表所示。,双亲随机结合的较一般模型相对比较复杂,这些我们仅研究一个较简单的特例。,(a)假设:令n=0,1,2,。(i)设an,bn和cn分别表示第n代植物中,基因型 为AA,Aa和aa的植物占植物总数的百分比。令x(n)为第n代植物的基因型分布:,当n=0
3、时,表示植物基因型的初始分布(即培育开始时的分布),(b)建模根据假设(ii),先考虑第n代中的AA型。由于第n1代的AA型与AA型结合。后代全部是AA型;第n1代的Aa型与AA型结合,后代是AA型的可能性为 1/2,而 第n1代的aa型与AA型结合,后代不可能 是AA型。因此当n=1,2时,即,类似可推出,cn=0,显然有(ii)第n代的分布与 第n1代的分布之间的关系是通过表5.2确定的。,(4.2),(4.3),(4.4),将(4.2)、(4.3)、(4.4)式相加,得,根据假设(I),可递推得出:,对于(4.2)式.(4.3)式和(4.4)式,我们采用矩阵形式简记为,其中,(注:这里M
4、为转移矩阵的位置),(4.5),由(4.5)式递推,得,(4.6),(4.6)式给出第n代基因型的分布与初始分布的关系。为了计算出Mn,我们将M对角化,即求出可逆矩 阵P和对角库D,使 M=PDP-1因而有 Mn=PDnP-1,n=1,2,其中,这里,是矩 阵M的三个特征值。对于(4.5)式中的M,易求得它的特征值和特征向量:=1,=1/2,=0,因此,所以,通过计算,P-1=P,因此有,即,所以有,即在极限的情况下,培育的植物都 是AA型。若在上述问题中,不选用基 因AA型的植物与每一植物结合,而是将具有相同基因型植物相结合,那么后代具有三种基因型的概率如 表所示。,M的特征值为,通过计算,
5、可以解出与、相对应的两个线性无关的特征向量e1和e2,及与相对应的特征内 量e3:,因此,解得:,,所以,因此,如果用基因 型相同的植物培育 后代,在极限情况 下,后代仅具有基 因AA和aa。,现在,我们考虑在控制结合的情况下,如何确定后代中隐性患者的概率。,(b)建模由假设(iii),从第n1代到第n代基因型分布的变化取决于方程,所以,,其中,如果初始分 布x(0)已知,那么 第n代基因型分布为,解 将M对角化,即求出特征值及其所对应的特征向量,得,计算,=,(4.8),,,隐性患者逐渐消失。从(4.8)式中可知,每代隐性患者的概率是前一代隐性患者概率的1/2。,(4.9),(c)模型讨论研
6、究在随机结合的情况下,隐性患者的变化是很有意思的,但随机结合导致了非线性化问题,超出了本章范围,然而用其它技巧,在随机结合的情况下可以 把(4.9)式改写为,(4.10),(群体的近交系数)设某群体中存在近亲婚配现象,称各种近交系数的数学期望为该群体的近交系数。例如,某村镇共有2000对婚配关系,其中有59对表亲,22对半堂亲 和28对从表亲,则该村镇的近亲系数为,现在,我们来研究近亲结 婚会产生什么结果。,设某基因对由 A、a两种基因组成,出 现A的概率为p,出现a的概率为q=1-p。在随机交配群体中,其子女 为AA、Aa及aa型的概率分别 为p2、2pq及q2。对近交系数 为F的群体,根据
7、条件概率公式,后代出 现aa型基因对的概率为,比较存在近亲交配的群体与不允许近亲交配(F=0)的群体,令,若a为某种隐性疾病的基因,易见,在近交群体中,后代产 生遗传病(aa型)的概率增大了,且F越大,后代患遗传病 的概率也越大。,同样,后代出现AA型基因对的概率 为p2+Fpq。Aa型不可能 是共同祖先同一基因的重复,故其出现的概率为2pq(1-F)。,例如,苯丙酮尿症是一种隐性基因纯合子 aa型疾病(a为隐性疾病基因),隐性基因出现的频率,求表兄妹结婚及非近亲结婚的子女中患有苯丙酮尿症的概率。由前,表兄妹结婚的近交系数为 1/16,故其子女发生该疾病的概率为而对禁止近亲结婚的群体,子女发生
8、该疾病的概率为q2=10-4。表兄妹(或堂兄妹)结婚使子女发生该疾病的概率增大了大 约7.19倍,由此可见,为了提高全民族的身体素质,近亲结婚是应当 禁止的。,(4.11),其中,从(4.11)式中易得,经过计算,矩阵 M的特征值和特征向量为,M对角化,则有,(4.12),其中:,即,即同胞对是(A,AA)型的概率是2/3,是(a,aa)型的概率为1/3。,根据定义3,例4.7中状态S4即为一吸收链,具有r个吸收状态,nr个非吸收状态的吸收链,它的nn转移矩阵的标准形式为,(注:非标准形式可经对状态重新编号),其中Ir为r 阶单位阵,O为rs零阵,R为sr 矩阵,S为ss矩阵。令,上式中的子阵
9、Sn表达了以任何非吸收状态作为初始状态,经过n步转移后,处于s个非吸收状态的概率。在吸收链中,令F=(IS)-1,称F为基矩阵。,设甲胜一题的概率 为p,(0p1),p与两队的实力有关。甲队得分有5种可能,即0,1,2,3,4。我们分别记为状态S0,S1,S2,S3,S4,其中S0和S4是吸收状态,a1,a2和a3是非吸收状态。过程 以S2作为初始状态。根据甲队赢 得1分的概率为 p,建立转移矩阵:,S 0 S 1 S 2 S 3 S 4,将上式改记为标准形 式T:,其中,计算 F:,令q=1-p,则,因为a2是初始状态,根 据定理4,甲队获分为1,2,3分的平均次数为,=,=,根据定理5,以a2为初始状态,甲队最终获胜的平均转 移欠数为,。又因为,,根据定理6,甲队最后获胜的概率,。,