这种娥子的色彩己经被确认是通过某单个基因决定的,该基因有三个可能 的等位基因:C,I和T.其中C对1是显性的,T对I是隐性的.因此基因型CC CI和CT导致(深色)黑色的表型.基因型TT导致浅色的表型.Ⅱ和T导致一种 中间的表型,外观上变化很广泛,但通常以中间色彩杂色而成.因此有6种基因 型,3种表现型 在英因和北美,在燃煤的工业区,浅色的蛾子几乎以及被深色的蛾子所替 代.这种等位基因频率在种群内的变化被引为是在人类时间刻度下可以观察 到微进化的一个例子.(被试验证实的)理论结果是”鸟类在不同反射背景下对 蛾子的捕食程度明显不同”.在燃煤的工业区,污染减弱了黑色表型蛾子栖息 Previous Next First Last Back Forward 4
˘´ˇf⁄ÁƲ(@¥œL,¸áƒœ˚½, TƒœknáåU †ƒœ: C, I⁄T. Ÿ• CÈI¥w5, TÈI¥¤5. œdƒœ.CC, CI⁄CTó(⁄)Á⁄L.. ƒœ.TTóf⁄ L.. II⁄ITóò´ •mL., *˛CzÈ2ç, œ~±•m⁄Á,⁄ §. œdk6´ ƒœ ., 3´Ly.. 3=I⁄{, 3-uÛí´, f⁄ˇfA±9⁄ˇf§O ì. ˘´†ƒœ™«3´+ SCz⁄è¥3<aûmè›eå±* á?zòá~f. (£y¢)nÿ(J¥”ja 3ÿ”áµeÈ ˇf”†ß›²wÿ””. 3-uÛí´, ¿/~f Á⁄L.ˇf—E Previous Next First Last Back Forward 4
在树皮表面的反射程度,因而对其有利.当环境改善后,浅色表型增加,黑色表 型减少,这并不令人奇怪 因此,监视这种蛾子的等位基因C,I,T的变化,除了可以研究微进化过 程外,也可以用于环境污染监控.假设Hardy-Veinberg平衡律成立,记 各个等位基因在种群中的频率为Pc,P1,Pr(pC+PI十Pr=1),则基因 型CC,CI,CT,IL,IT,TT的频率分别为P吃,2pcpI,2pcpT,p听,2ppT,P咛 假设我们随机捕了m只蛾子,其中黑色表型的有nc只,中间表型的有n1只, 浅色表型的有T只.但是各个基因型的频数不可观测: CC CI CT Π IT TT 不可观测 ncc nCI nCT nIl nIT nTT nc n nT 观测 黑色 中间 浅色 因此,此时观测数据为x=(nc,nI,nr),而完全数据为y=(ncc,ncI,ncT, nII,nIT,nTT),这里ncc+ncI+ncT=nc,nl+nIT=nI,以及 nrT=nr.我们希望由此数据来估计各个等位基因的概率pc,p1,pT. Previous Next First Last Back Forward 5
3‰ôL°áß›, œ ÈŸk|. ǸUı, f⁄L.O\, Á⁄L .~, ˘øÿ-<¤%. œd, i¿˘´ˇf†ƒœC,I,TCz, ÿ å±Ôƒá?zL ß , èå±^u Ǹ¿/iõ. bHardy-Weinberg²ÔƧ·, P àᆃœ3´+•™«èpC , pI , pT (pC + pI + pT = 1), Kƒœ .CC,CI,CT,II,IT,TT ™«©Oèp 2 C , 2pC pI , 2pC pT , p2 I , 2pI pT , p2 T . b·ÇëÅ” nêˇf, Ÿ•Á⁄L.knCê, •mL.knIê, f⁄L.knT ê. ¥àნ.™Íÿå*ˇ: CC CI CT II IT TT ÿå*ˇ nCC nCI nCT nII nIT nT T nC nI nT *ˇ Á⁄ •m f⁄ œd, dû*ˇÍ‚èx = (nC , nI , nT ), Í‚èy = (nCC , nCI , nCT , nII , nIT , nT T ), ˘pnCC + nCI + nCT = nC , nII + nIT = nI , ±9 nT T = nT . ·ÇF"ddÍ‚ 5OàᆃœV«pC , pI , pT . Previous Next First Last Back Forward 5
从而完全数据的似然函数为 logf(yp) ncclogpe +ncilog(2PcPI)+ncrlog(2PCPT) nirlog(pi)+nrrlog(2pIpr)+nrrlog(pir) n! log nccmncrncn 由于完全数据不可观测,若记NcC,Nc,NcT,N,Nr,Nrr分别为各 个基因型的个数,p=(PCC,pPCI,PCT,pII,pIT,PTT,则有 1.NCC:NCI,NcTlnc,nI,nT,p~ MN (pc)2 2PCPI 2PCPT nc:1-(pI+Pr)1-(PI+PT)2'1-(PI+PT)2 2.NII,NITlnc,nI,nT:P~ (pr)2 2PCPI MN I2I(2PPI+() 3.NTrlnc:nI,nT:P~B(nr:pi) Previous Next First Last Back Forward 6
l Í‚q,ºÍè logf(y|p) = nCC logp2 C + nCI log(2pC pI ) + nCT log(2pC pT ) + nII log(p 2 I ) + nIT log(2pI pT ) + nT T log(p 2 T T ) + log n! nCC !nCI !nCT !nII !nIT !nT T ! duÍ‚ÿå*ˇ, ePNCC , NCI , NCT , NII , NIT , NT T ©Oèà ნ .áÍ, p = (pCC , pCI , pCT , pII , pIT , pT T ), Kk 1. NCC , NCI , NCT |nC , nI , nT , p ∼ MN nC , (pC ) 2 1 − (pI + pT ) 2 , 2pC pI 1 − (pI + pT ) 2 , 2pC pT 1 − (pI + pT ) 2 2. NII , NIT |nC , nI , nT , p ∼ MN nI , (pI ) 2 2pC pI + (pT ) 2 , 2pC pI 2pC pI + (pT ) 2 3. NT T |nC , nI , nT , p ∼ B(nT , p2 T ) Previous Next First Last Back Forward 6
从而在EM算法的第步中,对完全似然函数取期望得到 Q(plp())=ncclog(pe)+nlog(log(2pcPr)+nerlog(2pcpr) +nlog(pi)+nlog(2pipr)+nerlog(pir) k(nc,nI,nr,p(t)), 其中 nce E(Ncclnc,ni,nr.p(}=nc- 892 1-(p9+p92 ne E(Ncclnc,ni,nT,p()=nc. 2p99 1-p9+p92 ner E(Ncclnc,ni,nr,p())=nc- 2p99 1-p9+p92 p92 n E(Nuncr Previous Next First Last Back Forward 7
l 3EMé{1t⁄•, Èq,ºÍœ" Q(p|p (t) ) = n (t) CC log(p 2 C ) + n (t) CI log(log(2pC pI ) + n (t) CT log(2pC pT ) + n (t) II log(p 2 I ) + n (t) IT log(2pI pT ) + n (t) T T log(p 2 T T ) + k(nC , nI , nT , p(t) ), Ÿ• n (t) CC = E{NCC |nC , nI , nT , p(t) } = nC (p (t) C ) 2 1 − (p (t) I + p (t) T ) 2 , n (t) CI = E{NCC |nC , nI , nT , p(t) } = nC 2p (t) C p (t) I 1 − (p (t) I + p (t) T ) 2 , n (t) CT = E{NCC |nC , nI , nT , p(t) } = nC 2p (t) C p (t) T 1 − (p (t) I + p (t) T ) 2 , n (t) II = E{NII |nC , nI , nT , p(t) } = nI (p (t) I ) 2 2p (t) C p (t) I + (p (t) T ) 2 Previous Next First Last Back Forward 7
E{NITlnc,nI:nr,p())=nI 2p9 2p9p9+(p92 最后一项 k(nc,nI:nr:p()) n! Eflog- cIncrncrIniinITInTr! c,nI,nr,p(t)y 与p无关. 下面对Q(plpO)进行最大化,注意pc+pr十pT=1,于是关于pC,p1求导 aQ(plp() 2m思+n8+n_2n鼎+n+n唱 opc PC 1-PC-PI aQ(plp() 2m9+n鼎+n8 () 2n鼎+n唱+n出 OpI PI 1-PC -PI 令导数为零,得到 p+= 2n+n思+n温 2n Previous Next First Last Back Forward 8
n (t) IT = E{NIT |nC , nI , nT , p(t) } = nI 2p (t) I p (t) T 2p (t) C p (t) I + (p (t) T ) 2 . Åòë k(nC , nI , nT , p(t) ) = E{log n! nCC !nCI !nCT !nII !nIT !nT T ! |nC , nI , nT , p(t) } ÜpÃ'. e°ÈQ(p|p (t) )?1Ååz, 5øpC + pI + pT = 1, u¥'upC , pI¶ ∂Q(p|p (t) ) ∂pC = 2n (t) CC + n (t) CI + n (t) CT pC − 2n (t) T T + n (t) CT + n (t) IT 1 − pC − pI , ∂Q(p|p (t) ) ∂pI = 2n (t) II + n (t) II + n (t) CI pI − 2n (t) T T + n (t) CT + n (t) IT 1 − pC − pI -Íè", p (t+1) C = 2n (t) CC + n (t) CT + n (t) CI 2n , Previous Next First Last Back Forward 8