当前位置：和泉文库 > 统计 > 浏览文档

中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第十讲 Expectation-Maximization（EM算法）方法

1 EM optimization method 1.1 EM algorithm 1.2 Convergence 1.3 Usage in exponential families 1.4 Usage in finite normal mixtures 1.5 Variance estimation 1.5.1 Louis method 1.5.2 SEM algorithm 1.5.3 Bootstrap method 1.5.4 Empirical Information 1.6 EM Variants 1.6.1 Improving the E step 1.6.2 Improving the M step 1.7 Pros and Cons

文件格式：PDF，文件大小：628.39KB，售价：10.57元

共44页，可试读15页，点击往前阅读 ↑↑

文档详细内容（约44页）

p+)= 2m鼎+n鼎+n8 2n 2m唱+n愠+n温 (t) (t) +1)= PT 2n 因此，使用以上结论便可进行EM算法：千Code moth<-function(p,n.obs){ n<-sum(n.obs) nc<-n.obs[1] ni<-n.obs[2] nt<-n.obs [3] ntt<-nt cat(p,"\n") pct<-pit<-ptt<-rep(0,20) pct[1]<-p[1] pit[1]<-p[2] ptt[1]<-1-p[1]-p[2] for(i in 2:20){ Previous Next First Last Back Forward 9

p (t+1) I = 2n (t) II + n (t) IT + n (t) CI 2n , p (t+1) T = 2n (t) T T + n (t) CT + n (t) IT 2n . œd, ¶^±˛(ÿBå?1EMé{: ↑Code moth<-function(p,n.obs){ n<-sum(n.obs) nc<-n.obs[1] ni<-n.obs[2] nt<-n.obs[3] ntt<-nt cat(p,"\n") pct<-pit<-ptt<-rep(0,20) pct[1]<-p[1] pit[1]<-p[2] ptt[1]<-1-p[1]-p[2] for(i in 2:20){ Previous Next First Last Back Forward 9

pc.old<-pct [i-1] pi.old<-pit [i-1] pt.old<-ptt [i-1] den<-pc.old~2+2*pc.old*pi.old+2*pc.old*pt.old ncc<-nc*pc.old~2/den nci<-2*nc*pc.old*pi.old/den nct<-2*nc*pc.old*pt.old/den nii<-ni*pi.old2/(pi.old-2+2*pi.old*pt.old) nit<-2*ni*pi.old*pt.old/(pi.old-2+2*pi.old*pt.old) pct [i]<-(2*ncc+nci+nct)/(2*n) pit[i]<-(2*nii+nit+nci)/(2*n) ptt[i]<-(2*ntt+nct+nit)/(2*n) return(list(pct=pct,pit=pit,ptt=ptt)) n.obs<-c(85,196,341)#observed data,n_c,n_I,n_T p<-c(1/3,1/3) a<-moth(p,n.obs) Previous Next First Last Back Forward 10

pc.old<-pct[i-1] pi.old<-pit[i-1] pt.old<-ptt[i-1] den<-pc.old^2+2*pc.old*pi.old+2*pc.old*pt.old ncc<-nc*pc.old^2/den nci<-2*nc*pc.old*pi.old/den nct<-2*nc*pc.old*pt.old/den nii<-ni*pi.old^2/(pi.old^2+2*pi.old*pt.old) nit<-2*ni*pi.old*pt.old/(pi.old^2+2*pi.old*pt.old) pct[i]<-(2*ncc+nci+nct)/(2*n) pit[i]<-(2*nii+nit+nci)/(2*n) ptt[i]<-(2*ntt+nct+nit)/(2*n) } return(list(pct=pct,pit=pit,ptt=ptt)) } n.obs<-c(85,196,341) # observed data,n_c,n_I,n_T p<-c(1/3,1/3) a<-moth(p,n.obs) Previous Next First Last Back Forward 10

pct<-aSpct pit<-aSpit ptt<-aSptt #convergence diagnostics statistic R rcc=sqrt((diff(pct)-2+diff(pit)2)/(pct [-20]-2+pit[-20]-2)) rcc=c(0,rcc)#adjusts the length to make the table below d1=(pct[-1]-pct[20])/(pct[-20]-pct[20]) d1=c(d1,0) d2=(pit[-1]-pit[20])/(pit[-20]-pit[20]) d2=c(d2,0) #Table output print(cbind(pct,pit,rcc,d1,d2)[1:9,],digits=5) Code 其中，收敛的标准为)=p山为由一次迭代到下一次送代 p-1)‖ 在p:-1)上相对改变的总量.（本例中我们以迭代10次为例，没有使用此标准控制收敛).最后两列是验证EM算法的收敛速度为线性的. Previous Next First Last Back Forward 11

pct<-a$pct pit<-a$pit ptt<-a$ptt #convergence diagnostics # statistic R rcc=sqrt( (diff(pct)^2+diff(pit)^2)/(pct[-20]^2+pit[-20]^2) ) rcc=c(0,rcc) #adjusts the length to make the table below d1=(pct[-1]-pct[20])/(pct[-20]-pct[20]) d1=c(d1,0) d2=(pit[-1]-pit[20])/(pit[-20]-pit[20]) d2=c(d2,0) #Table output print(cbind(pct,pit,rcc,d1,d2)[1:9,],digits=5) ↓Code Ÿ•,¬ÒIOèR(t) = kp (t)−p (t−1)k kp(t−1)k èdògSì eògSì 3p (t−1)˛ÉÈUCo˛. (~•·Ç±Sì10gè~,vk¶^dIOõ õ¬Ò). Å¸¥yEMé{¬ÒÑ›èÇ5. Previous Next First Last Back Forward 11

例2 Bayes后验众数考虑一个具有似然L(y),先验π(8)以及缺失数据或者参数Z(即y=(x,z)的Bayes问题.为找到后验众数，E步需要 Q(00())E{log(L(Oly)(0)k(y)),0()} EflogL(0ly)l,0()}+logn(0)+Eflogk(y)r,0()} 其中最后一项可以在最大化Q中略去，因其与无关.显然，对此Bayes.后验众数问题，和经典统计方法下的差异在于多了一项先验的对数.因此此时EM算法为 1.E步：计算Q(00(t)=E{logL(y)z,a(t)} 2.M步：计算0(t+1)=argmazQ(0lee) 考虑X=(X1,X2,X3)~MN(n,(2+θ)/4，(1-)/2,0/4)，为应用EM算法估计8，我们视完全数据为Y=(Z11,Z12,X2,X3)~MN(n,1/2,0/4,(1- 0)/2,8/4),其中Z11+Z12=X1 Previous Next First Last Back Forward 12

~2 Bayes ØÍ ƒòá‰kq,L(θ|y), kπ(θ)±9"îÍ‚ ½ˆÎÍZ(=y = (x, z)) BayesØK. èÈØÍ, E⁄Iá Q(θ|θ (t) ) = E{log(L(θ|y)π(θ)k(y))|x, θ(t) } = E{logL(θ|y)|x, θ(t) } + logπ(θ) + E{logk(y)|x, θ(t) } Ÿ•Åòëå±3ÅåzQ•—, œŸÜθÃ'. w,, ÈdBayes Ø ÍØK, ⁄²;⁄Oê{e…3uı òëkÈÍ. œddûEMé {è 1. E⁄: OéQ(θ|θ (t) ) = E{logL(θ|y)|x, θ(t)}, 2. M⁄: Oéθ (t+1) = argmaxQ(θ|θ (t) ) ƒX = (X1, X2, X3) ∼ MN(n, (2+θ)/4, (1−θ)/2, θ/4), èA^EMé {Oθ, ·Ç¿ Í‚èY = (Z11, Z12, X2, X3) ∼ MN(n, 1/2, θ/4, (1− θ)/2, θ/4), Ÿ•Z11 + Z12 = X1. Previous Next First Last Back Forward 12

因此，有 I(0Y)=(Z12+X3)loge X2log(1-0)+constants E[l(Y)1X,6]=(E[Z12lZ11+Z12=X1,]+X3)log9 +X2log(1-0)+constants X19e) =(+X)og+Xalog(1-0)+constants 考虑0的先验为Beta(a,b), x(0)= r(a+b）ga-11-b-1. (a)+T(b) 因此 Q(0j0())= X10() (+a-1)og0+(2+-1)og(1-0)+constants 所以得到 8(t+1)= X10() 2+9+X3+a- ）)/(+++a+-2） Previous Next First Last Back Forward 13

œd, k l(θ|Y ) = (Z12 + X3)logθ + X2log(1 − θ) + constants E[l(θ|Y )|X, θ(t) ] = (E[Z12|Z11 + Z12 = X1, θ(t) ] + X3)logθ +X2log(1 − θ) + constants = ( X1θ (t) 2 + θ (t) + X3)logθ + X2log(1 − θ) + constants ƒθkèBeta(a, b), π(θ) = Γ(a + b) Γ(a) + Γ(b) θ a−1 (1 − θ) b−1 . œd Q(θ|θ (t) ) = ( X1θ (t) 2 + θ (t) + X3 + a − 1)logθ + (X2 + b − 1)log(1 − θ) + constants §± θ (t+1) = X1θ (t) 2 + θ (t) + X3 + a − 1 ! . X1θ (t) 2 + θ (t) + X3 + X2 + a + b − 2 ! Previous Next First Last Back Forward 13

点击进入文档下载页（PDF格式）

共44页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第九讲 Markov Chain Monte Carlo（二）马尔科夫蒙特卡罗方法
《实用统计软件》课程教学资源（阅读材料）A History of Markov Chain Monte Carlo——Subjective Recollections from Incomplete Data
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第八讲 Markov Chain Monte Carlo（一）马尔科夫蒙特卡罗方法
《实用统计软件》课程教学资源（阅读材料）T. DiCiccio and B.Efron（1996）, Bootstrap Confidence Intervals, Statistical Science, 3,189-228
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第七讲 Boostrap方法和Jackknife方法（自助和刀切）
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第六讲 Monte Carlo方法在统计推断中的应用
《实用统计软件》课程教学资源（阅读材料）图像合成方面应用的一个介绍 Monte Carlo Integration
《实用统计软件》课程教学资源（阅读材料）多元分类问题中的应用 Variance Reduction with Monte Carlo Estimates of Error Rates in Multivariate Classication
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第五讲 Monte Carlo积分和方差减少技术
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第四讲随机数产生方法
《实用统计软件》课程教学资源（阅读材料）一份不太简短的LATEX 2ε介绍
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第三讲 LaTeX科技论文排版系统
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第十一讲 R中的数值优化方法
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第十二讲 MatLab介绍（一）
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第十三讲 MatLab介绍（二）
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第十四讲 SAS介绍
《实用统计软件》课程教学资源（阅读材料）Dan Bruns, Chattanooga, TN, An Introduction to the Simplicity and Power of SAS/Graph
中国科学技术大学：《多元统计分析》课程教学资源（课件讲义）第一讲简介及描述性统计（主讲：张伟平）
中国科学技术大学：《多元统计分析》课程教学资源（课件讲义）第二讲多元数据的可视化技术
《多元统计分析》课程教学资源（阅读材料）30 Years of Multidimensional Multivariate Visulization
《多元统计分析》课程教学资源（阅读材料）A Survey on Multivariate Data Visualization
《多元统计分析》课程教学资源（阅读材料）A visual tour of interactive graphics with R
《多元统计分析》课程教学资源（阅读材料）Lattice and Other Graphics in R
中国科学技术大学：《多元统计分析》课程教学资源（课件讲义）第三讲多元正态（I）

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录