当前位置：和泉文库 > 统计 > 浏览文档

中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第七讲 Boostrap方法和Jackknife方法（自助和刀切）

1 Bootstrap and Jackknife 1.1 The Bootstrap 1.1.1 Bootstrap Estimation of Standard Error 1.1.2 Bootstrap Estimation of Bias 1.2 Jackknife 1.3 Jackknife-after-Bootstrap 1.4 Bootstrap Confidence Intervals 1.4.1 The Standard Normal Bootstrap Confidence Interval 1.4.2 The Percentile Bootstrap Confidence Interval 1.4.3 The Basic Bootstrap Confidence Interval 1.4.4 The Bootstrap t interval 1.5 Better Bootstrap Confidence Intervals 1.6 Application: Cross Validation

文件格式：PDF，文件大小：709.98KB，售价：11.68元

共49页，可试读17页，点击往前阅读 ↑↑

文档详细内容（约49页）

为0.115. 例3使用boot函数进行Bootstrap估计标准差在R中，包boot里的boot函数可以进行Bootstrap估计.boot函数中的参数statistic是一个函数，用来返回感兴趣的统计量值.这个函数必须至少有两个参数，其中第一个是数据，第二个表示Bootstrap抽样中的指标向量，频率或者权重等.因此我们首先写一个函数计算().用i=(i1,·,i)表示指标向量，则计算相关系数的程序为 TCode tau<-function(x,i){ x1<-x[1,] cor(x1[,1],xi[,2]) Code 然后我们就可以使用boot函数进行Bootstrap估计： library(boot) #for boot function obj <boot(data law,statistic tau,R 2000) Previous Next First Last Back Forward 9

è0.115. ~3 ¶^bootºÍ?1BootstrapOIO 3R•, ùbootpbootº Íå±?1BootstrapO. boot ºÍ•ÎÍstatistic¥ òáºÍ, ^5à £a,⁄O˛ä. ˘áºÍ7Lñk¸áÎÍ, Ÿ•1òá¥Í‚, 1 áL´Bootstrap ƒ•çIï˛, ™«½ˆ. œd·Çƒkòá ºÍOéθˆ(b) . ^i = (i1, · · · , in) L´çIï˛, KOéÉ'XÍßSè ↑Code tau<-function(x,i){ xi<-x[i,] cor(xi[,1],xi[,2]) } ↓Code ,·Ç“å±¶^bootºÍ?1BootstrapO: ↑Code library(boot) #for boot function obj <- boot(data = law, statistic = tau, R = 2000) Previous Next First Last Back Forward 9

obj alternative method for std.error y <-objst sd(y) detach(package:boot) Code 观测到的9值用t1*标出.2000次重复下的Bootstrap标准差估计为0.1326418. 和boot函数相似功能的函数是bootstrap包里的oootstrap函数.使用此函数重复上述问题的程序如下 FCode library(bootstrap) #for boot function n<-15 theta <-function(i,x){cor(x[i,1],x[i,2]) results <bootstrap(1:n,2000,theta,lav) sd(results$thetastar)#0.1325971 detach(package:bootstrap) Code Previous Next First Last Back Forward 10

obj # alternative method for std.error y <- obj$t sd(y) detach(package:boot) ↓Code *ˇθˆä^t1∗I—. 2000gEeBootstrapIOOè 0.1326418. ⁄bootºÍÉqıUºÍ¥bootstrapùpbootstrapºÍ. ¶^ dºÍE˛„ØKßSXe ↑Code library(bootstrap) #for boot function n <- 15 theta <- function(i,x){ cor(x[i,1],x[i,2]) } results <- bootstrap(1:n,2000,theta,law) sd(results$thetastar) #0.1325971 detach(package:bootstrap) ↓Code Previous Next First Last Back Forward 10

两个函数的用法上有些差异，bootstrap包是收录了Efron&Tibshirani的书里的程序和数据.boot包是收录了Davson&Hinkley的书里的程序和数据. 1.1.2 Bootstrap Estimation of Bias 的一个估计量的偏差定义为 bias(0)=E0-0. 当的分布未知或者形式很复杂使得期望的计算不可能（从此分布中抽样变得很困难，Monte Carlo方法不可行)，以及在现实中，我们也不知道的真值时（需要估计），这种情况下偏差是未知的.但是我们已经有了样本，是0的估计，而期望E8可以通过Bootstrap方法进行估计.从而可以得到偏差的估计： biasB(0)=E*0*-6. E*表示Bootstrap经验分布， Previous Next First Last Back Forward 11

¸áºÍ^{˛k …, bootstrapù¥¬¹ Efron & Tibshirani÷ pßS⁄Í‚. boot ù¥¬¹ Davson & Hinkley÷pßS⁄Í‚. 1.1.2 Bootstrap Estimation of Bias θòáO˛θˆ†½¬è bias(θˆ) = Eθˆ − θ. θˆ©Ÿô½ˆ/™ÈE,¶œ"OéÿåU(ld©Ÿ•ƒC È(J, Monte Carloê{ÿå1), ±93y¢•, ·Çèÿθ˝ä û(IáO), ˘´ú¹e†¥ô. ¥·ÇÆ²k , θˆ¥θ O, œ"Eθˆå±œLBootstrapê{?1O. l å±†O: bias dB(θˆ) = E ∗ θˆ∗ − θ. ˆ E∗L´Bootstrap²©Ÿ. Previous Next First Last Back Forward 11

因此一个估计量的偏差的Bootstrap估计，是通过使用当前样本下的估计量来估计0，而使用的Bootstrap重复来估计EA.对一个有限样本x= (x1,·,xn),有(x)的B个ii.d估计量6).则{(6)}的均值是期望值E*的无偏估计，因此偏差的Bootstrap估计为 biasB(0)=-6. 这里存=音∑日，).正的偏差意味着平均来看过高估计了：而负的偏差意味着平均来看过低估计了0.因此，一个经过偏差修正(Bias-correction)的估计量为 6=6-biasB(0). 例4 Bootstrap偏差估计：估计上例中样本相关系数的偏差 theta.hat <-cor(law$LSAT,law$GPA) #bootstrap estimate of bias B<-2000 #larger for estimating bias Previous Next First Last Back Forward 12

œdòáO˛†BootstrapO, ¥œL¶^ce O˛θˆ5Oθ, ¶^θˆBootstrapE5OEθˆ. ÈòákÅx = (x1, · · · , xn), kθˆ(x)Bái.i.dO˛θˆ(b) . K{θˆ(b)}˛ä¥œ"äEθˆ∗ Ã†O, œd†BootstrapOè bias dB(θˆ) = θˆ∗ − θ. ˆ ˘pθˆ∗ = 1 B PB b=1 θˆ(b) . †øõXθˆ²˛5wLpO θ; K† øõXθˆ²˛5wL$O θ. œd, òá²L†?(Bias-correction) O˛è θ˜ = θˆ − bias dB(θˆ). ~4 Bootstrap†O: O˛~•É'XÍ† ↑Code theta.hat <- cor(law$LSAT, law$GPA) #bootstrap estimate of bias B <- 2000 #larger for estimating bias Previous Next First Last Back Forward 12

n <nrow(law) theta.b <-numeric(B) for (b in 1:B){ i <-sample(1:n,size n,replace TRUE) LSAT <law$LSAT[i] GPA <law$GPA[i] theta.b[b]<-cor(LSAT,GPA) ] bias <-mean(theta.b-theta.hat) bias Code 这个值和例3中的boot函数返回的结果非常相近例5 Bootstrap偏差估计：假设x=(e1,·,c10)~N(4,g2),求a的估计量2=∑1（红：-）的偏差 TCode n<-10 x<-rnorm(n,mean=0,sd=10) Previous Next First Last Back Forward 13

n <- nrow(law) theta.b <- numeric(B) for (b in 1:B) { i <- sample(1:n, size = n, replace = TRUE) LSAT <- law$LSAT[i] GPA <- law$GPA[i] theta.b[b] <- cor(LSAT, GPA) } bias <- mean(theta.b - theta.hat) bias ↓Code ˘áä⁄~3•bootºÍà£(Jö~ÉC. ~5 Bootstrap†O: bx = (x1, · · · , x10) ∼ N(µ, σ2 ), ¶σ 2O ˛ σˆ 2 = 1 n Pn i=1(xi − x¯) 2† ↑Code n<-10 x<-rnorm(n,mean=0,sd=10) Previous Next First Last Back Forward 13

点击进入文档下载页（PDF格式）

共49页，可试读17页，点击继续阅读 ↓↓

您可能感兴趣的文档

中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第六讲 Monte Carlo方法在统计推断中的应用
《实用统计软件》课程教学资源（阅读材料）图像合成方面应用的一个介绍 Monte Carlo Integration
《实用统计软件》课程教学资源（阅读材料）多元分类问题中的应用 Variance Reduction with Monte Carlo Estimates of Error Rates in Multivariate Classication
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第五讲 Monte Carlo积分和方差减少技术
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第四讲随机数产生方法
《实用统计软件》课程教学资源（阅读材料）一份不太简短的LATEX 2ε介绍
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第三讲 LaTeX科技论文排版系统
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第二讲 R语言基础（二）
《实用统计软件》课程教学资源（阅读材料）R for beginner（中文第二版，共七章）
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第一讲 R语言基础（一）
中国科学技术大学：《数理统计》课程教学资源（课件讲义）第十四讲回归分析（线性回归模型）
《数理统计》课程教学资源（参考资料）Bayes Factor - What They Are and What They Are Not
《实用统计软件》课程教学资源（阅读材料）T. DiCiccio and B.Efron（1996）, Bootstrap Confidence Intervals, Statistical Science, 3,189-228
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第八讲 Markov Chain Monte Carlo（一）马尔科夫蒙特卡罗方法
《实用统计软件》课程教学资源（阅读材料）A History of Markov Chain Monte Carlo——Subjective Recollections from Incomplete Data
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第九讲 Markov Chain Monte Carlo（二）马尔科夫蒙特卡罗方法
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第十讲 Expectation-Maximization（EM算法）方法
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第十一讲 R中的数值优化方法
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第十二讲 MatLab介绍（一）
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第十三讲 MatLab介绍（二）
中国科学技术大学：《实用统计软件》课程课件讲义（统计计算与软件）第十四讲 SAS介绍
《实用统计软件》课程教学资源（阅读材料）Dan Bruns, Chattanooga, TN, An Introduction to the Simplicity and Power of SAS/Graph
中国科学技术大学：《多元统计分析》课程教学资源（课件讲义）第一讲简介及描述性统计（主讲：张伟平）
中国科学技术大学：《多元统计分析》课程教学资源（课件讲义）第二讲多元数据的可视化技术

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录