§34多元线性回归模型的预测 E(Y0)的置信区间 二、Y0的置信区间
§3.4 多元线性回归模型的预测 一、E(Y0 )的置信区间 二、Y0的置信区间
对于模型 Y=XB 给定样本以外的解释变量的观测值 X0=(1,X10X20.x0),可以得到被解释变量的预 测值: 它可以是总体均值E(Y0)或个值Y0的预测 但严格地说,这只是被解释变量的预测值的估 计值,而不是预测值。 为了进行科学预测,还需求出预测值的置信 区间,包括EY0和Y的置信区间
对于模型 Y ˆ = Xβ ˆ 给 定 样 本 以 外 的 解 释 变 量 的 观 测 值 X0=(1,X10,X20,…,Xk0 ),可以得到被解释变量的预 测值: ˆ X β ˆ Y0 = 0 它可以是总体均值E(Y0 )或个值Y0的预测。 但严格地说,这只是被解释变量的预测值的估 计值,而不是预测值。 为了进行科学预测,还需求出预测值的置信 区间,包括E(Y0 )和Y0的置信区间
、E(Y0的置信区间 易知 E(O=E(XOB=XE(B)=XoB=ECO Var(Yo=E(XoB-XoB)=E(XO(B-B)Xo(B-B) 由于X0(B-B)为标量,因此 r()=E(X(B-B)(B-6)X6) XE(B-B(B-B)X -O (XX)"XO
一、E(Y0 )的置信区间 易知 ) ( ) ˆ ) ( ˆ ) ( ˆ ( E Y0 = E X0β = X0 E β = X0β= E Y0 )) ˆ ˆ ) ( ˆ ) ( ˆ ( 2 Var Y0 = E X0β− X0β = E X0 (β−β)X0 (β−β 0 1 0 2 0 0 0 ( ) ˆ ˆ ) ˆ ˆ ) ( ˆ ( X X X X X (β β)(β β) X X (β β)(β β) X 0 0 = = − − = − − − E Var Y E
容易证明 。~N(XBa2XCXX)X 取随机扰动项的样本估计量σ2,构造如下t统计量 Y-E(0) t(n-k-1) Xo(XX)X 于是,得到(1-a)的置信水平下E(Y)的置信区间: 0-12×GX0(XX)2X6<E()<+t×a√X0(XX)X0 其中,t2为(1-a)的置信水平下的临界值
容易证明 ~ ( , ) ˆ 0 2 0 X β X (X X) X 1 0 0 − Y N ~ ( 1) ˆ ˆ − − − − t n k Y E(Y ) 0 0 0 1 X0 (X X) X 于是,得到(1-)的置信水平下E(Y0 )的置信区间: 0 1 0 0 0 0 1 0 0 ˆ ( ) ˆ ˆ ( ) ( ) ˆ 2 2 − X XX X + X XX X − − Y t E Y Y t 其中,t/2为(1-)的置信水平下的临界值
二、Y的置信区间 如果已经知道实际的预测值Y,那么预测误差为: 容易证明 E(e0)=E(X。B+40-XB) E(40-X0(B-B) E(uo-Xo(Xx)Xu 0 Var(eo=e(eo) E(4-X0(XX)x)2 a2(1+X0(XX)X0)
二、Y0的置信区间 如果已经知道实际的预测值Y0,那么预测误差为: 0 0 0 Y Y ˆ e = − 容易证明 0 ( ( ) ) )) ˆ ( ( ) ˆ ( ) ( 1 0 0 0 0 0 0 0 0 = = − = − − = + − X X X − X μ X β β X β X β E E E e E (1 ( ) ) ( ( ) ) ( ) ( ) 0 1 0 2 1 2 0 0 2 0 0 X X X X X X X X μ = + = − = − − E Var e E e