当然在计算机数据文件里它是排成2列,而不是6列。使用我们自编的异方差检验程序, 算得原始资料回归方程为 X1=92903+06378X (3.1.16) 再将p对X回归,得方程 =-0.7426+00101X (3.1.17) 程序算得统计量 Q=52140 (3.1.18) 从程序自带的电子数表上查得x09(1)=66349,因为5214066349,故在001的显著性水平 不认为异方差存在,于是有了进一步回归分析的可能。当取显著性水平为005时,xa29(1) 3.8414,于是认为异方差存在,就只打印一般最小二乘回归结果,不能作出基于正态同方差的 统计检验 实际计算执行过程如下,由于F统计量高达472,再看拟合效果图(图3.12.2),(,) 与(Y1,)确实拟合非常好。很难想象这里面还会有什么问题。下面是计算过程与结果 异方差资料BPG检验计算程序,例3.1.2 第一列为Y,以后各列为X 例312D数据文件中,n=60,M=1 要显示原始资料吗?0=不显示,1=显示(0) 原始资料回归方程:Y=b0+bl*Ⅺ1+….+bm*Xm 回归系数b0b1,b2,9.29036378 残差平方和:472231回归平方和:83773.38 误差方差的估计 0000标准差 8.8716 请输入卡方检验的置信水平(0.01) BPG检验结果:显著性水平:01统计量52140卡方临界值:66349 方差资料回归方程:Pi=a0+al*X1+…+am*Xm 回归系数a0,a,a2 74260101 0000 残差平方和 9782回归平方和 误差方差的估计:000标准差=1.2768 BPG检验通过,不认为有异方差,对原始资料进行一般回归分析并打印计算结果 现在作线性回归显著性检验,计算tF,R统计量 请输入显著性水平a,通常取a=0.01,0.05,0.10,a=?(0.01) 线性回归分析计算结果
6 当然在计算机数据文件里它是排成 2 列,而不是 6 列。使用我们自编的异方差检验程序, 算得原始资料回归方程为 Yi 6378Xi 9.2903 0. ˆ = + (3.1.16) 再将 pi 对 Xi 回归,得方程 pi 0101Xi ˆ = −0.7426 + 0. (3.1.17) 程序算得统计量 = 5.2140 (3.1.18) 从程序自带的电子数表上查得 (1) 2 0.99 =6.6349,因为 5.2140<6.6349,故在 0.01 的显著性水平, 不认为异方差存在,于是有了进一步回归分析的可能。当取显著性水平为 0.05 时, (1) 2 0.95 = 3.8414,于是认为异方差存在,就只打印一般最小二乘回归结果,不能作出基于正态同方差的 统计检验。 实际计算执行过程如下,由于 F 统计量高达 4722,再看拟合效果图 (图 3.1.2.2),( Y I i , ) 与( Y I i , ˆ )确实拟合非常好。很难想象这里面还会有什么问题。下面是计算过程与结果。 ------------------------------------------------------------------------------------------------------------------------- 异方差资料 BPG 检验计算程序, 例 3.1.2. 第一列为 Y, 以后各列为 X 例 312.D 数据文件中, n=60, M=1 要显示原始资料吗? 0=不显示, 1=显示 (0) 原始资料回归方程 : Y = b0 + b1*X1 + ... + bm*Xm 回归系数 b0,b1,b2, 9.2903 .6378 .0000 残差平方和: 4722.31 回归平方和: 83773.38 误差方差的估计 : .0000 标准差 = 8.8716 请输入卡方检验的置信水平 (0.01) BPG 检验结果: 显著性水平: .01 统计量 5.2140 卡方临界值: 6.6349 方差资料回归方程 : Pi = a0 + a1*X1 + ... + am*Xm 回归系数 a0,a1,a2, -.7426 .0101 .0000 残差平方和: 97.82 回归平方和: 20.86 误差方差的估计 : .0000 标准差 = 1.2768 BPG 检验通过, 不认为有异方差, 对原始资料进行一般回归分 析并打印计算结果 现在作线性回归显著性检验, 计算 t,F,R 统计量 请输入显著性水平 a, 通常取 a=0.01, 0.05, 0.10, a=? (0.01) ----------------------------------------------------- 线 性 回 归 分 析 计 算 结 果
样本总数60 自变量个数 回归方程Y=b0+bl*X1+.+bl*Xl 9.2903+ 6378X1 回归系数b0,bl,b2,,bl 9.2903 6378 残差平方和:472231回归平方和:83773.38 误差方差的估计 78.7051标准差=8.8716 线性回归显着性检验显著性水平:010 回归方程整体显著性F检验,H0bO=b1=.=bl F统计量:10289160F临界值F(1,58)7.093 全相关系数R 9730 回归系数逐一显著性t检验,H0bi=0,i=1,,1 t临界值t58)2.3924 回归系数bl-bl的t值:7.6158 要作回归预测吗?键入0=不预测,1=要预测(0) 要打印拟合数据吗?0=不打印,1=打印(0) 计算结束。 圖3.1.2.2 250 200 150 原始数据 100 拟合数据 39E883斯守界的后 再看原始资料的散点图(Y,X1)(图3.1.23),觉得资料似乎分为两段,前段方差较小,后
7 样本总数 60 自变量个数 1 ----------------------------------------------------- 回归方程 Y = b0+b1*X1+...+b1*X1 Y = 9.2903 + .6378 X1 回归系数 b0, b1, b2, ..., b1 9.2903 .6378 ----------------------------------------------------- 残差平方和: 4722.31 回归平方和: 83773.38 误差方差的估计 : 78.7051 标准差 = 8.8716 ----------------------------------------------------- 线 性 回 归 显 着 性 检 验 显著性水平 : .010 ----------------------------------------------------- 回归方程整体显著性 F 检验, H0:b0=b1=...=b1=0 F 统计量: 1028.9160 F 临界值 F(1, 58) 7.093 全相关系数 R : .9730 ----------------------------------------------------- 回归系数逐一显著性 t 检验, H0:bi=0, i=1,...,1 t 临界值 t( 58) 2.3924 回归系数 b1-b 1 的 t 值: 7.6158 ----------------------------------------------------- 要作回归预测吗? 键入 0=不预测, 1=要预测 (0) 要打印拟合数据吗? 0=不打印, 1=打印 (0) 计算结束。 ------------------------------------------------------------------------------------------------------------------------- 圖3.1.2.2 0 50 100 150 200 250 1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 原始数据 拟合数据 再看原始资料的散点图 (Yi, Xi ) (图 3.1.2.3),觉得资料似乎分为两段,前段方差较小,后
段方差较大 279.50 237.60 195.71 153.82 111.92 70.03 TTT 47.86"7.85107.84137.82167.81197.80 再看残差图[e2,F](图3.24,确实存在明显的异方差,在y=140以前,方差较小 在Y=140以后,方差明显增大 这些图像都由本软件自动生成,很方便 431.14 340.6D 159.52 21.56 47.867.85107.84137.82167.81197.80 图3.1.24 第二节协方差为对角阵的广义线性模型 、协方差为已知对角阵与广义最小二乘 我们先考虑简单的情况,设模型为
8 段方差较大。 图 3.1.2.3 再看残差图[ i Yi e ˆ , 2 ](图 3.1.2.4), 确实存在明显的异方差,在 Y=140 以前,方差较小, 在 Y=140 以后,方差明显增大。 这些图像都由本软件自动生成,很方便。 图 3.1.2.4 第二节 协方差为对角阵的广义线性模型 一、协方差为已知对角阵与广义最小二乘 我们先考虑简单的情况,设模型为
Y=XB+a (3.2.1) E(E)=0,la(E)=Φ=diug(G12,O2,…,Gn) 如果σ2,i=1,…,n已知,也就是已知,则我们定义B的广义最小二乘估计为 X-Y 广义最小二乘估计( Generalized Least Square Estimate)简称为GLS估计,是A.C. Aitken(1934) 首先提出来的。 在中是对角阵的情形,容易找到 P=diag(o,- 使得 PP=Φ (3.24) 我们定义变换 X=PX,Y=PY.E′=PE (3.2.5) 则原模型成为 X B (3.26) LE(E)=0,var(e)=I B=(XX)XY (3.2.7) 这就转化成了普通的最小二乘估计 这种情况的估计也称为加权最小二乘估计( Weighted Least Square Estimate,wLS估计), 因为我们实际上是对观测值作了加权处理,权函数是;,i=1…,n。此时我们极小化的函数 =(Y-B)Φ(Y-HB) (3.2.8) 我们看到,较小的σ;将使该项变大,从而发挥较大的作用,而较大的σ;表示该项资料不可靠 就使其发挥较小的作用。这一点从 B=∑aXX∑a2x (3.2.9) 也容易看出 仅含两个未知方差量的模型
9 = = = = + ( ) 0, ( ) ( , , , ) 2 2 2 2 E Var diag 1 n Y X (3.2.1) 如果 i ,i 1, , n 2 = 已知,也就是Φ已知,则我们定义β的广义最小二乘估计为 X X X Y 1 1 1 ( ) ˆ − − − = (3.2.2) 广义最小二乘估计 (Generalized Least Square Estimate) 简称为 GLS 估计,是 A. C. Aitken(1934) 首先提出来的。 在Φ是对角阵的情形,容易找到 ( , , , ) 1 1 2 1 1 − − − P = diag n (3.2.3) 使得 −1 PP = (3.2.4) 我们定义变换 X = PX Y = PY = P * * * , , (3.2.5) 则原模型成为 = = = + n E Var I Y X ( ) 0, ( ) * * * * * (3.2.6) *' * 1 *' * ( ) ˆ X X X Y − = (3.2.7) 这就转化成了普通的最小二乘估计。 这种情况的估计也称为加权最小二乘估计 (Weighted Least Square Estimate, WLS 估计), 因为我们实际上是对观测值作了加权处理,权函数是 i ,i 1, ,n −1 = 。此时我们极小化的函数 是 = − = − − n i i i Y X Y X 1 1 2 ( ) ( ) (3.2.8) 我们看到,较小的σi 将使该项变大,从而发挥较大的作用,而较大的σi 表示该项资料不可靠, 就使其发挥较小的作用。这一点从 = − − = − = n i i i n i i Xi Xi X Y 1 2 1 1 ˆ 2 (3.2.9) 也容易看出。 二、仅含两个未知方差量的模型
下面考虑方差未知的情况,很明显这时未知方差不能太多。如果是Φ=dlag(a2,…,o2) 全部未知,我们就无从下手了。因为一共只有n组资料,如何去估计n个方差? 我们就假定只有两个方差量的情况,a2与G2未知,模型被划分为 B 82 这里Ynx1,Xmxm,B nI n。 (12),X=(x1X2)2E'=(si2 o 0 E2) 0 这样模型可以被划分成两个模型,它们必须要有相同的回归系数,但方差则不同 X,B+E,, ar(e (3.2.12) Y,=X2B+E,, ar(a)=o,I 我们当然不能想象这两个子模型完全分开,各算各的。 在G和2已知时,由前一段的广义最小二乘方法,有 B=Crwb-lxylxoly(XiXi+XiX(x'Y+xY (3.2.13) 现在情况是G与a2未知,必须先估计它们。这倒不难,方差是分开的,在各自的子模型中 估计就是了 (X-X1B)(1-XB,i=1 n (3.2.14) B=(X: X X 在有了各自的方差估计后,在(32.13中以G换a2就回到B的估计 B=(X-X-X(p-Y X1X2X2X'Y x2Y2 (3.2.15) 0. 0 可以证明B的渐近性质 (3.2.16)
10 下面考虑方差未知的情况,很明显这时未知方差不能太多。如果是 ( , , ) 2 2 = diag 1 n 全部未知,我们就无从下手了。因为一共只有 n 组资料,如何去估计 n 个方差? 我们就假定只有两个方差量的情况, 2 2 2 1与 未知,模型被划分为 + = 2 1 2 1 2 1 X X Y Y (3.2.10) 这里 Y X i n n n i i i in 1 , in m , m1 , in 1 , = 1,2; 1 + 2 = 。 ( ), ( ), ( ) 1 2 1 2 1 2 Y = YY X = XX = 。 = = 2 1 2 2 2 1 1 2 2 1 0 0 ( ) ( ) n n I I Var E (3.2.11) 这样模型可以被划分成两个模型,它们必须要有相同的回归系数,但方差则不同。 = + = = + = 2 2 2 2 2 2 2 1 2 1 1 1 1 1 , ( ) , ( ) n n Y X Var I Y X Var I (3.2.12) 我们当然不能想象这两个子模型完全分开,各算各的。 在 2 1 和 2 2 已知时,由前一段的广义最小二乘方法,有 + + = = − − − − 2 2 2 2 2 1 1 1 1 2 2 2 2 2 1 1 1 1 1 1 ( ) ˆ X X X X X Y X Y X X X Y (3.2.13) 现在情况是 2 1 与 2 2 未知,必须先估计它们。这倒不难,方差是分开的,在各自的子模型中 估计就是了: = = − − = − = − = − ( ) , 1,2 ˆ ), 1,2 ˆ ) ( ˆ ( 1 1 2 X X X Y i Y X Y X i n m n m S i i i i i i i i i i i i i RS i (3.2.14) 在有了各自的方差估计后,在 (3.2.13)中以 2 ˆ i 换 2 i 就回到β的估计 + + = = − − − − 2 2 2 2 2 1 1 1 1 2 2 2 2 2 1 1 1 1 1 1 ˆ ˆ ˆ ˆ ( ) ˆ ˆ X X X X X Y X Y X X X Y (3.2.15) 可以证明 ˆ ˆ 的渐近性质 ) ) ˆ ) (0,( ˆ ˆ ( −1 −1 n − ⎯→N X X d (3.2.16)