第五章比估计与回归估计 前面讨论的简单随机抽样和分层抽样,我们所关心的参 数都是单指标的,给出的估计量也是线性形式。这一章我们 将要讨论比较复杂的情况,我们关心的参数不再是单指标的 而是两个或两个以上的指标。此时,遇到的统计量不再是线 性形式,往往呈现出非线性形式,比如两个变量之比,或呈 现变量之间的回归关系。 所谓回归关系就是变量之间的关系不是确定的,是带有 随机影响的。比如身高和体重的关系,身高增加时,一般来 说,体重也会增加,但又不能说一定如此。要确定身高和体 重的关系,一般用回归的方法。这类问题首先是由英国统计 学家高尔顿研究儿子的身高与父亲身高关系时提出的,他发
前面讨论的简单随机抽样和分层抽样,我们所关心的参 数都是单指标的,给出的估计量也是线性形式。这一章我们 将要讨论比较复杂的情况,我们关心的参数不再是单指标的 而是两个或两个以上的指标。此时,遇到的统计量不再是线 性形式,往往呈现出非线性形式,比如两个变量之比,或呈 现变量之间的回归关系。 第五章 比估计与回归估计 所谓回归关系就是变量之间的关系不是确定的,是带有 随机影响的。比如身高和体重的关系,身高增加时,一般来 说,体重也会增加,但又不能说一定如此。要确定身高和体 重的关系,一般用回归的方法。这类问题首先是由英国统计 学家高尔顿研究儿子的身高与父亲身高关系时提出的,他发
现儿子的身高有回到家族平均身高的趋势,因而把所得关系 式称为回归方程,于是回归的名词就沿用下来了。 §1比估计及其性质 设有一个二元变量的总体(X,Y):(X1,H1),(X2,Y2)…,(XN,YN) 有4个参数是我们所熟悉的: X、Y 指标X、Y的平均数 S2=~-12(X-X) 指标X、Y的方差 =N=12(-Y)
现儿子的身高有回到家族平均身高的趋势,因而把所得关系 式称为回归方程,于是回归的名词就沿用下来了。 §1 比估计及其性质 设有一个二元变量的总体 ( , ) X Y : 1 1 2 2 ( , ),( , ), ,( , ) X Y X Y X Y N N 有 4 个参数是我们所熟悉的: X Y 、 ————指标 X Y 、 的平均数 2 2 1 1 ( ) 1 N X i i S X X N = = − − 2 2 1 1 ( ) 1 N Y i i S Y Y N = = − − ——指标 X Y 、 的方差
在研究比估计之前,再引进一个新的参数变量之间 的协方差 -+-1∑(x1-X)(x-)61 Cov(X,n) X、Y之间的相关系数定义为: Cov(X, Y) ar(x) ar(r) ∑(X-X) (5.2) ∑(X-x)|∑(x-P) 如果简单随机样本为x1,y)(=1,2,…,n),则Cov(X,Y) 及p的估计为:
如果简单随机样本为 ,则 及 的估计为: ( , ) ( 1,2, , ) i i x y i n = Cov X Y ( , ) 在研究比估计之前,再引进一个新的参数——变量之间 的协方差: 1 1 ( , ) ( )( ) 1 N i i i Cov X Y X X Y Y N = = − − − (5.1) X Y 、 之间的相关系数定义为: ( , ) ( ) ( ) Cov X Y Var X Var Y = 1 1 1 2 2 1 1 ( )( ) ( ) ( ) N i i i N N i i i i X X Y Y X X Y Y = = = − − = − − (5.2)
∑(x1-x)(n-)(53) ∑(x-x)(-y) (54) 2 ∑(x-x)∑(y1- i=1 在讨论比估计之前,先考察总体的两个平均数之比,即 R=Y/X 由于x,y分别是X,Y的无偏估计,R的估计自然定义为 R=y/x
1 1 ( )( ) 1 n xy i i i S x x y y n = = − − − (5.3) 1 1 1 2 2 1 1 ( )( ) ˆ ( ) ( ) n i i i n n i i i i x x y y x x y y = = = − − = − − (5.4) 在讨论比估计之前,先考察总体的两个平均数之比,即 R Y X = 由于 x y, 分别是 X Y, 的无偏估计, R 的估计自然定义为 R y x ˆ =
假如X或X已知,总体平均数Y与总体总和Y的比估计 量定义为: DR=RX=YX=YX (55) ja=R·X=yx 〓 (56) 通常的比估计是指55)式与(56)式,而R则称为比值R的 估计。 由(5.5)式与(5.6)式可知,JR与yR的习性主要依赖于估计量 R,因此在不少场合,我们常用R来说明 尽管x,y分别是X,Y的无偏估计,由于R的非线性形式,因 此R关于R是有偏的,从而y,VR关于Y,Y也是有偏的。 个合理的估计量,应该随着样本容量n的增加,估计量的 期望与参数之差应该越来越小并渐渐趋于零,即“渐近无偏
假如 或 已知,总体平均数 与总体总和 的比估计 量定义为: X X Y Y ˆ R y y y R X X X x x = = = (5.5) ˆ R y y y R X X X x x = = = (5.6) 通常的比估计是指(5.5) 式与 (5.6) 式,而 则称为比值 的 估计。 R ˆ R 由 (5.5) 式与 (5.6) 式可知, 与 的习性主要依赖于估计量 R ˆ ,因此在不少场合,我们常用 R ˆ 来说明。 R y R y 尽管 分别是 的无偏估计,由于 的非线性形式,因 此 关于 是有偏的,从而 关于 也是有偏的。 x y, X Y, R ˆ R ˆ R , R R y y Y Y, 一个合理的估计量,应该随着样本容量n 的增加,估计量的 期望与参数之差应该越来越小并渐渐趋于零,即“渐近无偏