第五章比估计与回归估计 →------- 前面讨论的简单随机抽样和分层抽样,我们所关心的参 数都是单指标的,给出的估计量也是线性形式。这一章我们 将要讨论比较复杂的情况,我们关心的参数不再是单指标的 而是两个或两个以上的指标。此时,遇到的统计量不再是线 性形式,往往呈现出非线性形式,比如两个变量之比,或呈 现变量之间的回归关系。 所谓回归关系就是变量之间的关系不是确定的,是带有 随机影响的。比如身高和体重的关系,身高增加时,一般来 说,体重也会增加,但又不能说一定如此。要确定身高和体 重的关系,一般用回归的方法。这类问题首先是由英国统计 学家高尔顿研究儿子的身高与父亲身高关系时提出的,他发
前面讨论的简单随机抽样和分层抽样,我们所关心的参 数都是单指标的,给出的估计量也是线性形式。这一章我们 将要讨论比较复杂的情况,我们关心的参数不再是单指标的 而是两个或两个以上的指标。此时,遇到的统计量不再是线 性形式,往往呈现出非线性形式,比如两个变量之比,或呈 现变量之间的回归关系。 第五章 比估计与回归估计 所谓回归关系就是变量之间的关系不是确定的,是带有 随机影响的。比如身高和体重的关系,身高增加时,一般来 说,体重也会增加,但又不能说一定如此。要确定身高和体 重的关系,一般用回归的方法。这类问题首先是由英国统计 学家高尔顿研究儿子的身高与父亲身高关系时提出的,他发
现儿子的身高有回到家族平均身高的趋势,因而把所得关系 式称为回归方程,于是回归的名词就沿用下来了。 *--1--1--1----1--4--1--1---- §1比估针及其性质 设有一个二元变量的总体(X,Y):(X1,H1),(X2,Y2),…,(XN,yy) 有4个参数是我们所熟悉的: X Y 指标X、Y的平均数 N-1 ∑(X1-X)2 指标X、Y的方差 S ∑(r-1)2 N-1
现儿子的身高有回到家族平均身高的趋势,因而把所得关系 式称为回归方程,于是回归的名词就沿用下来了。 §1 比估计及其性质 设有一个二元变量的总体 ( , ) X Y : 1 1 2 2 ( , ),( , ), ,( , ) X Y X Y X Y N N 有 4 个参数是我们所熟悉的: X Y 、 ————指标 X Y 、 的平均数 2 2 1 1 ( ) 1 N X i i S X X N = = − − 2 2 1 1 ( ) 1 N Y i i S Y Y N = = − − ——指标 X Y 、 的方差
在研究比估计之前,再引进一个新的参数变量之间 的协方差 Cow(,1)s、 ∑(X1-X(-Y)(5) X、Y之间的相关系数定义为: Cov(X, Y) p- Jar(x)、√ar() ∑(X-X)(x-F) (5,2) ∑(X-X)∑(x-1) 如果简单随机样本为x,y1)(i=1,2,…,n),则Cov(X,Y) 及p的估计为:
如果简单随机样本为 ,则 及 的估计为: ( , ) ( 1,2, , ) i i x y i n = Cov X Y ( , ) 在研究比估计之前,再引进一个新的参数——变量之间 的协方差: 1 1 ( , ) ( )( ) 1 N i i i Cov X Y X X Y Y N = = − − − (5.1) X Y 、 之间的相关系数定义为: ( , ) ( ) ( ) Cov X Y Var X Var Y = 1 1 1 2 2 1 1 ( )( ) ( ) ( ) N i i i N N i i i i X X Y Y X X Y Y = = = − − = − − (5.2)
S n-1 ∑(x-x)1-元)53) ∑(x-x)(1-元 54) 2 ∑(x-x)2n- i=1 在讨论比估计之前,先考察总体的两个平均数之比,即 R=Y/X 由于,分别是x,F的无偏估计,R的估计自然定义为 R=y/x
1 1 ( )( ) 1 n xy i i i S x x y y n = = − − − (5.3) 1 1 1 2 2 1 1 ( )( ) ˆ ( ) ( ) n i i i n n i i i i x x y y x x y y = = = − − = − − (5.4) 在讨论比估计之前,先考察总体的两个平均数之比,即 R Y X = 由于 x y, 分别是 X Y, 的无偏估计, R 的估计自然定义为 R y x ˆ =
假如X或X已知,总体平均数Y与总体总和Y的比估计 量定义为: JR=R·X=少 (5.5) VR=RX y=X (56) 通常的比估计是指55式与(56)式,而R则称为比值R的 估计。 由(55)式与(56)式可知,JR与yR的习性主要依赖于估计量 R,因此在不少场合,我们常用R来说明。 尽管x,分别是X,Y的无偏估计,由于R的非线性形式,因 此R关于R是有偏的,从而y,y关于Y,也是有偏的。 个合理的估计量,应该随着样本容量n的增加,估计量的 期望与参数之差应该越来越小并渐渐趋于零,即“渐近无偏
假如 或 已知,总体平均数 与总体总和 的比估计 量定义为: X X Y Y ˆ R y y y R X X X x x = = = (5.5) ˆ R y y y R X X X x x = = = (5.6) 通常的比估计是指(5.5) 式与 (5.6) 式,而 则称为比值 的 估计。 R ˆ R 由 (5.5) 式与 (5.6) 式可知, 与 的习性主要依赖于估计量 R ˆ ,因此在不少场合,我们常用 R ˆ 来说明。 R y R y 尽管 分别是 的无偏估计,由于 的非线性形式,因 此 关于 是有偏的,从而 关于 也是有偏的。 x y, X Y, R ˆ R ˆ R , R R y y Y Y, 一个合理的估计量,应该随着样本容量n 的增加,估计量的 期望与参数之差应该越来越小并渐渐趋于零,即“渐近无偏