二、估计量及其方差 在讨论二重分层抽样估计量的性质之前,我们先给出二重抽 样中对估计量θ求均值与方差的一般公式如下 E(6)=E1[E2() (6)=V[E2(6)+E1[2() 其中,E2、V为第一重抽样结果条件下对第二重抽样的均值 及方差,E1、V则是对第一重抽样的均值与方差。 据此,可以构造出二重分层抽样的总体均值估计量为 51D ∑ 其中 ∑y 为第一重样本第h层均值的无偏估计
二、估计量及其方差 在讨论二重分层抽样估计量的性质之前,我们先给出二重抽 样中对估计量 ˆ求均值与方差的一般公式如下 )] ˆ )] [ ( ˆ ) [ ( ˆ ( )], ˆ ) [ ( ˆ ( 1 2 1 2 1 2 V V E E V E E E = + = 其中,E2、V2为第一重抽样结果条件下对第二重抽样的均值 及方差,E1、V1则是对第一重抽样的均值与方差。 据此,可以构造出二重分层抽样的总体均值估计量为 = = = L h stD stD h h Y y w y 1 ˆ 其中 = = h n j hj h h y n y 1 1 为第一重样本第 h 层均值的无偏估计
可以证明元是总体均值的无偏估计量 如果第一重样本是随机样本,第二重样本为第一重样本的随 机子样本,则估计量的方差为 V(YD)=V1()+E1[V2() (1-x)+∑W("-1) S2( n' N 其中κ()为第一重抽样之方差,V2(为第二重抽样之方差
可以证明 stD y 是总体均值YstD的无偏估计量。 如果第一重样本是随机样本,第二重样本为第一重样本的随 机子样本,则估计量的方差为 = = = − + − = − + − = + L h h h h L h h h h h stD n v W S n N S n n n S W N n n S V Y V y E V y 1 2 2 1 2 2 2 1 1 2 1) 1 ( ' ) 1 ' 1 ( 1) ' ( ' ) ' (1 ' ) ( ') [ ( )] ˆ ( 其中 ( ') 1 V y 为第一重抽样之方差, ( ) 2 V y 为第二重抽样之方差
以各层的样本方差代替各层的总体方差,以 样本各层间方差代替总体方差,则可得方差 的近似无偏估计量为 stD N 公(-)2+ ∑2s5( h=1 h
以各层的样本方差代替各层的总体方差,以 样本各层间方差代替总体方差,则可得方差 的近似无偏估计量为 ) ' 1 1 ) ( ) ( 1 ' 1 ) ( ˆ ( ˆ 1 2 2 1 2 h L h h h h L h stD h h stD n n w y y w s n N V Y = = = − − + −
三、样本容量的最优分配 在二重分层抽样中,样本量最优分配的目的是按在费用一定 时使方差达到极小,或在方差一定时使费用最省的原则确定 第一重样本量n′和第二重每层样本量nh 为此,可以考虑费用函数 C=Cn+∑Cn 其中,C′为第一重抽样平均每一单元的调查费用;C是第 二重样本中h层平均每个单元的调查费用
三、样本容量的最优分配 在二重分层抽样中,样本量最优分配的目的是按在费用一定 时使方差达到极小,或在方差一定时使费用最省的原则确定 第一重样本量 n′和第二重每层样本量 h n 。 为此,可以考虑费用函数 C = C n +Ch nh ' ' 其中,C′为第一重抽样平均每一单元的调查费用;Ch是 第 二重样本中 h 层平均每个单元的调查费用
由于n是随机的,因此,我们考虑选择的n′与v,的期望费用 C=B()=Cn+n∑C"nW 另一方面,由于方差函数 W,S2,1 SID )=S ∑"-∑ hh h=1H1 h=1
由于 h n 是随机的,因此,我们考虑选择的 n′与 h v 的期望费用 = = + h h Wh C E(C) C'n' n' C v * 另一方面,由于方差函数 = = = = + − − = − + − L h h h L h h h h L h h h h stD N S n W S n v W S n S n v W S n N V Y S 1 2 2 1 2 2 1 2 2 ' ' ' 1) 1 ( ' ) 1 ' 1 ) ( ˆ (