§3二重抛样的眈估针与回归估针 二重比估计与二重回归估计的思想与二重分层估计的思 想相类似。比估计与回归估计需要事先知道辅助变量X的平 均数或总和。如果事先并不掌握辅助变量菂平均数或者总和 的信息,但辅助变量的观察要比调查的指标Y容易得多,那 么就可以使用二重比估计或者二重回归估计。第一重抽样只 观察辅助变量的值,获得均值或者总和的估计,然后在第二 重抽样时应用比估计或者回归估计。为简单起见,本节仅讨 论对总体平均数的估计。 1、二重比估计方法 由于涉及到两个指标,一个是主调查指标Y,另一个是 辅助变量X,用数据对表示一个单元(x,y)。先从总体中抽 取一个大样本,记作: (x1,y1),(x2,y2),,(xn,yn)
二重比估计与二重回归估计的思想与二重分层估计的思 想相类似。比估计与回归估计需要事先知道辅助变量 X的平 均数或总和。如果事先并不掌握辅助变量的平均数或者总和 的信息,但辅助变量的观察要比调查的指标 Y容易得多,那 么就可以使用二重比估计或者二重回归估计。第一重抽样只 观察辅助变量的值,获得均值或者总和的估计,然后在第二 重抽样时应用比估计或者回归估计。为简单起见,本节仅讨 论对总体平均数的估计。 §3 二重抽样的比估计与回归估计 1、二重比估计方法 由于涉及到两个指标,一个是主调查指标Y,另一个是 辅助变量X,用数据对表示一个单元 。先从总体中抽 取一个大样本,记作: ( , ) x y 1 1 2 2 {( , ),( , ), ,( , )} x y x y x y n n
n是样本容量,仅对辅助变量X进行观察,计算样本均值 x=∑ 它是总体辅助变量平均数X的无偏估计。 把该样本作为总体进行第二重简单随机抽样,样本容量 n<n,得样本: (x21y21),( 229J22 2n9v2n )} 第一个下标表示第二重抽样。分别计算辅助变量与主调查指 标的样本均值 x=∑ 2j =∑ (6.7) 构造总体主调查指标平均数Y的比估计量:
n 是样本容量,仅对辅助变量X进行观察,计算样本均值 1 1 n i i x x n = = 它是总体辅助变量平均数 X 的无偏估计。 把该样本作为总体进行第二重简单随机抽样,样本容量 n n ,得样本: 21 21 22 22 2 2 {( , ),( , ), ,( , )} x y x y x y n n 第一个下标表示第二重抽样。分别计算辅助变量与主调查指 标的样本均值 构造总体主调查指标平均数 Y 的比估计量: 2 1 1 n j j x x n = = 2 1 1 n j j y y n = = (6.7)
m=yx△Rx 68) --1--1--1-÷*--+-1--1--1 这里用记号R表示y/x,根据第五章第一节的讨论,我们 知道当n足够大时,R近似地等fR=y/x,即R是R的 渐近无偏估计。因此 RD x =y (6.9) 而由第三章可知,y是总体平均数F的无偏估计。故JRD 是总体平均数Y的渐近无偏估计。 二重比估计yRD的方差r(V)的估计为: vm)=2+1-1(0232-2R) (6.10) nnn
这里用记号 表示 ,根据第五章第一节的讨论,我们 知道当 n 足够大时, 近似地等于 ,即 是 的 渐近无偏估计。因此 R ˆ R ˆ R ˆ R y x R y x = 而由第三章可知, 是总体平均数 的无偏估计。故, 是总体平均数 的渐近无偏估计。 y Y Y RD y 二重比估计 yRD 的方差 Var y( ) RD 的估计为: ˆ RD y y x R x x = (6.8) RD y y x y x = (6.9) 2 1 1 ˆ 2 2 ˆ ( ) ( 2 ) y RD x yx s v y R s Rs n n n = + − − (6.10)
这里,2,2和Sm分别为第二重样本关于主调查指标、辅助变 量的方差以及它们的协方差,即 ∑(2-y)22=∑ n n一 1(2-D)(x2 n-1 2-x)(6) 例62某县共有200个村,现要估计去年全县平均每村交售肉 猪的头数。已知肉猪的交售头数与生猪年终存栏数之间有较高 的相关性,而存栏头数的资料容易取得。采用二重比估计的方 法,先抽取80个村作为第一重样本,得年终平均每村的生猪存 栏数为1080头。然后在这80个村中又选了13个村作为第二重样 本,分别统计了年终的存栏数和交售头数,资料见下表
这里, 和 分别为第二重样本关于主调查指标、辅助变 量的方差以及它们的协方差,即 2 2 , y x s s yx s 2 2 2 1 1 ( ) 1 n y j j s y y n = = − − 2 2 2 1 1 ( ) 1 n x j j s x x n = = − − 2 2 1 1 ( )( ) 1 n yx j j j s y y x x n = = − − − (6.11) 例6.2 某县共有200个村,现要估计去年全县平均每村交售肉 猪的头数。已知肉猪的交售头数与生猪年终存栏数之间有较高 的相关性,而存栏头数的资料容易取得。采用二重比估计的方 法,先抽取80个村作为第一重样本,得年终平均每村的生猪存 栏数为1080头。然后在这80个村中又选了13个村作为第二重样 本,分别统计了年终的存栏数和交售头数,资料见下表
试估计该县去年全年平均每村交售肉猪的头数,并计算其标 准差。 村年终生猪存栏头数(x2)全年交售肉猪头数门2,) 550 610 720 780 3 1500 1600 4 1020 1030 620 600 980 1050 928 977 8 1200 1440 1350 5 10 1750 2210 670 980 12 729 865 13 1530 1710
1 2 3 4 5 6 7 8 9 10 11 12 13 550 720 1500 1020 620 980 928 1200 1350 1750 670 729 1530 610 780 1600 1030 600 1050 977 1440 1570 2210 980 865 1710 村i 2 ( )j 年终生猪存栏头数 x 2 ( )j 全年交售肉猪头数 y 试估计该县去年全年平均每村交售肉猪的头数,并计算其标 准差