§3数值例子 例52某地区有976个自然村,根据该地区的地貌将各村所属 耕地划为三种类型,各村按类型上报了耕地面积以亩计算) 为核实这些上报数据,采用按比例分配的分层随机抽样方法 在每一种类型中抽取若干村进行实测核实,倘若以X表示上 报数据,以Y表示实测数据抽样结果如下表 h=1 h=2 h=3 yI li y2 1241 1174 1030 652 527 2 85 945 2 931 996 627 585 961 1039 974 741 1132 1113 995 1499 1130 934 1031 5 941 831 1200 1140 838 792 561 545 6 1254 952 621 7 930 807 647 10 848 827
§3 数值例子 例5.2 某地区有976个自然村,根据该地区的地貌将各村所属 耕地划为三种类型,各村按类型上报了耕地面积(以亩计算) 为核实这些上报数据,采用按比例分配的分层随机抽样方法 在每一种类型中抽取若干村进行实测核实,倘若以 X表示上 报数据,以Y表示实测数据,抽样结果如下表: h = 1 h = 2 h = 3 i 1i i i y x1i 2i y 3i y 2i x 3i x 1 2 3 4 5 6 7 8 9 10 1241 858 961 1132 934 838 621 647 654 848 1174 945 884 1113 1031 792 586 609 599 827 1 2 3 4 5 6 7 1030 931 1039 1101 941 561 930 885 996 805 995 831 545 807 652 627 974 1499 1200 1254 527 585 741 1130 1140 952 1 2 3 4 5 6
有关计算结果及其它数据如下表: h N, W. X yI 2 2 h h 427 0.4375 36720010873.400085600001.0203274206493345710.88942055.667 0.3043251607933285783771431.14086312257123299052269.429 32520258220800 1034333845.83331.222857121470.66771846.96787713.867 n=y=x R= S N=976 826800123933007847821-1025715414643051 试对总体总和y(该地区实际耕地面积总和)用各种手法进行 估计
有关计算结果及其它数据如下表: h Nh Wh Xh nh h y h x ˆ h h h y R x = 2 Syh 2 Sxh Syxh N = 976 826800 X = 23 n = 933.6087 y = 847.7826 x = ˆ 1.101236 y R x = = 2 57745 Sy = 2 41146 Sx = 43051 Syx = 1 2 3 427 297 252 0.4375 0.3043 0.2582 367200 251600 208000 10 7 6 873.4000 933.2857 1034.3333 856.0000 837.7143 845.8333 1.020327 1.114086 1.222857 42064.933 31221.571 121470.667 45710.889 23294.905 71846.967 42055.667 22692.429 87713.867 试对总体总和 (该地区实际耕地面积总和)用各种手法进行 估计. Y
(1)简单随机抽样估计 由于分层抽样是在各层按比例分配进行的,因此可以将 23个村所得数据看作是丛总体976个村中抽取的一个较合理 的简单随机样本,上表中最后一行的数据都是基于这样的“ 简单随机样本”而计算的 j=N∵y=976×933.6087≈911202(亩) 为求精度,常用其标准差 s(1)=√m()=Nyam() 若用mr()=(-0)S,则有 nN s(j)=976× 2397×57746≈48324(亩)
(1)简单随机抽样估计 由于分层抽样是在各层按比例分配进行的,因此可以将 23个村所得数据看作是从总体976 个村中抽取的一个较合理 的简单随机样本,上表中最后一行的数据都是基于这样的“ 简单随机样本”而计算的。 y N y = = 976 933.6087 911202( ) 亩 为求精度,常用其标准差 s y Var y N Var y ( ) ( ) ( ) = = 若用 ,则有 1 1 2 ( ) ( ) Var y s y n N = − 1 1 ( ) 976 ( ) 57746 48324( ) 23 976 s y = − 亩
然而我们的这些数据毕竟是从分层抽样而得到的,利用分层 估计真正的简单随机抽样的平均数的方差,可以借用一个近 似公式(用于按比例分配的分层抽样情况)也许更为精确: N-n(n-1 ≈ s +vLy n(N-1 N-n(n-12 s++( n(N-1) W525) nN hel 此时v(y)= 76-2323-1 57745 23(976-1)23 239)(0.4375×42064933+0.3043×3121.571+0.2582×121470.660 ≈245.4235 s()≈N√v()=976xm()≈48351(亩) 两种算法的差距并不大
然而我们的这些数据毕竟是从分层抽样而得到的,利用分层 估计真正的简单随机抽样的平均数的方差,可以借用一个近 似公式(用于按比例分配的分层抽样情况)也许更为精确: 1 2 ( ) ( ) ( 1) y st N n n v y s v y n N n − − + − 2 2 1 1 1 1 ( ) ( 1) k y h yh h N n n s W s n N n n N = − − = + − − (5.25) s y N v y v y ( ) ( ) 976 ( ) 48351( ) = 亩 此时 976 23 23 1 ( ) { 57745 23(976 1) 23 v y − − = − 1 1 ( )(0.4375 42064.933 0.3043 31221.571 0.2582 121470.667)} 23 976 + − + + 245.4235 两种算法的差距并不大
(2)简单随机抽样比估计 n=2X=RX=1.101236×826800=910502(亩) 一一一一一-一一一一一一一一一一一一■ s()≈/(1-f (S2+R22-2RS)=23095(亩) n (3)分层随机抽样简单估计 j=∑N=910780(亩) h=1 s(x)=N√v(x)=N ∑W hh h=1 =976 23%(0.475×42064.933+03043×3122571+0,2582×140.667 48975亩)
(2)简单随机抽样比估计 ˆ 1.101236 826800 910502( ) R y y X RX x = = = = 亩 2 2 2 (1 ) ˆ ( ) ( R y x f s y N S R S n − + ˆ 2 ) 23095( ) − = RSxy 亩 (3)分层随机抽样简单估计 1 910780( ) k st h h h y N y = = = 亩 ( ) ( ) st st s y N v y = 2 1 1 1 ( ) k h h h N W S n N = = − 1 1 976 ( )(0.4375 42064.933 0.3043 31221.571 0.2582 121470.667) 23 976 = − + + = 48975(亩)