第七章不等概率抽样 到目前为止,我们所讨论的两种抽样方法一简单随机抽 样和分层抽样都有一个共同的特点:总体或层中每个个体被 抽中入样的概率都是相同的。对于各单元所处地位几乎“ 平等”的总体,这种抽样原则既公正又方便。但在许多社 会经济活动中并非所有单元地位相同,这时就需要采用不等 概率抽样方法 例如,要了解上海地区钢铁企业的景气状况,总体有上 钢一厂、三厂、五厂……等等,再加上宝钢。由于宝钢规模 极大,它是否景气对整个上海地区钢铁工业起着至关重要的 作用。而在抽样中将它与其它规模较小的单位处于同等地位 就会既不公正又使抽样推断结果有较大可能发生大的偏差。 这个例子提示我们,若对总体单元进行不等概率抽样,使得 “大”单元入样概率大,“小”单元入样概率小,这里的“ 大”、“小”与我们所关心的调查指标有着密切的关系
到目前为止,我们所讨论的两种抽样方法—简单随机抽 样和分层抽样都有一个共同的特点:总体或层中每个个体被 抽中入样的概率都是相同的。对于各单元所处地位几乎 “ 平等” 的总体,这种抽样原则既公正又方便。但在许多社 会经济活动中并非所有单元地位相同,这时就需要采用不等 概率抽样方法。 第七章 不等概率抽样 例如,要了解上海地区钢铁企业的景气状况,总体有上 钢一厂、三厂、五厂……等等,再加上宝钢。由于宝钢规模 极大,它是否景气对整个上海地区钢铁工业起着至关重要的 作用。而在抽样中将它与其它规模较小的单位处于同等地位 就会既不公正又使抽样推断结果有较大可能发生大的偏差。 这个例子提示我们,若对总体单元进行不等概率抽样,使得 “大”单元入样概率大,“小”单元入样概率小,这里的“ 大” 、 “小”与我们所关心的调查指标有着密切的关系
不等概率抽样又分为有放回与无放回两种情况。我们最 关心也是最重要的情形是抽样容量n固定时,单元入样的概 率(不放回抽样)或每次抽样的概率(有放回抽样)与单元 的夭小严格成比例。这种情况下的有放回抽样称为抽样 不放回抽样称为兀pS抽样 §1回的不等概率抽样 1、多项抽样、PDS抽样及其实施方法 既然是不等概率抽样,那么就应该在抽样之前给总体中 的每一个单元赋予一定的抽取概率,在放回抽样的每一次抽 取中,设第i个单元入样的概率为Z(0≤2≤1i=1,2,…,N) 且∑z1=1,按此规定有放回地独立抽取n次,形成所谓 的多项抽样
不等概率抽样又分为有放回与无放回两种情况。我们最 关心也是最重要的情形是抽样容量 n固定时,单元入样的概 率(不放回抽样)或每次抽样的概率(有放回抽样)与单元 的大小严格成比例。这种情况下的有放回抽样称为 抽样 不放回抽样称为 ps 抽样。 pps §1 放回的不等概率抽样 1、多项抽样、 pps 抽样及其实施方法 既然是不等概率抽样,那么就应该在抽样之前给总体中 的每一个单元赋予一定的抽取概率,在放回抽样的每一次抽 取中,设第 个单元入样的概率为 且 ,按此规定有放回地独立抽取 n 次,形成所谓 的多项抽样。 i (0 1, 1,2, , ) Z Z i N i i = 1 1 N Z i i = =
假设第i个单元在n次抽样中被抽中t次,则t1,2,…,tN) 是一个随机向量,其联合分布为: →t!t!…t 222…E∑4=n1(1 这是我们熟悉的多项分布,多项抽样其名正出于此。 多项分布(7.1)具有如下性质: E(=nZ var(t1)=nz;(1-Z)i=1,2,…,N Cov(t,1)=-m221i≠ 倘若单元有一个数值度量其大小,诸如职工人数、工厂产值 商店销售额等,或者感兴趣的调查指标在上一次普查时的数 据也可以作为其单元大小的一种度量。记M为第i个单元的 “大小”,并诞=∑M1
假设第 个单元在 n次抽样中被抽中 次,则 是一个随机向量,其联合分布为: i i t 1 2 ( , , , ) N t t t 这是我们熟悉的多项分布,多项抽样其名正出于此。 1 2 1 2 1 2 ! ! ! ! t t tN N N n Z Z Z t t t 1 N i i t n = = (7.1) 多项分布(7.1)具有如下性质: ( ) ( ) (1 ) 1, 2, , ( , ) i i i i i i j i j E t nZ Var t nZ Z i N Cov t t nZ Z i j = = − = = − 倘若单元有一个数值度量其大小,诸如职工人数、工厂产值 商店销售额等,或者感兴趣的调查指标在上一次普查时的数 据也可以作为其单元大小的一种度量。记 为第 个单元的 “大小”,并记 Mi i 0 1 N Mi i M = =
则可取Z1=M1/M0 此时多项抽样体现了每次抽样时单元的入样概率与单元的大 小成比例,郎为pDs抽样。 多项抽样是最简单的不等概率抽样,它的实施方法通常 有两种,以ps抽样为例。 (1)代码法 它适合于N不太大的情形。假定所有的M为整数,倘若 在实际中存在M不是整数的话,则可以乘以一个倍数使一切 M为整数(对一般的多项抽样,也总可找到整数M。,使一切 MZ成为整数)。对于具整数M的第i个单元赋予一个与M 相等的代码数,见表7—1
多项抽样是最简单的不等概率抽样,它的实施方法通常 有两种,以pps抽样为例。 则可取 Z M M i i = 0 此时多项抽样体现了每次抽样时单元的入样概率与单元的大 小成比例,即为pps抽样。 (1)代码法 它适合于 N不太大的情形。假定所有的 为整数,倘若 在实际中存在 不是整数的话,则可以乘以一个倍数使一切 为整数(对一般的多项抽样,也总可找到整数 ,使一切 成为整数)。对于具整数 的第 个单元赋予一个与 相等的代码数,见表7—1。 Mi Mi Mi M0 M Z0 i Mi i Mi
表7-1 pps抽样时各单元的代码数 单元单元大小M 代码数 M 12 2 M M+1,M1+2,…,M1+M2 N ∑M+1,∑M1+2…∑M+M=M 每次抽样前,先在整数1,2,…,M0里面随机等可能的选 取一个整数,设为m,若代码m属于第j个单元拥有的代码 数,则第j个单元入样。整个过程重复n次,得到n个单元 入样(当然存在重复的可能性)构成pps样本
单元 i 单元大小 Mi 代码数 1 2 N 1 2 N M M M 1 1 1 0 1 1 1 1, 2, , N N N i i i N i i i M M M M M − − − = = = + + + = 1,2, ,M1 M M M M 1 1 1 2 + + + 1, 2, , 表7—1 pps 抽样时各单元的代码数 每次抽样前,先在整数 里面随机等可能的选 取一个整数,设为m ,若代码 m 属于第 j个单元拥有的代码 数,则第 j个单元入样。整个过程重复 n次,得到 n个单元 入样(当然存在重复的可能性)构成 pps 样本。 1,2, , M0