§7若千歉学渔备 抽样推断既然必须处理收集来的数据,因此数学知识是 必不可少的。下面仅就抽样调查中一些最基本的常用数学知 识和概念以直观简洁的方式做一些介绍 1、盒子模型 般抽样调查面临的总体只有有限多个初级单元。从总 体中抽样,就相当于从一个盒子里摸取若干张票,盒子里的 票数相当于有限总体的单元个数,票上记载着反映该单元特 征的指标的值。设总体有N个单元,各指标值为 25 91N 则盒子如图2一1所示:
§7 若干数学准备 抽样推断既然必须处理收集来的数据,因此数学知识是 必不可少的。下面仅就抽样调查中一些最基本的常用数学知 识和概念以直观简洁的方式做一些介绍。 1、盒子模型 一般抽样调查面临的总体只有有限多个初级单元。从总 体中抽样,就相当于从一个盒子里摸取若干张票,盒子里的 票数相当于有限总体的单元个数,票上记载着反映该单元特 征的指标的值。设总体有N个单元,各指标值为 则盒子如图2-1所示: Y Y YN , , , 1 2
H,Y2,…,Yy 图2-1 ---单一--一一-一一 该盒中票的平均数为: Y=x(1+Y2+…+Y) 即总体平均数,它表示票上指标的中心。 另一个重要的总体参数是盒中票的指标的离散程度,用指标 值关于中心的距离的平方和的平均数来表示: N ∑-F)2 这实际上是总体的方差;但大部分情况采用: 2 2 N-1 ∑
Y Y YN , , , 1 2 图2-1 该盒中票的平均数为: ( ) 1 Y1 Y2 YN N Y = + ++ 即总体平均数,它表示票上指标的中心。 另一个重要的总体参数是盒中票的指标的离散程度,用指标 值关于中心的距离的平方和的平均数来表示: 2 1 2 ( ) 1 Y Y N i N i = − = 这实际上是总体的方差;但大部分情况采用: 2 1 2 ( ) 1 1 Y Y N S i N i − − = =
如果我们只关心总体中具有某些特定类型的集合占整个 总体的比例,那么只需稍加处理,引入0一1指标,总体比例 的题立刻转化为总体平均数的一个特例 只要将盒子中的票子分为两类,我们感兴趣的一类全标 上1,其余的都标上0。于是盒子可用图2-2表示: N个 0 N-N个 图2-2 则盒子中票子指标的平均数为 N Y= N ∑H i=1 N 正好是我们关心的那类个体占总体的比例。因此,凡对总体 平均数有的结果,总体比例也有相应的结果
如果我们只关心总体中具有某些特定类型的集合占整个 总体的比例,那么只需稍加处理,引入0-1指标,总体比例 的问题立刻转化为总体平均数的一个特例。 只要将盒子中的票子分为两类,我们感兴趣的一类全标 上1,其余的都标上0。于是盒子可用图2-2表示: 图2-2 N1 个 1 0 N − N1 个 则盒子中票子指标的平均数为: N N Y N Y i N i 1 1 1 = = = 正好是我们关心的那类个体占总体的比例。因此,凡对总体 平均数有的结果,总体比例也有相应的结果
此时,盒子的方差化为: 2 ∑r-F) N i=1 N1( N-1)+(N-N )(11)2} NN-N NN =(总体中所占比例×(总体中所占比例 常采用的方差表示为: M2 NNN N-N N-1 N-1N N
此时,盒子的方差化为: 2 1 2 ( ) 1 Y Y N i N i = − = { ( ) ( )( ) } 1 1 2 1 1 2 1 N N N N N N N N N + − − = N N N N N1 − 1 = = (总体中1所占比例)(总体中0所占比例) 常采用的方差表示为: 2 2 1 − = N N S N N N N N N N 1 1 1 − − =
从盒子中作随机抽取常常有两种不同方式:随机有放回 抽取和随机无放回抽取。从直观上看,随机有放回方式存在 着一张票子被抽中两次或两次以上的可能性,而随机无放回 方式则不存在这种可能。 在实际操作中,人们不太可能心甘情愿地花费两倍以上 的费用去访问同一个单元。因此,随机无放回通常比随机有 放回应“有效”一些,这一点将在第三章的讨论中在理论上加 以肯定。但是,当盒子中的票数相当多,而抽取的票数相对 较少时,有许多事件的概率习性对于有放回或无放回两种情 况几乎差不多,因而有时候我们常从随机有放回这一最简单 的形式入手讨论问题,而将有关的结果近似地套到随机无放 回的情形。 这里讨论的盒子模型是对简单随机抽样而言的,至于分 层、分阶段等其它情况无非是大盒子里放小盒子等
从盒子中作随机抽取常常有两种不同方式:随机有放回 抽取和随机无放回抽取。从直观上看,随机有放回方式存在 着一张票子被抽中两次或两次以上的可能性,而随机无放回 方式则不存在这种可能。 在实际操作中,人们不太可能心甘情愿地花费两倍以上 的费用去访问同一个单元。因此,随机无放回通常比随机有 放回应“有效”一些,这一点将在第三章的讨论中在理论上加 以肯定。但是,当盒子中的票数相当多,而抽取的票数相对 较少时,有许多事件的概率习性对于有放回或无放回两种情 况几乎差不多,因而有时候我们常从随机有放回这一最简单 的形式入手讨论问题,而将有关的结果近似地套到随机无放 回的情形。 这里讨论的盒子模型是对简单随机抽样而言的,至于分 层、分阶段等其它情况无非是大盒子里放小盒子等