§8非参数检验
§8 非参数检验
§8.1拟合优度检验 前面介绍的参数检验是已知总体分布函数的类型对 未知参数进行假设检验。在实际问题中常常不能预知 总体的分布,这时在进行参数检验之前,先要对总体 的分布类型进行假设检验,这一类假设检验称之为分 布函数的拟合检验。在实际问题中有时要考虑两总体 分布是否相同,是否独立,从而提出相同性检验、独 立性检验,这些检验也属于非参数检验。 非参数检验多数只利用样本观察值的相对大小或 样本观察值间的大小顺序关系进行判断的,因此,计 算简单,易于掌握。对于总体分布类型已知的问题, 虽然非参数检验方法也可以采用,但其缺点是没有充 分利用样本所含的信息,从而检验效率通常比参数检 验差一些
§8.1 拟合优度检验 • 前面介绍的参数检验是已知总体分布函数的类型对 未知参数进行假设检验。在实际问题中常常不能预知 总体的分布,这时在进行参数检验之前,先要对总体 的分布类型进行假设检验,这一类假设检验称之为分 布函数的拟合检验。在实际问题中有时要考虑两总体 分布是否相同,是否独立,从而提出相同性检验、独 立性检验,这些检验也属于非参数检验。 • 非参数检验多数只利用样本观察值的相对大小或 样本观察值间的大小顺序关系进行判断的,因此,计 算简单,易于掌握。对于总体分布类型已知的问题, 虽然非参数检验方法也可以采用,但其缺点是没有充 分利用样本所含的信息,从而检验效率通常比参数检 验差一些
§8.1.1分布函数的拟合检验 这里考虑的是如下的假设检验问题: Ho: F(x)=Fo(x),H: F(X)*Fo(x), 其中F(x)为总体X的分布函数,未知,F0x)为某已知的分布函数, Fx)中可以含有未知参数,也可以不含有未知参数。分布函数F0(x) 一般是根据总体的物理意义、样本的经验分布函数、直方图得到启 发而确定的。如何对H进行检验呢?H0的检验方法很多,对F(x) 的不同类型有不同的检验方法。当F(x)为正态分布函数时,常用正 态概率纸法与偏度、峰度法(略)。一般情形(正态分布和其它的分 布)用皮尔逊( Pearson)检验法 这一方法的基本思想是:将样本观察值x1x2,xn分成k组,分 组的办法是-将包含x1,x2,xn的某个区间(tt1)分为互不相交的k个 子区间△1=(t1,41i=1,2,…,k,使得t…t1t,一般 要求取k≈1.87(n-1)4。以O1表示样本观察值落入第个小 区间(t121](i=1,2,…k)的频数(称为实际频数)。如果 H为真,由给定的分布函数Fx),计算得 P1=B11-1<Xk≤t1}=F0(1)-F(1),i=1,2,…,k
§8.1.1 分布函数的拟合检验 这里考虑的是如下的假设检验问题: H0 : F(x)=F0 (x) , H1 : F(x)≠F0 (x) , 其中F(x)为总体X的分布函数,未知,F0 (x) 为某已知的分布函数, F0 (x) 中可以含有未知参数,也可以不含有未知参数。分布函数F0 (x) 一般是根据总体的物理意义、样本的经验分布函数、直方图得到启 发而确定的。如何对H0进行检验呢?H0的检验方法很多,对F0 (x) 的不同类型有不同的检验方法。当F0 (x) 为正态分布函数时,常用正 态概率纸法与偏度、峰度法(略)。一般情形(正态分布和其它的分 布)用皮尔逊(Peareson) 检验法。 这一方法的基本思想是:将样本观察值x1 ,x2 ,…,xn分成k组,分 组的办法是---将包含x1 ,x2 ,…,xn的某个区间(t0 ,tk ) 分为互不相交的k个 子区间 ,使得t 0<t1<…<tk-1<tk,一般 要求取 。以Oi 表示样本观察值落入第i个小 区间 的频数(称为实际频数)。如果 H0为真,由给定的分布函数F0 (x) ,计算得 2 t t i k i i i ( , ], 1,2, , = −1 = 0.4 k 1.87(n −1) ( , ]( 1,2, , ) 1 t t i k i− i = p P t X t F t F t i k i i k i i i { } ( ) ( ), 1,2, , = 0 −1 = 0 − 0 −1 =
其中021,分=1 ,称E:=np;为样本 X1,X2…,Xn落入第个小区间的理论频数,当H成立时, 理论频数E与实际频数O应很 接近,即(O-E)2应很小,从而 ∑ (O-E) 也应该比较小,我们记此和式为xn,即 ∑ O-E (1.1) E1 应较小,否则不能认为H成立,所以H的拒绝域应 为{z2>C},C应由置信系数a确定
其中0<pi<1 , ,称Ei=npi 为样本 X1 ,X2 ,…,Xn 落入第i个小区间的理论频数,当H0成立时, 理论频数Ei与实际频数Oi应很 接近,即(Oi -Ei ) 2 应很小,从而 也应该比较小,我们记此和式为 ,即 (1.1) 应较小,否则不能认为H0成立,所以H0的拒绝域应 为 ,C应由置信系数α确定。 = = k i i p 1 1 = − k i i i i E O E 1 2 ( ) 2 n = − = n i i i i n E O E 1 2 2 ( ) n C 2
皮尔逊定理:设把总体X的样本X1,X2…Xn 分成互不相 容的k类:(t=124(2=12,…,k),p为X落入第i类的 概率。若H:X服从某一已知分布F(x)成立,则当n→>∞ 时,不论F∞x)服从什么分布总有 ∑ (O-E,)2 x2(k-1) 这样,利用皮尔逊定理可定义小概率事件: Pin>xa(k-1=a 故H的拒绝域为xn2>x2(k-1)。据此可进行拟合 优度检验 但是检验时必需注意以下几点: (1)样本容量n应充分大,且每类理论频数不能太小,通常 n>50且E≥5,若E<5则通过合并相邻的类使之不小于5
皮尔逊定理:设把总体X的样本X1 ,X2 ,…,Xn 分成互不相 容的k类: , pi 为X落入第 i 类的 概率。若H0 : X 服从某一已知分布F0 (x) 成立,则当n→∞ 时,不论F0 (x)服从什么分布总有 这样,利用皮尔逊定理可定义小概率事件: 故H0的拒绝域为 。据此可进行拟合 优度检验。 但是检验时必需注意以下几点: (1)样本容量n应充分大,且每类理论频数不能太小,通常 n>50且Ei ≥5 , 若Ei<5 则通过合并相邻的类使之不小于5。 ( , ]( 1,2, , ) 1 t t i k i− i = ~ ( 1) ( ) 2 1 2 2 − − == k E O E n i i i i n { ( −1)} = 2 2 P k n ( 1) 2 2 n k −