第七讲:假设检验 7.3 拟合优度检验 1 7.3.1离散总体情形 2 7.3.2列联表的独立性和齐一性检验···· 8 7.3.3连续总体情形 12 Previous Next First Last Back Forward
第七讲: 假设检验 7.3 拟合优度检验 . . . . . . . . . . . . . . . . . . 1 7.3.1 离散总体情形 . . . . . . . . . . . . . . 2 7.3.2 列联表的独立性和齐一性检验 . . . . . 8 7.3.3 连续总体情形 . . . . . . . . . . . . . . 12 Previous Next First Last Back Forward 1
7.3 拟合优度检验 前面的假设检验基本上是在假定总体是正态的条件下做的,但是 这个假设本身不一定成立,需要收集样本(X1,…,Xn)来检验它.一 般地,检验 Ho:X服从某种分布F 可以采用Karl Pearson提出的X拟合优度检验. 基本想法:基于样本得到F的估计户,计算某种偏差D(F,F), 例如supz∈rFn(x)-F(x)儿当Ho正确时,由于Fn是F的相合估 计,偏差D(户m,F)应该很小 Karl Pearson对离散分布F提出一种检验方法,即拟合优度 检验方法或者称为Pearson卡方检验方法, Previous Next First Last Back Forward 1
7.3 拟合优度检验 前面的假设检验基本上是在假定总体是正态的条件下做的, 但是 这个假设本身不一定成立, 需要收集样本 (X1, · · · , Xn) 来检验它. 一 般地, 检验 H0 : X服从某种分布F 可以采用 Karl Pearson 提出的 χ 2 拟合优度检验. 基本想法: 基于样本得到 F 的估计 Fˆn, 计算某种偏差 D(Fˆn, F), 例如 supx∈R|Fˆn(x) − F(x)|. 当 H0 正确时, 由于 Fˆn 是 F 的相合估 计, 偏差 D(Fˆn, F) 应该很小. Karl Pearson 对离散分布 F 提出一种检验方法, 即拟合优度 检验方法或者称为 Pearson 卡方检验方法. Previous Next First Last Back Forward 1
7.3.1 离散总体情形 (1)理论总体分布不含未知参数的情形 设某总体X服从一个离散分布, X ai ak P Pi Pk p1,·,Pk完全已知.现从该总体抽得一个样本量为n的样本,其落 在类别a1,·,ak的观测数分别为n1,·,nk. 感兴趣的问题是检验 理论频率是否正确,即下面假设是否正确: Ho P(X =a1)=P1;...P(X=ak)=pk. 这类问题只提零假设而不提对立假设,相应的检验方法称为拟合优度 检验.显然,在零假设下,各类别的理论频数分别为np1,…,npk,将 理论频数和观测频数列于下表: Previous Next First Last Back Forward 2
7.3.1 离散总体情形 (1) 理论总体分布不含未知参数的情形 设某总体 X 服从一个离散分布, X a1 . . . ak P p1 . . . pk p1, · · · , pk 完全已知. 现从该总体抽得一个样本量为 n 的样本, 其落 在类别 a1, · · · , ak 的观测数分别为 n1, · · · , nk. 感兴趣的问题是检验 理论频率是否正确, 即下面假设是否正确: H0 : P(X = a1) = p1, · · · , P(X = ak) = pk. 这类问题只提零假设而不提对立假设, 相应的检验方法称为拟合优度 检验. 显然, 在零假设下, 各类别的理论频数分别为 np1, · · · , npk, 将 理论频数和观测频数列于下表: Previous Next First Last Back Forward 2
类别 a1 a2 ak 理论频数 npi np2 nPk 观测频数 ni n2 nk 由大数定律知,在零假设成立时,n:/m依概率收敛于p,故理论 频数np:与观测频数ni接近.Pearson提出检验统计量 1 npi 可以严格地证明,在一定的条件下,当Ho成立时,T的极限分布 就是自由度为k一1的X2分布. 拒绝域:T>X2(k-1) Previous Next First Last Back Forward 2
类别 a1 a2 · · · ak 理论频数 np1 np2 · · · npk 观测频数 n1 n2 · · · nk 由大数定律知, 在零假设成立时, ni/n 依概率收敛于 pi, 故理论 频数 npi 与观测频数 ni 接近. Pearson 提出检验统计量 T = ∑k i=1 (ni − npi) 2 npi = ∑ (O − E) 2 E . 可以严格地证明, 在一定的条件下, 当 H0 成立时, T 的极限分布 就是自由度为 k − 1 的 χ 2 分布. 拒绝域: T > χ2 α(k − 1) Previous Next First Last Back Forward 3
下面给出一个例子来说明拟合优度检验的应用。 有人制造一个含6个面的骰子,并声称是均匀的.现设计一个实 Example 验来检验此命题:连续投掷600次,发现出现六面的频数分别为97, 104,82,110,93,114.问能否在显著性水平0.2下认为骰子是均匀 的? Example 解:该问题设计的总体是一个有6个类别的离散总体,记出现六个面 的概率分别为p1,·,P6,则零假设可以表示为 H0:p=1/6,i=1,…,6. 在零假设下,理论频数都是100,故检验统计量X2的取值为 (07-100)2 +(L04-1002+(82-1002+110-1002+93-100)2+14-10)2=6.94, 100 100 100 100 100 100 跟自由度为6-1=5的X2分布的上0.05分位数X(0.2)≈7.29比 较,不能拒绝零假设,即可在显著性水平02下认为骰子是均匀的 Previous Next First Last Back Forward 4
下面给出一个例子来说明拟合优度检验的应用. ↑Example 有人制造一个含 6 个面的骰子, 并声称是均匀的. 现设计一个实 验来检验此命题: 连续投掷 600 次, 发现出现六面的频数分别为 97, 104, 82, 110, 93, 114. 问能否在显著性水平 0.2 下认为骰子是均匀 的? ↓Example 解: 该问题设计的总体是一个有 6 个类别的离散总体, 记出现六个面 的概率分别为 p1, · · · , p6, 则零假设可以表示为 H0 : pi = 1/6, i = 1, · · · , 6. 在零假设下, 理论频数都是 100, 故检验统计量 χ 2 的取值为 (97−100)2 100 + (104−100)2 100 + (82−100)2 100 + (110−100)2 100 + (93−100)2 100 + (114−100)2 100 =6.94, 跟自由度为 6 − 1 = 5 的 χ 2 分布的上 0.05 分位数 χ 2 5(0.2) ≈ 7.29 比 较, 不能拒绝零假设, 即可在显著性水平 0.2 下认为骰子是均匀的. Previous Next First Last Back Forward 4