分类数据的组间比较 分类数据的分析对象是归属于某 类的观测的频数
分类数据的组间比较 分类数据的分析对象是归属于某一 类的观测的频数
分类数据的表现形式 频数 频数表 交叉频数表 cross-tabulation 百分构成 近视眼非近视眼合计 有序还是无序 男 a b n 1+ 女 C n2+ 计n +1 +2
分类数据的表现形式 ◼ 频数 ◼ 频数表 ◼ 交叉频数表cross-tabulation ◼ 百分构成 ◼ 有序还是无序 近视眼 非近视眼 合计 男 a b n1+ 女 c d n2+ 合计 n+1 n+2 n
二项分布 n人中B型血人数x的概率分布 0.5 1.60E-01 兀=0.08 1.40E-01 0.4 兀=0.08 1.20E-01 0.3 1.00E-01 8.00E-02 0.2 6.00E-02 4.00E-02 0.1 2.00E-02 0.00E+00 0123456789 024681012141618 10人中B型血人数x的概率分布图 100人中B型血人数x的概率分布图 Pr(x) (I-T)-x u=n o=nz(1-z)
二项分布 n人中B型血人数x的概率分布 10人中B型血人数x的概率分布图 100人中B型血人数x的概率分布图 0 0.1 0.2 0.3 0.4 0.5 0 1 2 3 4 5 6 7 8 9 0.00E+00 2.00E-02 4.00E-02 6.00E-02 8.00E-02 1.00E-01 1.20E-01 1.40E-01 1.60E-01 0 2 4 6 8 10 12 14 16 18 ( ) ( − ) = = ( − ) − = − 1 1 ! ! ! Pr( ) n n x n x n x x n x =0.08 =0.08
单个样本百分构成的分析 百分构成:p=Xn 点估计p→>兀 正态近似的应用条件 np>5和n(1p)>5:同样的,X5和nX>5 P=T, SE(p)=pl-p) 区间估计(正态近似法) ■假设检验 直接法 正态近似法x=1-x/-1 SE(p)
单个样本百分构成的分析 ◼ 百分构成:p=x/n ◼ 点估计 p→ ◼ 正态近似的应用条件 np>5 和 n(1-p) >5;同样的,x>5 和 n-x>5 ◼ 区间估计(正态近似法) ◼ 假设检验 ◼ 直接法 ◼ 正态近似法 p =,SE(p) = p(1− p) n SE(p) p z 2n 1 − − =
回顾一符号检验 Sign test 如果样本观测值与参考值在平均上没有差别的话,那么小于参考值 和大于参考值的观测数应大致相等,即:任一观测值在参考值左 边或右边的概率相等,均为1/2 利用2项分布n=1p=x=2,x=9 利用正态近似理论值=mp=11×=5.5 SE(x)=√mp(-p)=√1l××=1658 x-np 9-5 2 2.11 1.658 连续性校正:x=my 5 1.81 1.658
回顾—符号检验Sign test 如果样本观测值与参考值在平均上没有差别的话,那么小于参考值 和大于参考值的观测数应大致相等,即:任一观测值在参考值左 边或右边的概率相等,均为1/2 ( ) ( ) ( ) ( ) 1.81 1.658 9 5.5 1 : 2.11 1.658 9 5.5 1 1 11 1.658 11 5.5 2 11, ; 2, 9 2 1 2 1 2 1 2 1 2 1 2 1 = − − = − − − = = − = − − = = − = = = = = = = = = np p x np z np p x np z SE x np p np n p x x 连续性校正 利用正态近似 理论值 利用 项分布