利用双侧概率值进行假设检验 经典的假设检验 “不同于·、”不相等”、”更好哦了 第一步陈述原假设, 禅本大小及检 x 二步:定原似为高,一加分布及 确定拒绝H的临界,即临界值Xc x-N(, g0)eX-A- N(o, 1) 如果现到值拒区内 P(2|>2)=0.0455 否,接受原假设 P(|z|>3)=0.007 界1457 经典的假设检验(概值) 计算机采用的方法 确立和解决一个假设检验问题可以有以下几步 1根问立原假设H和备则假设H1 2确定一个晶性水平a,它是量稀有性"的一个标。 一般况a=0.051 选择合通的验用能计量(2T汁量),并有样本乳 新值p=m7s 测值计算能计量的项测管和量测果极靖值的p值 Hl:1400 开=457 如果值p<a,则拒绝原假设 如果值p≤a,则款更原假设 第类错误与第类错误 关于经典检验的讨论 在样本量不变时,a和β是相互制约的 接受H0拒H0 匚H0为真正确决彙第I类错误 H0不「第Ⅱ类误正确决策
6 新闻传播学院 31 利用双侧概率值进行假设检验 “不同于”、”不相等”、”更好或更差” 双侧概值 3 ) 0 .0027 ( 2 ) 0 .0455 ~ ( , ) ~ ( 0 ,1 ) 0 2 0 > = > = − ⇔ P Z P Z N n X n X N ( σ σ µ µ 新闻传播学院 32 经典的假设检验 第一步:陈述原假设, 设定样本大小及检验的错误水平α 第二步:假定原假设为真,根据抽样分布及α, 确定拒绝H0的临界域,即临界值Xc 第三步:抽取样本 如果观测值落在拒绝区域内, 则拒绝原假设; 否则,接受原假设 拒绝H0 检验的错误 水平α=5% H0: 1400 临界值Xc=1457 新闻传播学院 33 经典的假设检验(概值) ——计算机采用的方法 确立和解决一个假设检验问题可以有以下几步: 1。根据问题确立原假设H0和备则假设H1; 2。确定一个显著性水平α,它是衡量“稀有性”的一个标准。 一般情况α =0.05; 3。选择合适的检验用统计量(Z或T统计量),并有样本观 测值计算统计量的观测值和衡量观测结果极端值的p值; 4。比较p和α作判断 如果概值p<α,则拒绝原假设; 如果概值p≤α,则接受原假设 新闻传播学院 34 拒绝H0 检验的错误 水平α=5% H0: 1400 临界值Xc=1457 观测值=1485 概值p=0.075 新闻传播学院 35 第Ⅰ类错误与第Ⅱ类错误 拒绝H0 α H0 β H1 H0不真 第Ⅱ类错误 正确决策 H0为真 正确决策 第Ⅰ类错误 接受H0 拒绝H0 新闻传播学院 36 在样本量不变时,α和β是相互制约的 关于经典检验的讨论 在α保持不变时,增大样本量可以减小β
般的原则是尽量减少第一类错误一保护原假设 检验的错误水平a的设量 参考“事前的僧念 H不真第Ⅱ类情误正确决策 证是不轻局拒绝服假设 氯假设:被告是无聊的备逸便设:被告是有单的 2、考虑“作出决策错误后可能造成的损失 被管有暴系工带误□正 考成两神误的相对代价 假设检验步骤 基本思维 晚1从峡计方面除述闻题 2.从计方面陈述问愿的另一方面必须相互排斥 减个位西系 3.选各设 此,《祖他原 有或<or2这曲符号 假餐=50. 4.陈述罩设 总是否不同于3? 暴宾际上是晶 显著性水平 拒绝区域(双尾检验) 1如果零假设成立,详细说明样本统计量的 合市 Level of Confidence 不可能值 叫样本分布的拒绝区域 2它是一个概率 1 3用表示(apha) 4开始时由使用者选出 些典型值是01,05,10 砚容悍命说什量
7 新闻传播学院 37 被告有罪 第Ⅱ类错误 正确决策 被告无罪 正确决策 第Ⅰ类错误 认定无罪 认定有罪 H0不真 第Ⅱ类错误 正确决策 H0为真 正确决策 第Ⅰ类错误 接受H0 拒绝H0 原假设:被告是无罪的 备选假设:被告是有罪的 放走了一 个坏人 放走了一 个坏人; 冤枉了一 个好人 一般的原则是尽量减少第一类错误——保护原假设 新闻传播学院 38 检验的错误水平α的设置 1、参考“事前的信念” 2、考虑“作出决策错误后可能造成的损失” 考虑两种错误的相对代价 一般说来,没有充分的证据是不轻易拒绝原假设 的,所以α都设置得比较小 新闻传播学院 39 假设检验步骤 步骤 1. 从统计方面陈述问题 2. 从统计方面陈述问题的另一方面必须相互排斥 3. 选择备择假设 有 ≠, <, or >这些符号 4. 陈述原假设 例子 总体均值是否不同于3? 1. µ = 3 2. µ ≠ 3 3. H0: µ = 3 4. H1: µ ≠ 3 新闻传播学院 40 基本思维 样本分布 从这个值里面不 可能得出均值 ...如果这实际上是总体 均值 因此,我们拒绝原 假设 µ = 50. 2020 H00 新闻传播学院 41 显著性水平 1.如果零假设成立,详细说明样本统计量的 不可能值 • 叫样本分布的拒绝区域 2.它是一个概率 3.用 α表示 (alpha) (alpha) 4.开始时由使用者选出 • 一些典型值是 .01, .05, .10 新闻传播学院 42 拒绝区域 (双尾检验) 抽样分布 1 - α Level of Confidence 所观察的样本统计量