我们无法排除犯这类错误的可能性。因此自然希望将犯 这类错误的概率控制在一定限度之内,即给出一个较小 的数(0<a<1),使犯这类错误的概率不超过a,即使 得 P{当H为真拒绝H0}≤a (1) 为了确定常数k,我们考虑统计量 由 于只允许犯 这类错误的概率最大为a,令(1)式右端取等号,即令 P(当H为真拒绝H=X-zk}=a o/
我们无法排除犯这类错误的可能性。因此自然希望将犯 这类错误的概率控制在一定限度之内,即给出一个较小 的数α(0<α<1) ,使犯这类错误的概率不超过α,即使 得 (1) 为了确定常数k,我们考虑统计量 。由 于只允许犯 这类错误的概率最大为α,令(1)式右端取等号,即令 P{当H0 为真拒绝H0 } n X / 0 − = − = k n X P H H P / { } 0 当 0 为真拒绝 0 0
由于当H,为真时, f(u) ~N(O,1) 由标准正态分布分位点的定义知 ku a/2 因而,若U的观察值满足 a/2 /√n ≥k=la/2 则拒绝H0,而若 x-ul <k=u 则接受H0 例如,在本例中取a=0.05,则有k=u1052=1.96,又 已知n=6,=0.015,再由样本算得 即有 x=0.511 x-1 2.2>1.96 于是拒绝H,认为这天包装机 o/ 工作不正常
由于当H0, 为真时, 由标准正态分布分位点的定义知 k=uα/2 因而,若U的观察值满足 则拒绝H0 ,而若 则接受H0 。 例如,在本例中取α=0.05 ,则有k=u0.05/2=1.96 ,又 已知n=6,σ=0.015 ,再由样本算得 , 即有 于是拒绝H0,认为这天包装机 工作不正常。 ~ (0,1) / 0 N n X U − = / 2 0 / k u n x u = − = / 2 0 / k u n x u = − = 2.2 1.96 / 0 = − = n x u x = 0.511
上例中所采用的检验法则是符合实际推断原理的。因通常a总 是取得较小,一般a=0.01,0.05。若H为真,即当=0时, X-Hozua12 是一个小概率事件,根据实际推断原理, o/ 就可以认为,如果H为真,则由一次实验得到的观察值x,满足 不等式 /2 几乎是不会发生的。现在在一次观 察中竟然出现了满足 x-po ≥la2的x,则我们有理由 怀疑原来的假设H的正确性,因而拒绝H。若出现的观察值x x 满足 < ,此时没有理由拒绝H0,因此只能 接受假设H 在上例的做法中,我们看到当样本容量固定时,选定a后,数k X 就可以确定,然后按照统计量U 的观察值的绝对值 0/
上例中所采用的检验法则是符合实际推断原理的。因通常α 总 是取得较小,一般α =0.01,0.05。若H0为真,即当μ=μ0时, 是一个小概率事件,根据实际推断原理, 就可以认为,如果H0为真,则由一次实验得到的观察值 ,满足 不等式 几乎是不会发生的。现在在一次观 察中竟然出现了满足 的 ,则我们有理由 怀疑原来的假设H0的正确性,因而拒绝H0。若出现的观察值 满足 ,此时没有理由拒绝H0,因此只能 接受假设H0。 在上例的做法中,我们看到当样本容量固定时,选定α 后,数k 就可以确定,然后按照统计量 的观察值的绝对值 − / 2 0 / u n X x / 2 0 / u n x − / 2 0 / u n x − n X U / 0 − = / 2 0 / u n x − x x
大于等于k还是小于k来作出决策。数k是检验上述假设的一个门槛值。 如果 x-1 k 则称x与μ0的差异是显著的。 这时拒绝反之如果=x<k,则称x与 /√n 的差异是不显著的,这时接受H0。数a称为显著性水平,上面 关于x与μ有无显著差异的判断是在显著性水平a之下作出的。 统计量Us于 称为检验统计量。 o/√n 前面的检验问题通常叙述成:在显著性水平a下,检验假设 H0:=02H1:≠0 也常说成“在显著性水平a下,针对H检验H”。H称为原假设或 零假设,H1称为备择假设(意指在原假设被拒绝后可供选择的假设 或对立假设。我们要进行的工作是,根据样本,按上述检验方法作 出决策在H与H两者之间接受其一
大于等于k还是小于k来作出决策。数k是检验上述假设的一个门槛值。 如果 ,则称 与μ0 的差异是显著的。 这时拒绝H0;反之,如果 ,则称 与 μ0 的差异是不显著的,这时接受H0。数α 称为显著性水平, 上面 关于 与μ0有无显著差异的判断是在显著性水平α之下作出的。 统计量 称为检验统计量。 前面的检验问题通常叙述成:在显著性水平α下,检验假设 (2) 也常说成“在显著性水平α下,针对H1检验H0 ” 。H0称为原假设或 零假设, H1称为备择假设(意指在原假设被拒绝后可供选择的假设) 或对立假设。我们要进行的工作是,根据样本,按上述检验方法作 出决策在H0与H1两者之间接受其一。 k n x u − = / 0 x k n x u − = / 0 n X U / 0 − = 0 0 1 0 H : = ,H : x x
当检验统计量取某个区域C中的值时我们拒绝原假设H则称区 域C为拒绝域拒绝域的边界点称为临界点(临界值。而上例中拒绝域 为l≥ 而u=-un2,u=un2为临界点 由于检验法则是根据样本作出的,总有可能作出错误的决策。 如上面所说的那样,在假设H实际上为真时,我们可能犯拒绝H的 错误,称这类“弃真”的错误为第一类错误。又当H实际上不真时, 我们也有可能接受H。称这类“取伪”的错误为第二类错误。犯第 二类错误的概率(其大小用β来表示)记为 P{当H不真接受H或B=n1{按受Hb 为此,在确定检验法则时,我们应尽量使犯两类错误的概率都 较小。但是,进一步讨论可知,一般来说,当样本容量固定时,若 减少犯一类错误的概率,则犯另一类错误的概率往往增大。若要使 犯两类错误的概率都减小,除非增加样本容量。在给定样本容量的 情况下,一般来说,我们总是控制犯第一类错误的概率,使它不大 于α。α的大小视具体情况而定,通常a取0.1,0.05,0.01,0.005等值。 这种只对犯第一类错误的概率加以控制,而不考虑犯第二类错误的 概率的检验,称为显著性检验
当检验统计量取某个区域C中的值时,我们拒绝原假设H0 ,则称区 域C为拒绝域,拒绝域的边界点称为临界点(临界值)。而上例中拒绝域 为 ,而u= - uα/2,u=uα/2为临界点。 由于检验法则是根据样本作出的,总有可能作出错误的决策。 如上面所说的那样,在假设H0实际上为真时,我们可能犯拒绝H0的 错误,称这类“弃真”的错误为第一类错误。又当H0实际上不真时, 我们也有可能接受H0。称这类“取伪”的错误为第二类错误。犯第 二类错误的概率(其大小用β来表示)记为 P{当H0不真接受H0 }或 。 为此,在确定检验法则时,我们应尽量使犯两类错误的概率都 较小。但是,进一步讨论可知,一般来说,当样本容量固定时,若 减少犯一类错误的概率,则犯另一类错误的概率往往增大。若要使 犯两类错误的概率都减小,除非增加样本容量。在给定样本容量的 情况下,一般来说,我们总是控制犯第一类错误的概率,使它不大 于α 。α 的大小视具体情况而定,通常α 取0.1,0.05,0.01,0.005等值。 这种只对犯第一类错误的概率加以控制,而不考虑犯第二类错误的 概率的检验,称为显著性检验。 { } PH1 接受H0 u u / 2