方差分析 1.理解方差分析的概念,了解方差分析的原理; 掌握单因素试验的方差分析原理与方法 3.了解双因素无重复试验的方差分析方法 4.了解双因素等重复试验的方差分析方法 在科学试验和生产实践中,影响结果的因素往往有多个,有些因素影响较大,有 些影响较小。这就有必要寻找出对结果有显著影响的因素。方差分析就是根据试 验结果作出分析,判断各因素对试验结果影响程度的一种常用科学方法。 本章主要介绍了单因素方差分析和双因素方差分析,请注意方差分析本 质上是一种假设检验 在双因素方差分析中,往往不能忽略各因素间的交互作用对结果的影 响,否则,可能导出错误的结论 第一节单因素试验的方差分析 方差分析 在科学实验或生产实践中,任何事物总是受很多因素影响的.例如,工业 产品的质量受原料、机器、人工等因素的影响。农作物的产量受种子、肥料、土 壤、水分、天气等因素的影响.利用试验数据,分析各个因素对该事物的影响是否 显著,数理统计中所采用的一种有效方法就是方差分析 ●单因素试验的概念 为了分析某一个因素A对所考察的随机变量5的影响,我们可以在试验 时让其它因素保持不变,而只让因素A改变,这样的试验叫做单因素试验,因素A 所处的状态叫做水平 单因素试验的方差分析原理 设因素A有不同水平4,A…,4,各水平A对应的总体与服从正态分 布M,口),产,2,,1;这里,我们假定各与有相同的标准差o,但各总体均 值两可能不同例如,5与…,与可以是用种不同工艺生产的电灯泡的使用寿命, 或者是1个不同品种的小麦的单位面积产量,等等
方差分析 1. 理解方差分析的概念,了解方差分析的原理; 2. 掌握单因素试验的方差分析原理与方法; 3. 了解双因素无重复试验的方差分析方法; 4. 了解双因素等重复试验的方差分析方法 在科学试验和生产实践中,影响结果的因素往往有多个,有些因素影响较大,有 些影响较小。这就有必要寻找出对结果有显著影响的因素。方差分析就是根据试 验结果作出分析,判断各因素对试验结果影响程度的一种常用科学方法。 本章主要介绍了单因素方差分析和双因素方差分析,请注意方差分析本 质上是一种假设检验。 在双因素方差分析中,往往不能忽略各因素间的交互作用对结果的影 响,否则,可能导出错误的结论。 第一节 单因素试验的方差分析 ⚫ 方差分析 在科学实验或生产实践中,任何事物总是受很多因素影响的.例如,工业 产品的质量受原料、机器、人工等因素的影响。农作物的产量受种子、肥料、土 壤、水分、天气等因素的影响.利用试验数据,分析各个因素对该事物的影响是否 显著,数理统计中所采用的一种有效方法就是方差分析. ⚫ 单因素试验的概念 为了分析某一个因素 A 对所考察的随机变量ξ的影响,我们可以在试验 时让其它因素保持不变,而只让因素 A 改变,这样的试验叫做单因素试验,因素 A 所处的状态叫做水平. ⚫ 单因素试验的方差分析原理 设因素 A 有不同水平 ,各水平 对应的总体 服从正态分 布 ,i=1,2,...,l; 这里,我们假定各 有相同的标准差σ,但各总体均 值 可能不同.例如, 可以是用 l 种不同工艺生产的电灯泡的使用寿命, 或者是 l 个不同品种的小麦的单位面积产量,等等
在水平4进行n次试验,产1,2,,1;我们假定所有的试验都是独立 的.设得到样本观测值x如下表 水平 Xix xIn,X 因为在水平4下的样本观测值2(=12…,)与总体服从相同的分布 所以有~M41口),(产1,2,,D(9.1) 我们的任务就是根据这l组观测值来检验因素A对试验结果的影响是否 显著如果因素A的影响不显著,则所有样本观测值就可以看作是来自同一总 体M(102),因此要检验的原假设是 H0:1内=;(9.2) 1,1=共-1,(=1,2…,) 当(9.2)成立时,各凸H则原假设(9.2)等价于0:a=a2=…21=0 方差分析问题实质上是一个假设检验问题,下面探讨如何构造合适的统计量. 方差分析统计量的构造 (1)定义 组内平均值分v X 总平均值 8-∑∑(x-)2 SA=∑吗(不。一x)2 总离差平方和 ,组间平方和
在水平 进行 ni次试验,i=1,2,...,l;我们假定所有的试验都是独立 的.设得到样本观测值 xij如下表: 水平A1 A2 Al 观 察 值 因为在水平 下的样本观测值 与总体服从相同的分布, 所以有 ,(i=1,2,...,l) (9.1) 我们的任务就是根据这l组观测值来检验因素 A对试验结果的影响是否 显著.如果因素 A 的影响不显著,则所有样本观测值 就可以看作是来自同一总 体 ,因此要检验的原假设是 ; (9.2) 令 . 当(9.2)成立时,各 则原假设(9.2)等价于 . 方差分析问题实质上是一个假设检验问题,下面探讨如何构造合适的统计量. ⚫ 方差分析统计量的构造 (1)定义 组内平均值 总平均值 , 总离差平方和 ,组间平方和
∑∑(x-元.)2 误差平方和 S反映各组样本之间的差异程度,即由于因素A的不同水平所引起的系统差异 S反映各种随机因素引起的试验误差 (2)几个重要结论 我们可以导出如下结论 证明 今S与S是相互独立的 令若品成立,则a2~x2(n- (3)构造F统计量 利用以上结论,定义 组间平均平方和-1;误差平均平方和n F==A 考察统计量 ,它服从什么分布? F 因为5(8/02)1(n-1),利用上面的结论及F分布的定义可知 F~F(l-1,m- 方差分析的方法
误差平方和 SA反映各组样本之间的差异程度,即由于因素 A 的不同水平所引起的系统差异; Se反映各种随机因素引起的试验误差. (2)几个重要结论 我们可以导出如下结论: ; 证明 SA与 Se是相互独立的; ; 若 H0成立,则 , . (3)构造 F 统计量 利用以上结论,定义: 组间平均平方和 ;误差平均平方和 考察统计量 ,它服从什么分布? 因为 ,利用上面的结论及 F 分布的定义可知 F~F(l-1,n-l) ⚫ 方差分析的方法
如果因素A的各个水平对总体的影响差不多,则组间平方和S较小,因而F也较 小;反之,如果因素A的各个水平对总体的影响显著不同,则组间平方和S较大 因而F也较大.由此可见,我们可以根据F值的大小来检验上述原假设压 对于给定的显著性水平a,由F分布表5查得相应的分位数2.如果由样本观测 值计算得到的F的值大于2,则在水平a下拒绝原假设即认为因素A的不同 水平对总体有显著影响;如果F的值不大于F,则接受瓜即认为因素A的不同水 平对总体无显著影响. 通常分别取a=0.05和a=0.01,按F所满足的不同条件作出不同的判断: 条件 显著 氵性 F≤F不显著 成F≤应显著(可用“*”表示) Fa高度显著(可用“*”表示) 通常还根据计算结果,列出如下方差分析表: 方差来源平方和自由度」均方和F值临界值显著性 组间S1-1 Fa 误差Sn-1 Fa =Sn-1) 总和 S n 例 1 例2 注:有时为了简化计算,可把全部观察值x减去或加上一个常数C,并不影响离 差平方和的计算结果 例1 用四种不同的工艺生产电灯泡.从各种工艺生产的电灯泡中分别抽取样品,并测 得样品的寿命(小时)如下: 工艺 观1620158014601500
如果因素 A 的各个水平对总体的影响差不多,则组间平方和 SA较小,因而 F 也较 小;反之,如果因素 A 的各个水平对总体的影响显著不同,则组间平方和 SA较大, 因而 F 也较大.由此可见,我们可以根据 F 值的大小来检验上述原假设 H0. 对于给定的显著性水平α,由 F 分布表 5 查得相应的分位数 .如果由样本观测 值计算得到的 F 的值大于 ,则在水平α下拒绝原假设 H0,即认为因素 A 的不同 水平对总体有显著影响;如果 F 的值不大于 ,则接受 H0,即认为因素 A 的不同水 平对总体无显著影响. 通常分别取α=0.05 和α=0.01,按 F 所满足的不同条件作出不同的判断: 条 件 显 著 性 F≤F0.05 不显著 F0.05<F≤F0.01显著(可用“*”表示) F> F0.01 高度显著(可用“**”表示) 通常还根据计算结果,列出如下方差分析表: 方差来源平方和自由度 均方和 F 值 临界值显著性 组 间 误 差 SA Se l-1 n-l F0.05 F0.01 总 和 S n-1 例 1 例 2 注:有时为了简化计算,可把全部观察值 xij减去或加上一个常数 C,并不影响离 差平方和的计算结果. ⚫ 例 1 用四种不同的工艺生产电灯泡. 从各种工艺生产的电灯泡中分别抽取样品,并测 得样品的寿命(小时)如下: 工艺 A1 A2 A3 A4 观 1620 1580 1460 1500
察1670160015401550 值1700164016201610 1750 172018001680 试检验这四种工艺生产的电灯泡寿命是否有显著差异 解为了化简计算,把全部观察值减去常数1500,再计算各离差平 方和后可得 方差分析表: 方差来源平方和自由度均方和/值临界值显著性 组间62820 2094040Fa0=3.49* 误差618801251571m5.95 总和12470015 其中n=5,n=4,n=3,n=4,k=4,m=16.因为P4.06介于Fas(3,12)和Fa(3, 12)之间,故可认为不同工艺生产的电灯泡寿命是有显著差异的.第一种工艺生 产的电灯泡平均寿命为1708小时,明显比其它工艺生产的电灯泡平均寿命大, 故应采纳此工艺 例2 对于高压电的电路网络,需要使用抗张强度较大而且均匀性较好的 电缆.每一条电缆是由同样长度的导线12根合并而成.现在为了 检验一批电缆所用导线的抗张强度是否来自同一正态总体,抽查人 了9条电缆的每一根导线的抗张强度,测试值(kg)如下表所示(为 了化简计算,全部测试值都减去了340) 电缆 5|-11 0-1271-1 测试值 -13-13-10410006 5-8-1525-5277 28-12100-4158
察 值 1670 1700 1750 1600 1640 1720 1540 1620 1800 1550 1610 1680 试检验这四种工艺生产的电灯泡寿命是否有显著差异. 解 为了化简计算,把全部观察值减去常数 1500,再计算各离差平 方和后可得 方差分析表: 方差来源平方和自由度均方和F 值 临界值 显著性 组 间 误 差 62820 61880 3 12 20940 5157 4.06 F0.05=3.49 F0.01=5.95 * 总 和 124700 15 其中 n1=5, n2=4, n3=3, n4=4, l=4, n=16. 因为 F=4.06 介于 F0.05(3,12)和 F0.01(3, 12)之间,故可认为不同工艺生产的电灯泡寿命是有显著差异的. 第一种工艺生 产的电灯泡平均寿命为 1708 小时,明显比其它工艺生产的电灯泡平均寿命大, 故应采纳此工艺. 例 2 对于高压电的电路网络,需要使用抗张强度较大而且均匀性较好的 电缆.每一条电缆是由同样长度的导线 12 根合并而成. 现在为了 检验一批电缆所用导线的抗张强度是否来自同一正态总体, 抽查 了 9 条电缆的每一根导线的抗张强度, 测试值(kg)如下表所示(为 了化简计算,全部测试值都减去了 340) 电缆 A1 A2 A3 A4 A5 A6 A7 A8 A9 测 试 值 5 -13 -5 -2 -11 -13 -8 8 0 -10 -15 -12 -12 4 2 10 7 1 5 0 1 0 -5 -4 -1 0 2 1 -1 0 7 5 2 6 7 8