第六章试验设计与方差分析 、试验设计初步。 1、试验及其模型; 2、处理设计:单因素试验、多因素试验; 3、试验误差:系统误差、随机误差、错失误差; 4、试验的排列:设置重复、随机化、区组化、拉丁方试验。 二、方差分析一 ANOVA 方差分析( analysis of variance, ANOVA) 在研究一个变量时,能够解决多个总体的均值是否相等的检验问题 在研究多个变量对不同总体的影响时,它也是分析各个自变量对因变量 影响的一种方法。 1.方差分析的内容 首先我们对多个总体均值是否相等这一假设进行检验。 例6.1 某饮料生产企业硏制岀一种新型饮料.饮料的颜色共有四种:橘黄 色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能
第六章 试验设计与方差分析 一、试验设计初步。 1 、试验及其模型; 2 、处理设计:单因素试验、多因素试验; 3 、试验误差:系统误差、随机误差、错失误差; 4 、试验的排列:设置重复、随机化、区组化、拉丁方试验。 二、方差分析 —ANOVA 方差分析( analysis of variance , ANOVA ) 在研究一个变量时,能够解决多个总体的均值是否相等的检验问题; 在研究多个变量对不同总体的影响时,它也是分析各个自变量对因变量 影响的一种方法。 1 .方差分析的内容 首先我们对多个总体均值是否相等这一假设进行检验。 例 6.1 某饮料生产企业研制出一种新型饮料 . 饮料的颜色共有四种 : 橘黄 色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能
影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超市上收 集了该种饮料的销售情况。 该饮料在五家超市的销售情况 超市 无色 粉色 橘黄色 绿色 1 26.5 31.2 27.9 30.8 28.7 28.3 25.1 29.6 25.1 30.8 28.5 29.1 27.9 24.2 31.7 27.2 29.6 26.5 32.8 均值 27.32 29.56 26.44 31.46 进行方差分析 问题:饮料的颜色是否对销售量产生影响 在其他条件相同的情况下,上述问题就归结为一个检验问题,即:检验 饮料颜色对销售量是否有影响 H0:==H3=P4 H:PH2.,H不先全相筝 即
影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超市上收 集了该种饮料的销售情况。 该饮料在五家超市的销售情况: 超市 无色 粉色 橘黄色 绿色 1 2 3 4 5 26.5 28.7 25.1 29.1 27.2 31.2 28.3 30.8 27.9 29.6 27.9 25.1 28.5 24.2 26.5 30.8 29.6 32.4 31.7 32.8 均值 27.32 29.56 26.44 31.46 进行方差分析: 问题:饮料的颜色是否对销售量产生影响? 在其他条件相同的情况下,上述问题就归结为一个检验问题,即:检验 饮料颜色对销售量是否有影响? 即:
2.方差分析的原理 从方差分析的目的看,是要检验四种颜色的饮料的销售均值是否相等, 我们可用方差比较的方法来判断 首先,四种颜色的销售情况可看作为分为四个组 组内平均数组内平方和SsA 组间平方和SSE 颜色 ∑2-x ∑(x-对 无色 27.32 10.688 粉色 29.56 8.572 橘黄色 26.44 13.192 68455 绿色 31.46 6.632 合计 39084 总平方和SST ∑(x-x =1T5.9295 由此可知:差异的产生来自两个方面 方面是由不同颜色的差异造成的,既不同的饮料颜色对销售量产生了 影响 另一方面是由于抽选样本的随机性而产生的差异,即各颜色内的随机误 差,如相同颜色的饮料在不同的商场销售量也不同。 这两个方面产生的差异可以用两个方差来计量
2 .方差分析的原理 从方差分析的目的看,是要检验四种颜色的饮料的销售均值是否相等, 我们可用方差比较的方法来判断。 首先,四种颜色的销售情况可看作为分为四个组: 颜色 组内平均数 组内平方和 SSA 组间平方和 SSE 无色 27.32 10.688 76.8455 粉色 29.56 8.572 橘黄色 26.44 13.192 绿色 31.46 6.632 合计 - 39.084 总平方和 SST 由此可知:差异的产生来自两个方面: 一方面是由不同颜色的差异造成的,既不同的饮料颜色对销售量产生了 影响 另一方面是由于抽选样本的随机性而产生的差异,即各颜色内的随机误 差,如相同颜色的饮料在不同的商场销售量也不同。 这两个方面产生的差异可以用两个方差来计量:
一个称为水平之间(组间)差(组间平方和除以自由度(r-1),r为 组数),一个称为水平内部(组内)方差(组内平方和除以自由度(n-1),n 为样本容量总数 水平之间的方差既包括系统性因素,也包括随机性因素;水平内部方差 仅包括随机性因素。如果不同的水平(饮料颜色)对结果没有影响,那么在水平 之间的方差中,就仅仅有随机因素的差异,而没有系统性差异,它与水平内部方 差就应该近似,从而应有 水平之而紅问)的方姜 水平内部狐而)方葚 即,两个方差的比值就会接近于1。反之,水平之间的方差就会大于 水平内的方差,当这个比值达到某个程度,或者说达到某临界点,就可做出判断 既不同的水平之间存在着显著差异。 因此,方差分析就是通过不同方差的比价,做出拒绝原假设或不能拒绝 原假设的判断。 F=平之严血河者丢→F(r-1,n一r)分布 水平内敏h基 水平间的方差和水平内方差之比是一个统计量,这个统计量服从F分 布
一个称为水平之间(组间)方差 ( 组间平方和除以自由度 (r-1) ,r 为 组数 ) ,一个称为水平内部(组内)方差(组内平方和除以自由度( n-1) , n 为样本容量总数)。 水平之间的方差既包括系统性因素,也包括随机性因素;水平内部方差 仅包括随机性因素。如果不同的水平(饮料颜色)对结果没有影响,那么在水平 之间的方差中,就仅仅有随机因素的差异,而没有系统性差异,它与水平内部方 差就应该近似,从而应有: 即,两个方差的比值就会接近于 1 。反之,水平之间的方差就会大于 水平内的方差,当这个比值达到某个程度,或者说达到某临界点,就可做出判断, 既不同的水平之间存在着显著差异。 因此,方差分析就是通过不同方差的比价,做出拒绝原假设或不能拒绝 原假设的判断。 水平间的方差和水平内方差之比是一个统计量,这个统计量服从 F 分 布:
3.方差分析的种类 单因素的方差分析 ne-Way ANOVA 分析一个变量时 多因素的方差分析 Univariate 分析多个变量时,称为多元方差分析 Multivariate 4.应用方差分析的条件 各组的观察数据,要看作是从服从正态分布的总体随机抽取的样本 各组的观察数据,是从具有相同方差的相互独立的总体中抽取得到的 一元单因素方差分析 例6.1中有一个变量和一个因素,即:变量 dependent variable 饮料的销售量;因素 factor:饮料的颜色。 用Spss处理数据 spss数据:饮料的颜色 spss选项: Analyze- Compare Mean- One-Way ANOVA SPSS输出结果:
3 .方差分析的种类 分析多个变量时,称为多元方差分析 Multivariate 4 .应用方差分析的条件 各组的观察数据,要看作是从服从正态分布的总体随机抽取的样本; 各组的观察数据,是从具有相同方差的相互独立的总体中抽取得到的。 三、一元单因素方差分析 例 6.1 中有一个变量和一个因素,即:变量 dependent variable : 饮料的销售量;因素 factor :饮料的颜色。 用 Spss 处理数据: Spss 数据:饮料的颜色 Spss 选项: Analyze — Compare Mean — One-Way ANOVA SPSS 输出结果: