§7方差分析
§7 方差分析
§7.1单因素试验的方差分析 本节要求掌握单因素实验的方差分析的基本方法和 步骤。 在科学试验和生产实际中,影响一事物的因素往往 是很多的。例如,在化工生产中,有原料成分、原料剂 量、催化剂、反应温度、压力、溶液浓度、反应时间、 机器设备及操作人员的水平等因素。每一因素的改变都 有可能影响产品的数量和质量。有些因素影响较大,有 些较小。为了使生产过程得以稳定,保证优质、高产, 就有必要找出对产品质量有显著影响的那些因素。为此 我们需进行试验。方差分析就是根据实验的结果进行分 析,鉴别各个有关因素对实验结果影响的有效方法 (即方差分析就是通过对试验数据进行分析,检验方差 相同各正态总体的均值是否相等,以判断各因素对试验 结果的影响是否显著。)
§7.1 单因素试验的方差分析 本节要求掌握单因素实验的方差分析的基本方法和 步骤。 在科学试验和生产实际中,影响一事物的因素往往 是很多的。例如,在化工生产中,有原料成分、原料剂 量、催化剂、反应温度、压力、溶液浓度、反应时间、 机器设备及操作人员的水平等因素。每一因素的改变都 有可能影响产品的数量和质量。有些因素影响较大,有 些较小。为了使生产过程得以稳定,保证优质、高产, 就有必要找出对产品质量有显著影响的那些因素。为此, 我们需进行试验。方差分析就是根据实验的结果进行分 析,鉴别各个有关因素对实验结果影响的有效方法。 (即方差分析就是通过对试验数据进行分析,检验方差 相同各正态总体的均值是否相等,以判断各因素对试验 结果的影响是否显著。)
在试验中,我们将要考察的指标称为试验指 标。影响试验指标的条件称为因素。因素可分为 两类,一类是人们可以控制的(可控因素),另 类是人们不能控制的。例如,反应温度、原料 剂量、溶液浓度等是可以控制的,而测量误差、 气象条件等一般是难以控制的。以下我们所说的 因素都是可控因素。因素所处的状态,称为该因 素的水平。如果在一项试验中只有一个因素在改 变称为单因素试验,如果多于一个因素在改变称 为多因素试验
在试验中,我们将要考察的指标称为试验指 标。影响试验指标的条件称为因素。因素可分为 两类,一类是人们可以控制的(可控因素),另 一类是人们不能控制的。例如,反应温度、原料 剂量、溶液浓度等是可以控制的,而测量误差、 气象条件等一般是难以控制的。以下我们所说的 因素都是可控因素。因素所处的状态,称为该因 素的水平。如果在一项试验中只有一个因素在改 变称为单因素试验,如果多于一个因素在改变称 为多因素试验
§71.1单因素试验方差分析的模型 例1进行某化学合成反应时,为了解催化剂对收率是否有影响,分 别用5种不同的催化剂独立地在相同条件下进行试验,每种催化剂试 验4次得收率如下表。试判断催化剂对收率是否有显著性影响? 催化剂 收率 平均收率 0.860.890.910.900.8900 2(X2) 0.800.830.880.84 0.8375 3 0.830.900.940.850.8800 4(X4) 0.760.810.840.820.8075 0.960.930.950.940.9450 解:此例中只有催化剂一个因素(可控因素),5种不同的催化剂可 视为该因素的5个非数量水平,所考察的试验指标是收率。 在同一催化剂下试验所得收率可视为一个总体,5种不同的催化剂 对应于5个总体。记为X 1542,43,4-4,45 又假定X;间相互独立同 方差且X1N(H12)(i=1,2,3,4,5)。设第个总体的各次试验值为X 可看成随机误差。记x1因1=1,则x可与2)。因此,s (j=1,2,3,4,故X1~N(p1,02),即有X1共~N(0 X1=H1+8 C:~N(0,2),各ε:独立, i=1,2,3,4,5;j=1,2,3,4
§7.1.1 单因素试验方差分析的模型 例1 进行某化学合成反应时,为了解催化剂对收率是否有影响,分 别用5种不同的催化剂独立地在相同条件下进行试验, 每种催化剂试 验4次,得收率如下表。试判断催化剂对收率是否有显著性影响? 催化剂 收率 平均收率 1(X1 ) 0.86 0.89 0.91 0.90 0.8900 2(X2 ) 0.80 0.83 0.88 0.84 0.8375 3(X3 ) 0.83 0.90 0.94 0.85 0.8800 4(X4 ) 0.76 0.81 0.84 0.82 0.8075 5(X5 ) 0.96 0.93 0.95 0.94 0.9450 解:此例中只有催化剂一个因素(可控因素),5种不同的催化剂可 视为该因素的5个非数量水平,所考察的试验指标是收率。 在同一催化剂下试验所得收率可视为一个总体,5种不同的催化剂 对应于5个总体。记为X1 , X2 , X3 , X4 , X5 。又假定Xi 间相互独立同 方差且Xi ~N(μi ,σ2 ) (i=1,2,3,4,5) 。设第i个总体的各次试验值为Xij (j=1,2,3,4),故Xij ~ N(μi ,σ2 ),即有Xij - μi ~N(0,σ 2 )。因此, Xij - μi可看成随机误差。记Xij - μi =εij,则Xij可写成 Xij = μi +εij, εij ~N(0,σ 2 ),各εij独立, i =1,2,3,4,5;j=1,2,3,4。
这样我们的问题归结为检验假设 H0:μ=队23=4=5;H1:即1234不全相等. 现将问题一般化。设因素A有r个水平A1,A2,,在水平A (i=1,2,…,r)下,进行n1(1>2)次独立试验,得到如下表的结果 单因素试验数据及其计算表 ∑xn∑x∑ A1(X1)X1X12…X1,n1 A2(X2)X21X22…X2 ∑ ∑x∑ Ax) X, X,. X >x,n1(∑亏 ∑∑x∑n∑∑x)2∑∑x n2
这样我们的问题归结为检验假设 H0 : μ1=μ2=μ3=μ4=μ5 ; H1 : μ1 ,μ2 ,μ3 ,μ4 ,μ5 不全相等. 现将问题一般化。设因素A有r个水平A1 ,A2 ,…,Ar,在水平Ai (i=1,2,… ,r)下,进行ni (i≥2) 次独立试验,得到如下表的结果。 单因素试验数据及其计算表 A Xij A1 (X1 ) X11 X12 … X1,n1 A2 (X2 ) X21 X22 … X2,n2 ┆ ┆ ┆ ┆ Ar (Xr ) Xr1 Xr2 … Xr,rn = = = i i ni j i j n j i j i i n j i j x x n x n 1 2 2 1 1 1 = = = 1 1 1 1 2 2 1 1 1 1 1 n j ij n j ij n j ij x x n x n = = = 2 2 2 1 2 2 2 1 2 1 1 n j i j n j i j n j i j x x n x n = = = r r nr j i j n j i j r r n j i j x x n x n 1 2 2 1 1 1 i i j i j j i j i i i i i j i j x x n x n 2 2 ( ) 1