SPSS第八课:征服一般线性模型 - General linear model菜单详解(上) (医学统计之星:张文彤) 请注意,本章的标题用了一些修辞手法,一般线性模型可不是用一章就可 以说清楚的,因为它包括的内容实在太多了。 那么,究竟我们用到的哪些分析会包含在其中呢?简而言之:凡是和方差 分析粘边的都可以用他来做。比如成组设计的方差分析(即单因素方差分析) 配伍设计的方差分析(即两因素方差分析)、交叉设计的方差分析、析因设计的 方差分析、重复测量的方差分析、协方差分析等等。因此,能真正掌握GLM菜单 的用法,会使大家的统计分析能力有极大地提高 实际上一般线性模型包括的统计模型还不止这些,我这里举出来的只是从用 SPSS作统计分析的角度而言的一些。 好了,既然一般线性模型的能力如此强大,那么下属的四个子菜单各自的 功能是什么呢?请看: Univariate子菜单:四个菜单中的大哥大,绝大部分的方法分析都在这 里面进行 Multivariate子菜单:当结果变量(应变量)不止一个时,当然要用他 来分析啦! Repeted Measures子菜单:顾名思义,重复测量的数据就要用他来分析, 这一点我可能要强调一下,用前两个菜单似乎都可以分析出来结果,但在 许多情况下该结果是不正确的,应该用重复测量的分析方法才对(不能再 讲了,再讲下去就会扯到多水平模型去了) ariance Components子菜单:用于作方差成份模型的,这个模型实在 太深,不是一时半会说的请的,所以我在这里就干脆不讲了 出于模型复杂性、篇幅、应用范围及乱七八糟一系列的理由,当然主要是 我懒得一一解释,我决定本章采用举例讲解的方式,及讲解一些常见的分析实例, 通过这种方法来熟悉那些最为常用的分析方法 D多对统计分析的数据格式不太熟悉的朋友,请一定先去看看统计软件第一课 论统计软件中的数据录入格式,会大有帮助的。 §8.1两因素方差分析 下面的这个例子来自《卫生统计学》第四版,书还没有出来,大家先尝尝 鲜
SPSS 第八课:征服一般线性模型 ――General Linear Model 菜单详解(上) (医学统计之星:张文彤) 请注意,本章的标题用了一些修辞手法,一般线性模型可不是用一章就可 以说清楚的,因为它包括的内容实在太多了。 那么,究竟我们用到的哪些分析会包含在其中呢?简而言之:凡是和方差 分析粘边的都可以用他来做。比如成组设计的方差分析(即单因素方差分析)、 配伍设计的方差分析(即两因素方差分析)、交叉设计的方差分析、析因设计的 方差分析、重复测量的方差分析、协方差分析等等。因此,能真正掌握 GLM 菜单 的用法,会使大家的统计分析能力有极大地提高。 实际上一般线性模型包括的统计模型还不止这些,我这里举出来的只是从用 SPSS 作统计分析的角度而言的一些。 好了,既然一般线性模型的能力如此强大,那么下属的四个子菜单各自的 功能是什么呢?请看: • Univariate 子菜单:四个菜单中的大哥大,绝大部分的方法分析都在这 里面进行。 • Multivariate 子菜单:当结果变量(应变量)不止一个时,当然要用他 来分析啦! • Repeted Measures 子菜单:顾名思义,重复测量的数据就要用他来分析, 这一点我可能要强调一下,用前两个菜单似乎都可以分析出来结果,但在 许多情况下该结果是不正确的,应该用重复测量的分析方法才对(不能再 讲了,再讲下去就会扯到多水平模型去了)。 • Variance Components 子菜单:用于作方差成份模型的,这个模型实在 太深,不是一时半会说的请的,所以我在这里就干脆不讲了。 出于模型复杂性、篇幅、应用范围及乱七八糟一系列的理由,当然主要是 我懒得一一解释,我决定本章采用举例讲解的方式,及讲解一些常见的分析实例, 通过这种方法来熟悉那些最为常用的分析方法。 对统计分析的数据格式不太熟悉的朋友,请一定先去看看统计软件第一课: 论统计软件中的数据录入格式,会大有帮助的。 §8.1 两因素方差分析 下面的这个例子来自《卫生统计学》第四版,书还没有出来,大家先尝尝 鲜
例8.1对小白鼠喂以A、B、C三种不同的营养素,目的是了解不同营养素 增重的效果。采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传 因素对体重增长的影响。现将同品系同体重的24只小白鼠分为8个区组,每个 区组3只小白鼠。三周后体重增量结果(克)列于下表,问小白鼠经三种不同营养 素喂养后所增体重有无差别? 区组号A营养素B营养素C营养素 150.1058.2064.50 8048.5062.40 353.1053.8058.60 463.5064.2072.50 571.2068.4079.30 641 45.7038.40 761.9053.0051.20 842.2039.8046.20 根据统计分析的要求,我们建立了三个变量来包括上述信息,即 group 表示区组,food代表使用的营养素, weight表示最终的重量,即 group food weight 1150.01 依此类推 8.1.1 uni karate对话框界面说明 这里只有一个结果变量 weight,要采用 univariate对话框,如下所示
例 8.1 对小白鼠喂以 A、B、C 三种不同的营养素,目的是了解不同营养素 增重的效果。采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传 因素对体重增长的影响。现将同品系同体重的 24 只小白鼠分为 8 个区组,每个 区组 3 只小白鼠。三周后体重增量结果(克)列于下表,问小白鼠经三种不同营养 素喂养后所增体重有无差别? 区组号 A 营养素 B 营养素 C 营养素 1 50.10 58.20 64.50 2 47.80 48.50 62.40 3 53.10 53.80 58.60 4 63.50 64.20 72.50 5 71.20 68.40 79.30 6 41.40 45.70 38.40 7 61.90 53.00 51.20 8 42.20 39.80 46.20 根据统计分析的要求,我们建立了三个变量来包括上述信息,即 group 表示区组,food 代表使用的营养素,weight 表示最终的重量,即: group food weight 1 1 50.01 1 2 58.20 依此类推。 8.1.1 univarate 对话框界面说明 这里只有一个结果变量 weight,要采用 univarate 对话框,如下所示:
4 Univariate 参 group Dependent variable: Model Food ght Contrasts Fi× ed Factor(s Post hoc Random Factor[s]: Save Options Covariate[s]: YLS Weig OK Paste Reset Cancel Help 在上面的这些框框钮钮中,最常用的有: Dependent variable框、 Fixed Factors框、 Model钮、 Post hoc钮,下面我们来一一解释 【 Dependent variable框】 选入需要分析的变量(应变量),只能选入一个。这里我们的应变量为 weight,将他选入即可。 【 Fixed Factors框】 即固定因素,说的通俗一些,就是一一哎呀,我都不知道怎么解释好了, 这样,如果你搞不明白,那么绝大多数要分析的因素都应该往里面选。这里我们 要分析的是 group和food两个变量,把他们全都给我抓进去! 固定因素指的是在样本中它所有可能的取值都出现了,比如例中的food 只可能有1、2、3这三个值,并且都出现了,就被称作固定效应:而相对应的随 机效应的因素指的是所有可能的取值在样本中没有都出现,或不可能都出现,如 本例中的 group,实际上总体中当然不可能只有这8窝,因此要用样本中 group 的情况来推论总体中 group未出现的那些取值的情况时就会存在误差,因此被称 为随机因素。我这里让 group也选入固定框是基于下面的事实:这样做统计分析 的结论是完全相同的。不同的只是推论的那部分
在上面的这些框框钮钮中,最常用的有:Dependent Variable 框、Fixed Factors 框、Model 钮、Post Hoc 钮,下面我们来一一解释。 【Dependent Variable 框】 选入需要分析的变量(应变量),只能选入一个。这里我们的应变量为 weight,将他选入即可。 【Fixed Factors 框】 即固定因素,说的通俗一些,就是--哎呀,我都不知道怎么解释好了, 这样,如果你搞不明白,那么绝大多数要分析的因素都应该往里面选。这里我们 要分析的是 group 和 food 两个变量,把他们全都给我抓进去! 固定因素指的是在样本中它所有可能的取值都出现了,比如例中的 food, 只可能有 1、2、3 这三个值,并且都出现了,就被称作固定效应;而相对应的随 机效应的因素指的是所有可能的取值在样本中没有都出现,或不可能都出现,如 本例中的 group,实际上总体中当然不可能只有这 8 窝,因此要用样本中 group 的情况来推论总体中 group 未出现的那些取值的情况时就会存在误差,因此被称 为随机因素。我这里让 group 也选入固定框是基于下面的事实:这样做统计分析 的结论是完全相同的。不同的只是推论的那部分
【 Random factors框】 用于选入随机因素,如果你弄不明白,假装没看见他就是了。 【 Covariate框】 用于选入协方差分析时的协变量,现在还用不到,不过下一个例子我们就 要给他送礼了。 【 WLS Weight框】 即用于选入最小二乘法权重系数。别理他,根据我的理解,只有统计分析 的变态狂才会想起来用他(如有雷同,纯属巧合)! 【 Model钮】 单击后出现一个对话框,用于设置在模型中包含哪些主效应和交互因子 默认情况为 Full factorial,即分析所有的主效应和交互作用。我们这里没有 交互作用可分析,所以要改一下,否则将作不出结果来。将按钮切换到右侧的 custum,这时中部的 Build term下拉列表框就变黑可用,该框用于选择进入模 型的因素交互作用级别,即是分析主效应、两阶交互、三阶交互、还是全部分析 这里我们只能分析主效应:选择main,再用黑色箭头将 group和food选入右侧 的 model框中,如果对这段叙述不太清楚,请参考下面的动画。 Specify Model F Full factorial C Custom Continue Factors covariates Model Cancel group) food[F] Help Build Term(sI Interaction Sum of squares vre-]lmeudetetmde
【Random Factors 框】 用于选入随机因素,如果你弄不明白,假装没看见他就是了。 【Covariate 框】 用于选入协方差分析时的协变量,现在还用不到,不过下一个例子我们就 要给他送礼了。 【WLS Weight 框】 即用于选入最小二乘法权重系数。别理他,根据我的理解,只有统计分析 的变态狂才会想起来用他(如有雷同,纯属巧合)! 【Model 钮】 单击后出现一个对话框,用于设置在模型中包含哪些主效应和交互因子, 默认情况为 Full factorial,即分析所有的主效应和交互作用。我们这里没有 交互作用可分析,所以要改一下,否则将作不出结果来。将按钮切换到右侧的 custum,这时中部的 Build Term 下拉列表框就变黑可用,该框用于选择进入模 型的因素交互作用级别,即是分析主效应、两阶交互、三阶交互、还是全部分析。 这里我们只能分析主效应:选择 main,再用黑色箭头将 group 和 food 选入右侧 的 model 框中,如果对这段叙述不太清楚,请参考下面的动画
该对话框中还有两个元素:左下方的 Sum of squares框用于选择方差分析 模型类别,有1型到4型四种,如果你搞不清他们之间的区别,使用默认的3 型即可:中下部有个 Include intercept in model复选框,用于选择是否在模 型中包括截距,不用改动,默认即可。 【 Contrast钮】 弹出 Contrast对话框,用于对精细趋势检验和精确两两比较的选项进行定 义,在这里,该对话框比单因素方差分析的时候还要专业,使用频率也更少,反 正我都没用过,就干脆就不介绍了。 【 Plots钮】 用于指定用模型的某些参数作图,比如用food和 group来作图,用的也比 较少(指国内,因为它主要是用来做模型诊断用的)。 【 Post hoc钮】 该按钮弹出的两两比较对话框和第7章单因素方差分析中的一模一样,不 再重复。本题对food作两两比较,方法为SNK法 【Save钮】 将模型拟合时产生的中间结果或参数保存为新变量供继续分析时用,可保 存的东东有预测值、残差、诊断用指标等。 【 Options钮】 当然是定义选项啦!可以定义输出哪些指标的估计均数、并做所选择的两 两比较,还有其他一些输出,如常用描述指标、方差齐性检验等。 好了,都解释完了,再重复以下,我们所作的操作为: 1. Analyze==>General Lineal mode l==>Univariate 2. Dependent variable框:选入 weight 3. Fixed Factors框:选入 group和food 4. Model钮:单击 5. Custom单选钮:选中 6. Model框:选入 group和food 7.单击OK 8. Post hoc钮:单击 9. Post hoc test for框:选入food 10.SNK复选框:选中 11.单击OK 12.单击OK
该对话框中还有两个元素:左下方的 Sum of squares 框用于选择方差分析 模型类别,有 1 型到 4 型四种,如果你搞不清他们之间的区别,使用默认的 3 型即可;中下部有个 Include intercept in model 复选框,用于选择是否在模 型中包括截距,不用改动,默认即可。 【Contrast 钮】 弹出 Contrast 对话框,用于对精细趋势检验和精确两两比较的选项进行定 义,在这里,该对话框比单因素方差分析的时候还要专业,使用频率也更少,反 正我都没用过,就干脆就不介绍了。 【Plots 钮】 用于指定用模型的某些参数作图,比如用 food 和 group 来作图,用的也比 较少(指国内,因为它主要是用来做模型诊断用的)。 【Post Hoc 钮】 该按钮弹出的两两比较对话框和第 7 章单因素方差分析中的一模一样,不 再重复。本题对 food 作两两比较,方法为 SNK 法。 【Save 钮】 将模型拟合时产生的中间结果或参数保存为新变量供继续分析时用,可保 存的东东有预测值、残差、诊断用指标等。 【Options 钮】 当然是定义选项啦!可以定义输出哪些指标的估计均数、并做所选择的两 两比较,还有其他一些输出,如常用描述指标、方差齐性检验等。 好了,都解释完了,再重复以下,我们所作的操作为: 1. Analyze==>General Lineal model==>Univariate 2. Dependent Variable 框:选入 weight 3. Fixed Factors 框:选入 group 和 food 4. Model 钮:单击 5. Custom 单选钮:选中 6. Model 框:选入 group 和 food 7. 单击 OK 8. Post Hoc 钮:单击 9. Post Hoc test for 框:选入 food 10. SNK 复选框:选中 11. 单击 OK 12.单击 OK