手里都是同样重量,不会因人而异。 每一个被调查者不都从同一角度作出判断这一假设是说,被调查者并不都是 用同样的主观或客观维度及指标来作为判断的依据,虽然主要的指标很可能会 样,但不完全一样。举例来说,在调查人们生活的满意程度时,有的调查对象从 收入的角度考虑得多一些,认为收入越高越满意;而另一些被调查者可能更注重 家庭关系的和谐;还有的人注重有没有较好的工作、住房等;这样大家作出判断 的角度就不一样了。在这里,收入可能是所有人都要考虑的指标之一,但如果所 有调查者都以收入水平作为惟一的考虑角度,收入这样一个指标就反映了生活满 意度,那么也就没有必要再进行对应分析了。 2.所有被调查者对于某一维度重要性的评价不必一样 比如生活满意度的评价中,有的人认为收入水平最重要;但另一些人可能认 为收入多少并不重要,而家庭和谐才是生活满意度的最重要因素。 3.被调查者的评判角度和看法可以改变 被调查者作出评判时所考虑的角度、对每个维度重要性的看法会随着时间推 移而改变,不一定要保持同一看法。现在对收入和生活很满意的人过两年也可能 会回答不满意。 在实际调查过程中,毎个被调查者通常会从各白选择的角度来回答问题,对 满意程度、喜好与否等作出评判。对应分析就是要找出被调査者的比较一致的看 法,以及他们在回答问题时主要是从哪些角度考虑的。 在使用定性变量数据进行分析时,交叉汇总表中的数字可以代表线性关系 也可以代表非线性关系。 对应分析的基础是交叉汇总表,表中的每一个单元格(Cel)都代表着被调 查者选择某一答案的频数,也表示着行与列的对应关系。对应分析的一个重要前 提条件是表中的每一单元格都不能是负数或零,如果有频数为零的单元格出现, 应该对变量的分类进行合并,去掉有频数为零的单元格类别。例如,在分析有不 同生活自理能力的老年人对自己健康状况的评价时,如果分成“极好、很好 好、一般、不好、很不好”时,没有生活自理能力的老年人很可能就没有人回答 健康¨极好”这一类,这样就出现了一个频数为零的单元格,这时就要将极好与 很好(假如有人回答“很好”)合并,去掉“极好”这一类别。此外,表中的行 和列的设置并不是固定的,比如说,表示职业的变量既可以作为列变量,也可以 作为行变量,对分析结果没有影响
三、使用SPSS统计软件进行对应分析 随着计算机的日益普及,可以进行对应分析的软件也越来越多。在各种软件 中应用最广泛的软件是SPSS软件中的 ANACOR程序( Procedure)和 HOMALS程 序,BMDP软件中的CA程序,P-MDS软件中的 CORRAN和 CORRESP程序。 本章主要以SFS软件中的 ANACOR程序为例,并介绍相应的上机操作技术。 ANACOR是对应分析( Analysis of Correspondence)的缩写。在 SPSS for Windows6x版本软件中尚没有现成的菜单命令可供选择,需要在 Syntax窗口 下编写并运行命令程序。但是,在刚刚发行的 SPSS for windows7.5版软件中已 经有现成的菜单命令可供选择,用户在 Statistics窗口下选择 Data reduction子窗 口,再选择( orrespondence命令就可以定义并运行命令程序。考虑到广大的用户 现在仍在使用 SPSS for window6.x版本软件,本章的例题仍然以在6.x版本软 件中编写程序的方式介绍对应分析方法,读者对于程序的编写格式和命令关键字 的使用规定应当格外加以注意。ANA(OR程序是由荷兰雷登( Leiden)大学数 据理论系编制的,在每次运行结果的开始都会显示这一单位。SPSS通过合同将 此程序进行了套装。 使用 Windows版SrSS进行对应分析的步骤如下: 兴对定性变量数据进行交叉汇总,得到对应分析所要求的汇总表。 在 Statistics窗口中调用(' rossas程序,选择所要分析的两个定性变量数据 分别定义为行变量和列变量,然后执行交叉汇总命令,得到汇总表。随后,要检 查是否有频数为零的单元格,如果有这样的情况须进行必要的类别调整,使之符 合对应分析对汇总表的要求。 开启 Syntax窗口、按照对应分析的命令格式编写程序,进行参数设定并 运行程序 检查运行结果和各种统计图,必要时可以调整参数,重新运行程序,使直 观图能够最好地表现变量之间的关系。 x对分析结果加以合理的解释。 四、对应分析示例 为了更好地说明对应分析的应用过程及参数确定等一系列问题,本章以一个
应用对应分析的例子来进行示范。例子中所用数据来自北京老年病医学研究中心 1992-1994年在北京市进行的“北京老龄化多维纵向研究”。在这项研究中,先 后在两年的时间里,研究人员对一批60岁以上的老年人进行纵向追踪调查,其 中有2703位老年人是在两次调查中都被调查到的,这里选择这些老年人在1992 年基线调查中对“日常生活自理能力”和“自评健康状况”两个问题的回答进行 分析。 在“日常生活自理能力”问题中,自理程度(答案)分为完全自理、部分自 理和不能自理三类。健康自评的问题是:“您觉得您现在的身体好吗?”答案分为 五类:很好、好、一般、差、很差 第一步是对调査数据中“日常生活自理能力”和“自评健康状況”两个变量 进行交叉汇总,得出汇总表。 在 Windows版SPSS中,首先调入含有上述两个变量的数据文件;在St tics窗口中选择 Crosstabs程序,进行交叉汇总,得到以下汇总表,见表14-1 表14-1 老年人生活自理能力与自评健康状况汇总表 自评健康状况 生活自理能力 完全自理 部分自理 不能自理 合计 很好 5 般 251 436 很差 没回答 2 合计 400 306 270 在汇总表巾新出现了一行,即“没回答”,这是因为一些老人没有对自己的 健康状况进行评价,这在类似的社会调查中也是常见的现象,也就是说常有一些 被调查者没有回答全部问题。如果确实认为这一类情况可以不考虑在内,那么可 以把这一行去掉。但从本例考虑,我们很想知道什么样的老年人更不愿意对自己 的健康状况进行评价,所以在以下的对应分析中保留了这一行频数 从表中的频数分布看,没有频数为零的单元格,符合对应分析的基本要求 在回答健康状况好或一般的老年人中,生活能够完全自理的人最多,但仍有·部 分人生活不能自理。在回答说自己健康状况很差的老年人中,生活不能自理的老 年人占有很大比重。那么,自评健康状况与日常生活自理能力之间到底有怎样的
关系呢?这是我们关心的主要问题。 第二步,打开 Syntax窗口,编写对应分析程序、设定参数并运行程序。 首先,使用表14—1中两个变量各个类别的频数分布定义对应分析所需的数 据。其次,定义每个变量的名字和变量中每个类别的名字,以便在以后的统计结 果中可以一目了然地看清楚分析结果并加以解释。第三,定义标准化形式和图形 输出形式。最后,运行程序,得出分析结果和图形。 表142是针对本例编写的对应分析程序 表14-2 例1的命令程序 DATA LIST FREE SRH ADL FREQ BEGIN DATA 1:1291214138 21931221462396 31660321163374 4125142104438 511152:5323 611562136324 E、 D DATA VARIABLE LABELS SFH’自评健康状况 /ADL’生活自理能力 VALLE LABELS SRH1很好2”好3’一般’4'差’5'很差6’没回答 /DL1’完全自埋2部分自理’3’不能自理 WEIGHT BY FREQ NACOR TABLES=SRH (1, 6) BY ADL. (1, 3) ANORMALIZATION=PRINCIPAI PLOT ROWS COLLMNS 本书所附磁盘中提供这一程序文件,文件名为T14.2.Ss 在这个程序里, DATA LIST命令定义了在对应分析中要输入三个变量 SRH、ADL和FREQ,输入的格式是自由格式。其中,SRH的值代表表14-1 中的行号,ADL代表列号,FRFQ是对应的单元格的频数。例如,第二行的第 三组数字23%6就代表表14-1中第二行第三列的频数为96。 在上述程序中,数据的排列与表14—1的格式是对应的,这样比较直观,也 便于核对数据。实际上,由于在输入格式上我们已经定义为自由格式,输入数据 时各组数据完全可以连续输入,每组数据之间只要用空格分开就行,不必按原表 中格式排列。当一行程序写不下全部数据时,可以转到下一行接着写。 从数据输入这部分程序也可以看出,在已有交互汇总表的情况下,我们并不 465