第五章:SPSS统计绘图功能详解 (医学统计之星:张文彤) ,SAS绘制的统计图不太美观;而SPSS绘制的统计图较为美观,可以满足 大多数情况下的要求; STATA绘制的统计图形最为精美,但由于它采用命令行方 式操作,美观的图形需要添加大量选项,普通人不易掌握;而S-PLUS、 MATHLAB 等偏数理统计的软件虽然绘图能力也非常强,但由于自身的定位问题,并不为大 多数人所熟悉。因此,在各种统计软件中,以SPSS制作的统计图应用最为广泛 心 EXECL的统计绘图功能非常的强,我们还有必要学习SPSS的绘图功能 这个问题我的看法是: EXCEL由于它的纯中文界面和简单而强大的绘图功能,使 得可以用它来直接绘制各种简单的统计图,但是, EXCEL可以直接绘制的统计图 种类有限,象误差条图、自回归图等它就无能为力,即是它支持的线图、条图等, 如果过于复杂,如叠式条图、累计条图等也无法作出,而这些图在统计中是经常 会碰到的,此时就只有采用统计软件来绘制,SPSS就是其中的佼佼者。 §5.1常用统计图 在SPSS10.0版中,除了生存分析所用的生存曲线图被整合到 ANALYZE菜单 中外,其他的统计绘图功能均放置在 graph菜单中。该菜单具体分为以下几部分: Gallery:相当于一个自学向导,将统计绘图功能做了简单的介绍,初学 者可以通过它对SPSS的绘图能力有一个大致的了解。 · Interactive:交互式统计图,这是SPSS9.0版新增的内容 sMap:统计地图,这是SPSS10.0版新增的内容。 市面上所能见到的SSs10.0D版由于执照不全,并不能安装统计地图 模块。 ·下方的其他菜单项是我们最为常用的普通统计图,具体来说有: 条图 洲散点图 心□ 线图 直方图饼图 面积图 向箱式图 正态Q→Q图 正态PP图 质量控制图 Pareto图 自回归曲线图
第五章:SPSS 统计绘图功能详解 (医学统计之星:张文彤) ,SAS 绘制的统计图不太美观;而 SPSS 绘制的统计图较为美观,可以满足 大多数情况下的要求;STATA 绘制的统计图形最为精美,但由于它采用命令行方 式操作,美观的图形需要添加大量选项,普通人不易掌握;而 S-PLUS、MATHLAB 等偏数理统计的软件虽然绘图能力也非常强,但由于自身的定位问题,并不为大 多数人所熟悉。因此,在各种统计软件中,以 SPSS 制作的统计图应用最为广泛。 EXECL 的统计绘图功能非常的强,我们还有必要学习 SPSS 的绘图功能 吗? 这个问题我的看法是:EXCEL 由于它的纯中文界面和简单而强大的绘图功能,使 得可以用它来直接绘制各种简单的统计图,但是,EXCEL 可以直接绘制的统计图 种类有限,象误差条图、自回归图等它就无能为力,即是它支持的线图、条图等, 如果过于复杂,如叠式条图、累计条图等也无法作出,而这些图在统计中是经常 会碰到的,此时就只有采用统计软件来绘制,SPSS 就是其中的佼佼者。 §5.1 常用统计图 在 SPSS 10.0 版中,除了生存分析所用的生存曲线图被整合到 ANALYZE 菜单 中外,其他的统计绘图功能均放置在 graph 菜单中。该菜单具体分为以下几部分: • Gallery:相当于一个自学向导,将统计绘图功能做了简单的介绍,初学 者可以通过它对 SPSS 的绘图能力有一个大致的了解。 • Interactive:交互式统计图,这是 SPSS 9.0 版新增的内容。 • Map:统计地图,这是 SPSS 10.0 版新增的内容。 市面上所能见到的 SPSS 10.0 D 版由于执照不全,并不能安装统计地图 模块。 •下方的其他菜单项是我们最为常用的普通统计图,具体来说有: 条图 散点图 线图 直方图 饼图 面积图 箱式图 正态 Q-Q 图 正态 P-P 图 质量控制图 Pareto 图 自回归曲线图
高低图 交互相关图序列图 频谱图 误差线图 其中后面几种图形用于时间序列分析。我们的讲解将这些常规统计图为 主,对交互式统计图和统计地图只举例介绍,就不再全面讲述了 我们所用的数据集为SPSS自带的 anxiety.sav,本章的大多数例子都将围 绕该数据集展开。 5.1.1操作界面介绍(条图) 5.1.1.1条图的通用界面 由于不同图形的绘图对话框有相当强的共性,下面我们通过一个简单的例子 来看看绘图菜单的大致界面是怎么样的,通过这个例子大家可以举一反三。 例5.1:在数据集 anxIety.sav中分不同的 subject对变量 score值(之和) 绘制条图。 选择 graphs=bar后,系统首先会弹出一个简单的导航对话框如下所示: 绘制简单条图(单式条图) Define Simple 绘制复式条图 Cancel 绘制堆积条图(分段条图) Help Stacked 定义统计图中数据的表达类型: 条图反映了同一变量若干条记录的分组汇总 Data in Chart Are group 条图反映了不同变量的汇总 C Summaries of separate ariables C Values of individual cases 条图反映了个体观察值 在该对话框中,SPSS将条图进行了大致的分类,对话框的上半部分用于选 择条图类型,下半部分的 Data in chart are单选框组用于定义条图中数据的表
高低图 交互相关图 序列图 频谱图 误差线图 其中后面几种图形用于时间序列分析。我们的讲解将这些常规统计图为 主,对交互式统计图和统计地图只举例介绍,就不再全面讲述了。 我们所用的数据集为 SPSS 自带的 anxiety.sav,本章的大多数例子都将围 绕该数据集展开。 5.1.1 操作界面介绍(条图) 5.1.1.1 条图的通用界面 由于不同图形的绘图对话框有相当强的共性,下面我们通过一个简单的例子 来看看绘图菜单的大致界面是怎么样的,通过这个例子大家可以举一反三。 例 5.1:在数据集 anxiety.sav 中分不同的 subject 对变量 score 值(之和) 绘制条图。 选择 graphs==>bar 后,系统首先会弹出一个简单的导航对话框如下所示: 绘制简单条图(单式条图) 绘制复式条图 绘制堆积条图(分段条图) 定义统计图中数据的表达类型: 条图反映了同一变量若干条记录的分组汇总 条图反映了不同变量的汇总 条图反映了个体观察值 在该对话框中,SPSS 将条图进行了大致的分类,对话框的上半部分用于选 择条图类型,下半部分的 Data in Chart are 单选框组用于定义条图中数据的表
达类型。这里根据我们所需绘制条图的类型,应该选择简单条图,在表达类型中 则应选择" Summaries for groups of cases"。选好后单击 DEFINE钮,系统开启 正式的条图定义对话框如下: a Define Simple Bar: Summaries for Groups of Cases Bars Represent OK Anxiety [anxiety c Nof cases C% of cases 参 Tension [tension] Cum n of cases C Cum. of cases o Score [score o Trial[trial] C Other summary function Reset Variabl Cancel Change Summary. Helr Category Axis Template Use chart specifications from: Titles File Options 对话框左侧为通用的侯选变量列表框,右侧的对话框元素依次解释如下: 【 Bars represent单选框组】 用于定义条图中直条所代表的含义,可以是样本例数、样本数所占的百分比、 累计样本例数、累计样本数所占的百分比或其余汇总函数,在例5.1中我们要对 变量 score的值绘图,因此选择最后一项" Other summary function",系统开启 summary function对话框如下所示:
达类型。这里根据我们所需绘制条图的类型,应该选择简单条图,在表达类型中 则应选择"Summaries for groups of cases"。选好后单击 DEFINE 钮,系统开启 正式的条图定义对话框如下: 对话框左侧为通用的侯选变量列表框,右侧的对话框元素依次解释如下: 【Bars Represent 单选框组】 用于定义条图中直条所代表的含义,可以是样本例数、样本数所占的百分比、 累计样本例数、累计样本数所占的百分比或其余汇总函数,在例 5.1 中我们要对 变量 score 的值绘图,因此选择最后一项"Other summary function",系统开启 summary function 对话框如下所示:
Summary Function for Selected Variable(s) Continue Mean of values C Standard deviation Cancel C Median of values C Variance C Mode of values C Minimum value Help C Number of cases C Maximum value CSum ofvalues C Cumulative sum C Percentage above C Number above C Percentage belot C Number below C Percentile High C Percentage inside C Number inside Values are grouped midpoints 该对话框中列出了更多的统计汇总函数,可以满足绝大多数情况的需要。具 体有 上部:包括大多数常用统计汇总函数,如均数、标准差、中位数、方差、 众数、最大、最小值、样本例数、变量值之和、累计变量值 中部:可对各记录按大小进行筛选,如上侧百分之多少,或者只选择小 于某个数值的记录。具体的数值在 value框中输入。 下部:可按数值大小值选择取值在某个范围内的记录,具体的范围在low 和high框中输入。 注意上面的一些函数是和前面重复的,如样本例数 此外,对话框最下侧还有一个 Values are grouped midpoints复选框,当 选中 median of values或 percentile单选框时该框变为可选,选中则表明数据 为频数表格式,所输入的数值为组中值 根据我们的目的,这里选择 sum of values单选框,单击 continue后系统 回到上一个对话框。 【 Category Axis框】 用于选择所需的分类变量,此处必选。这里根据要求,将 sub ject选入,可 以见到此时0K已经变黑可用了
该对话框中列出了更多的统计汇总函数,可以满足绝大多数情况的需要。具 体有: •上部:包括大多数常用统计汇总函数,如均数、标准差、中位数、方差、 众数、最大、最小值、样本例数、变量值之和、累计变量值。 •中部:可对各记录按大小进行筛选,如上侧百分之多少,或者只选择小 于某个数值的记录。具体的数值在 value 框中输入。 •下部:可按数值大小值选择取值在某个范围内的记录,具体的范围在 low 和 high 框中输入。 注意上面的一些函数是和前面重复的,如样本例数。 此外,对话框最下侧还有一个 Values are grouped midpoints 复选框,当 选中 median of values 或 percentile 单选框时该框变为可选,选中则表明数据 为频数表格式,所输入的数值为组中值。 根据我们的目的,这里选择 sum of values 单选框,单击 continue 后系统 回到上一个对话框。 【Category Axis 框】 用于选择所需的分类变量,此处必选。这里根据要求,将 subject 选入,可 以见到此时 OK 已经变黑可用了
【 Template框】 用于选择绘制条图的模板,一般较少用。 【 Titles钮】 用于输入统计图的标题和脚注,最多可以输入两行主标题,一行副标题,两 脚注。 【 Options钮】 弹出 Options对话框,用于定义相关的选项,有: o Confidence Interval框输入需要计算的均数差值可信区间范围, 默认为95%。如果是和总体均数为0相比,则此处计算的就是样本所在总 体均数的可信区间。 。 Missing values单选框组定义分析中对缺失值的处理方法,可以是 具体分析用到的变量有缺失值才去除该记录( Excludes cases analysis by analysis),或只要相关变量有缺失值,则在所有分析中均将该记录 去除( Excludes cases listwise)。默认为前者,以充分利用数据。 现在,我们已经完成了绘制该图所需的工作,单击0K,系统绘出统计图如 下 至于 Data inChart are中的另两种情况 Summaries of separate variables 和 Values of individual cases,其对话框界面极为简单,可以说是一目了然, 这里不再多讲,只指出以下几点
【Template 框】 用于选择绘制条图的模板,一般较少用。 【Titles 钮】 用于输入统计图的标题和脚注,最多可以输入两行主标题,一行副标题,两 行脚注。 【Options 钮】 弹出 Options 对话框,用于定义相关的选项,有: o Confidence Interval 框 输入需要计算的均数差值可信区间范围, 默认为 95%。如果是和总体均数为 0 相比,则此处计算的就是样本所在总 体均数的可信区间。 o Missing Values 单选框组 定义分析中对缺失值的处理方法,可以是 具体分析用到的变量有缺失值才去除该记录(Excludes cases analysis by analysis),或只要相关变量有缺失值,则在所有分析中均将该记录 去除(Excludes cases listwise)。默认为前者,以充分利用数据。 现在,我们已经完成了绘制该图所需的工作,单击 OK,系统绘出统计图如 下: 至于 Data inChart Are 中的另两种情况 Summaries of separate variables 和 Values of individual cases,其对话框界面极为简单,可以说是一目了然, 这里不再多讲,只指出以下几点: