第2章统计调查 2.1数据的计量与类型 【学习目标】 本章主要介绍了数据的计量与类型;数据调查的基本形式和收集 数据的具体技术;问卷设计的原则、程序、问题的形式、设计调查问 卷的技巧、问卷结构以及注意事项:次级数据信息的搜集的来源及特 点等。 【基本要求】 学习本章内容,要求学习者掌握数据的计量与类型,重点掌握是 据调查的基本形式:普査、抽样调查、统计报表、重点调査和典型调 查,几个字的特点:掌握数据的具体技术。理解问卷设计的原则、程 序以及设计调查问卷的技巧、问卷的结构等;了解次级数据的收集来 源和特点 【本章内容】 2.1.1、数据的计量 统计研究客观事物的数量方面,离不开统计数据,统计数据是对 客观现象进行计量的结果。对统计数据的属性、特征进行分类、标示 和计算,称为统计计量或统计量度。例如,对工业企业经济效益的统 计,对居民生活水平的统计,也可以说是对工业企业经济效益的计量, 对居民生活水平的计量,如此等等。由于客观事物有的比较简单,有的比 较复杂,有的特征和属性是可见的(如人的外貌体征),有的则是不可见的 (如人的偏好和信仰,有的表现为数量差异,有的表现为品质差异。因此, 统计计量也就有定性计量和定量计量的区别,并且可分不同的层次。美国 社会学家、统计学家史蒂文斯( S.S. Stevens)1968年按照变量的性质和数 学运算的功能特点,将统计计量划分为四个层次或四种计量尺度。 定类尺度 将数字作为现象总体中不同类别或不同组别的代码,这是最低层
第 2 章 统计调查 2.1 数据的计量与类型 【学习目标】 本章主要介绍了数据的计量与类型;数据调查的基本形式和收集 数据的具体技术;问卷设计的原则、程序、问题的形式、设计调查问 卷的技巧、问卷结构以及注意事项;次级数据信息的搜集的来源及特 点等。 【基本要求】 学习本章内容,要求学习者掌握数据的计量与类型,重点掌握是 据调查的基本形式:普查、抽样调查、统计报表、重点调查和典型调 查,几个字的特点;掌握数据的具体技术。理解问卷设计的原则、程 序以及设计调查问卷的技巧、问卷的结构等;了解次级数据的收集来 源和特点。 【本章内容】 2.1.1、数据的计量 统计研究客观事物的数量方面,离不开统计数据,统计数据是对 客观现象进行计量的结果。对统计数据的属性、特征进行分类、标示 和计算,称为统计计量或统计量度。例如,对工业企业经济效益的统 计,对居民生活水平的统计,也可以说是对工业企业经济效益的计量, 对居民生活水平的计量,如此等等。由于客观事物有的比较简单,有的比 较复杂,有的特征和属性是可见的(如人的外貌体征),有的则是不可见的 (如人的偏好和信仰),有的表现为数量差异,有的表现为品质差异。因此, 统计计量也就有定性计量和定量计量的区别,并且可分不同的层次。美国 社会学家、统计学家史蒂文斯(S.S.Stevens)1968 年按照变量的性质和数 学运算的功能特点,将统计计量划分为四个层次或四种计量尺度。 1. 定类尺度 将数字作为现象总体中不同类别或不同组别的代码,这是最低层
次的尺度。在这种情况下,不同的数字仅表示不同类(组)别的品质 差别,而不表示它们之间量的顺序或量的大小。这种尺度的主要数学 特征是“=”或“≠”。例如将国民经济按其经济类型,可以分为国 有经济、集体经济、私营经济、个体经济等类,并用(01)代码表示 国有经济,(02)表示集体经济,(03)表示私营经济,(04)表示个体 经济。并且用(011)代表国有经济中的国有企业,(012)代表国有联 营企业:用(021)表示集体经济中集体企业,(022)表示集体联营企 业;用(031)表示私营经济中的私营独资企业,(032)表示私人合伙 企业,(033)表示私营有限责任公司:用(041)表示个体经济中的个 体工商户,(042)表示个人合伙等等。其中两位代码表示经济大类 而三位代码则表示各类中的构成。不同代码反映同一水平的各类(组) 别,并不反映其大小顺序。各类中虽然可以计算它的单位数,但不能 反映第一类的一个单位可以相当于第二类的几个单位等等。 定序尺度 定序尺度不但可以用数表示量的不同类(组)别,而且也反映量 的大小顺序关系,从而可以列出各单位、各类(组)的次序。这种尺 度的主要数学特征是“>”或“<”。例如对合格产品按其性能和好坏 分成优等品、一等品、合格品等等。这种尺度虽然也不能表明一个单 位一等品等于几个单位二等品,但却明确表示一等品性能高于二等品, 而二等品性能又高于三等品等等。定序尺度除了用于分类(组)外, 在变量数列分析中还可以确定中位数、四分位数、众数等指标的位置 3.定距尺度 定距尺度也称间隔尺度,是对事物类别或次序之间间距的计量, 它通常使用自然或度量衡单位作为计量尺度。定距尺度是比定序尺度 高一层次的计量尺度。它不仅能将事物区分为不同类型并进行排序, 而且可以准确地指出类别之间的差距是多少。例如,学生某门课程的 考分,可以从高到低分类排序,形成90分、80分、70分,直到零分 的序列。它们不仅有明确的高低之分,而且可以计算差距,90分比80 分高10分,比70分高20分等等。定距尺度的计量结果表现为数值, 可以进行加或减的运算,但却不能进行乘或除的运算,其原因是在等 级序列中没有固定的、有确定意义的“零”位。例如,学生甲得分90 分,学生乙得0分,可以说甲比乙多得90分,却不能说甲的成绩是乙 的90倍或无穷大。因为“0”分在这里不是一个绝对的标准,并不意 味着乙学生毫无知识。恰如我们不能说40℃比20℃暖和2倍一样。没
次的尺度。在这种情况下,不同的数字仅表示不同类(组)别的品质 差别,而不表示它们之间量的顺序或量的大小。这种尺度的主要数学 特征是“=”或 “≠”。例如将国民经济按其经济类型,可以分为国 有经济、集体经济、私营经济、个体经济等类,并用(01)代码表示 国有经济,(02)表示集体经济,(03)表示私营经济,(04)表示个体 经济。并且用(011)代表国有经济中的国有企业,(012)代表国有联 营企业;用(021)表示集体经济中集体企业,(022)表示集体联营企 业;用(031)表示私营经济中的私营独资企业,(032)表示私人合伙 企业,(033)表示私营有限责任公司;用(041)表示个体经济中的个 体工商户,(042)表示个人合伙等等。其中两位代码表示经济大类, 而三位代码则表示各类中的构成。不同代码反映同一水平的各类(组) 别,并不反映其大小顺序。各类中虽然可以计算它的单位数,但不能 反映第一类的一个单位可以相当于第二类的几个单位等等。 2. 定序尺度 定序尺度不但可以用数表示量的不同类(组)别,而且也反映量 的大小顺序关系,从而可以列出各单位、各类(组)的次序。这种尺 度的主要数学特征是“>”或“<”。例如对合格产品按其性能和好坏, 分成优等品、一等品、合格品等等。这种尺度虽然也不能表明一个单 位一等品等于几个单位二等品,但却明确表示一等品性能高于二等品, 而二等品性能又高于三等品等等。定序尺度除了用于分类(组)外, 在变量数列分析中还可以确定中位数、四分位数、众数等指标的位置。 3. 定距尺度 定距尺度也称间隔尺度,是对事物类别或次序之间间距的计量, 它通常使用自然或度量衡单位作为计量尺度。定距尺度是比定序尺度 高一层次的计量尺度。它不仅能将事物区分为不同类型并进行排序, 而且可以准确地指出类别之间的差距是多少。例如,学生某门课程的 考分,可以从高到低分类排序,形成 90 分、80 分、70 分,直到零分 的序列。它们不仅有明确的高低之分,而且可以计算差距,90 分比 80 分高 10 分,比 70 分高 20 分等等。定距尺度的计量结果表现为数值, 可以进行加或减的运算,但却不能进行乘或除的运算,其原因是在等 级序列中没有固定的、有确定意义的“零”位。例如,学生甲得分 90 分,学生乙得0分,可以说甲比乙多得 90 分,却不能说甲的成绩是乙 的 90 倍或无穷大。因为“0”分在这里不是一个绝对的标准,并不意 味着乙学生毫无知识。恰如我们不能说 40℃比 20℃暖和 2 倍一样。没
有确定的标准的“零”位,但有基本的确定的测量单位,如学生成绩 的测量单位是1分,质量价差的测量单位量1元,温度的测量单位是1℃ 等等,这是定距尺度的显著特点。 4.定比尺度 定比尺度是在定距尺度的基础上,确定可以作为比较的基数,将 两种相关的数加以对比,而形成新的相对数,用以反映现象的构成、 比重、速度、密度等数量关系。由于它是在比较基数上形成的尺度, 所以能够显示更加深刻的意义。定比尺度的主要数学特征是“÷”或 “×”。例如将某地区人口数和土地面积对比计算人口密度指标,说明 人口相对的密集程度。甲地区人口可能比乙地区多,但甲地区的土地 更广阔,用人口密度指标就可以说明相对说来甲地区人口不是多了, 而是少了。又如将一个国家(地区)的国内生产总值与该国(地区) 居民对比。计算人均国内生产总值,可以反映国家(地区)的综合经 济能力。1998年我国国内生产总值约占世界生产总值的12%,排列世 界第七位,堪称世界经济大国,但我国人口占世界总人口的21.2%,如 果按人均国内生产总值计算,在世界各国中又居于比较落后的位次, 说明我国仍属于发展中国家。 上述四种计量尺度对事物的计量层次是由低级到高级、由粗略到 精确逐步递进的。高层次的计量尺度具有低层次计量尺度的全部特性, 但不能反过来。显然,我们可以很容易地将高层次计量尺度的测量结 果转化为低层次计量尺度的测量结果,比如将考试成绩的百分制转化 为五等级分制。在统计分析中,一般要求测量的层次越高越好,因为 高层次的计量尺度包含更多的数学特性,所运用的统计分析方法越多 分析时也就越方便,因此应尽可能使用高层次的计量尺度。 2.12数据的类型 统计数据是采用某种计量尺度对事物进行计量的结果,采用不同 的计量尺度会得到不同类型的统计数据。从上述四种计量尺度计量的 结果来看,可以将统计数据分为以下四种类型: 定类数据一一表现为类别,但不区分顺序,是由定类尺度计量形 成的。 定序数据一一表现为类别,但有顺序,是由定序尺度计量形成的 定距数据—一表现为数值,可进行加、减运算,是由定距尺度计 量形成的。 定比数据—一表现为数值,可进行加、减、乘、除运算,是由定
有确定的标准的“零”位,但有基本的确定的测量单位,如学生成绩 的测量单位是 1 分,质量价差的测量单位量1 元,温度的测量单位是 1℃ 等等,这是定距尺度的显著特点。 4. 定比尺度 定比尺度是在定距尺度的基础上,确定可以作为比较的基数,将 两种相关的数加以对比,而形成新的相对数,用以反映现象的构成、 比重、速度、密度等数量关系。由于它是在比较基数上形成的尺度, 所以能够显示更加深刻的意义。定比尺度的主要数学特征是“÷”或 “×”。例如将某地区人口数和土地面积对比计算人口密度指标,说明 人口相对的密集程度。甲地区人口可能比乙地区多,但甲地区的土地 更广阔,用人口密度指标就可以说明相对说来甲地区人口不是多了, 而是少了。又如将一个国家(地区)的国内生产总值与该国(地区) 居民对比。计算人均国内生产总值,可以反映国家(地区)的综合经 济能力。1998 年我国国内生产总值约占世界生产总值的 12%,排列世 界第七位,堪称世界经济大国,但我国人口占世界总人口的 21.2%,如 果按人均国内生产总值计算,在世界各国中又居于比较落后的位次, 说明我国仍属于发展中国家。 上述四种计量尺度对事物的计量层次是由低级到高级、由粗略到 精确逐步递进的。高层次的计量尺度具有低层次计量尺度的全部特性, 但不能反过来。显然,我们可以很容易地将高层次计量尺度的测量结 果转化为低层次计量尺度的测量结果,比如将考试成绩的百分制转化 为五等级分制。在统计分析中,一般要求测量的层次越高越好,因为 高层次的计量尺度包含更多的数学特性,所运用的统计分析方法越多, 分析时也就越方便,因此应尽可能使用高层次的计量尺度。 2.1.2 数据的类型 统计数据是采用某种计量尺度对事物进行计量的结果,采用不同 的计量尺度会得到不同类型的统计数据。从上述四种计量尺度计量的 结果来看,可以将统计数据分为以下四种类型: 定类数据——表现为类别,但不区分顺序,是由定类尺度计量形 成的。 定序数据——表现为类别,但有顺序,是由定序尺度计量形成的。 定距数据——表现为数值,可进行加、减运算,是由定距尺度计 量形成的。 定比数据——表现为数值,可进行加、减、乘、除运算,是由定
比尺度计量形成的。 前两类数据说明的是事物的品质特征,不能用数据表示,其结果 均表现为类别,也称为定性数据或品质数据( Qualitative data):后两类 数据说明的是现象的数量特征,能够用数值来表现,因此也称为定量 数据或数量数据( Quantitative data)。由于定距尺度和定比尺度属于同 测度层次,所以可以把后两种数据看作是同一类数据,统称为定量 数据或数值型数据。 区分测量的层次和数据的类型是十分重要的,因为对不同类型的 数据将采用不同的统计方法来处理和分析。比如,对定类数据,通常 计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析 和x2检验等;对定序数据,可以计算其中位数和四分位差,计算等级 相关系数等非参数分析:对定距或定比数据还可以用更多的统计方法 进行处理,如计算各种统计量、进行参数估计和检验等。我们所处理 的大多为数量数据 这里需要特别指出的是,适用于低层次测量数据的统计方法,也 适用于较高层次的测量数据,因为后者具有前者的数学特性。比如: 在描述数据的集中趋势时,对定类数据通常是计算众数,对定序数据 通常是计算中位数,但对定距和定比数据同样也可以计算众数和中位 数。反之,适用于高层次测量数据的统计方法,则不能用于较低层次 的测量数据,因为低层次数据不具有高层次测量数据的数学特性。比 如,对于定距和定比数据可以计算平均数,但对于定类数据和定序数 据则不能计算平均数。理解这一点,对于选择统计分析方法是十分有 用的 2.2原始数据的搜集 在对实际问题的研究中,往往需要利用统计数据,那么应从哪里 获得必要的统计数据呢?从统计数据本身的来源看,统计数据最初都是 来源于直接的调查或试验。但从使用者的角度看,统计数据主要来源 于两种渠道:一是来源于直接的调查和科学试验,对使用者来说,这 是统计数据的直接来源,称为第一手或直接的统计数据:二是来源于 别人调查或试验的数据,对使用者来说,这是统计数据的间接来源 称为第二手或间接的统计数据。本节从使用者的角度讲述统计数据的 搜集方法
比尺度计量形成的。 前两类数据说明的是事物的品质特征,不能用数据表示,其结果 均表现为类别,也称为定性数据或品质数据(Oualitative data);后两类 数据说明的是现象的数量特征,能够用数值来表现,因此也称为定量 数据或数量数据(Quantitative data)。由于定距尺度和定比尺度属于同 一测度层次,所以可以把后两种数据看作是同一类数据,统称为定量 数据或数值型数据。 区分测量的层次和数据的类型是十分重要的,因为对不同类型的 数据将采用不同的统计方法来处理和分析。比如,对定类数据,通常 计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析 和 x 2 检验等;对定序数据,可以计算其中位数和四分位差,计算等级 相关系数等非参数分析;对定距或定比数据还可以用更多的统计方法 进行处理,如计算各种统计量、进行参数估计和检验等。我们所处理 的大多为数量数据。 这里需要特别指出的是,适用于低层次测量数据的统计方法,也 适用于较高层次的测量数据,因为后者具有前者的数学特性。比如: 在描述数据的集中趋势时,对定类数据通常是计算众数,对定序数据 通常是计算中位数,但对定距和定比数据同样也可以计算众数和中位 数。反之,适用于高层次测量数据的统计方法,则不能用于较低层次 的测量数据,因为低层次数据不具有高层次测量数据的数学特性。比 如,对于定距和定比数据可以计算平均数,但对于定类数据和定序数 据则不能计算平均数。理解这一点,对于选择统计分析方法是十分有 用的。 2.2 原始数据的搜集 在对实际问题的研究中,往往需要利用统计数据,那么应从哪里 获得必要的统计数据呢?从统计数据本身的来源看,统计数据最初都是 来源于直接的调查或试验。但从使用者的角度看,统计数据主要来源 于两种渠道:一是来源于直接的调查和科学试验,对使用者来说,这 是统计数据的直接来源,称为第一手或直接的统计数据;二是来源于 别人调查或试验的数据,对使用者来说,这是统计数据的间接来源, 称为第二手或间接的统计数据。本节从使用者的角度讲述统计数据的 搜集方法
2.2.1数据调查的组织形式 普查 (1)普查的概念 普查是为了某种特定的目的而专门组织的一次性的全面调查,用 以搜集重要国情国力和资源状况的全面资料,为政府制定规划、方针 政策提供依据,如人口普査、科技人员普査、工业普査、物资库存普 查等。普查多半是在全国范围内进行的,而且所要搜集的是经常的、 定期的统计报表所不能提供的更为详细的资料,特别是诸如人口、物 资等时点的数据。 (2)普查的方式 普查的组织方式一般有两种:一种是建立专门的普查机构,配备 大量的普查人员,对调查单位进行直接的登记,如人口普查等;另 种是利用调査单位的原始记录和核算资料,颁发调查表,由登记单位 填报,如物资库存普査等。这种方式比第一种简便,适用于内容比较 单一、涉及范围较小的情况,特别是为了满足某种紧迫需要而进行的 “快速普查”,就可以采用这种方式,它由登记单位将填报的表格越过 中间一些环节直接报送到最高一级机构集中汇总。例如:我国采取第 种方式普查的有:1953年第一次全国人口普查,1995年私营商业及 饮食业普查,1964年第二次全国科技售货员普查,1977年全民所有制 单位实际用工人数普查,1978年全国科技人员普查,1982年第三次全 国人口普查,1990年全国第四次人口普查,2000年第五次人口普查等, 采取上述第二种方式普查的有:1954年黑色金属、有色金属和木材库 存普查,1954年以后所进行的多次物资库存普查,1985年第二次全国 工业普查等。 (3)普查特点 普查作为一种特殊的数据搜集方式,具有以下几个特点: ①普査通常是一次性的或周期性的。由于普查涉及面广、调查单 位多,需要耗费大量的人力、物力和财力,通常需要间隔较长的时间 般每隔10年进行一次。如我国的人口普查从1953年至2000年共进 行了五次。今后,我国的普查将规范化、制度化,即每逢末尾数字为 “0”的年份进行人口普查,每逢“3”的年份进行第三产业普查,每 逢“5”的年份进行工业普查,每逢“7”的年份进行农业普查,每逢 “1”或“6”的年份进行统计基本单位普查 ②规定统一的标准时点。标准时点是指对被调查对象登记时所依 据的统一时点。调查资料必须反映调查对象的这一时点上的状况,以
2.2.1 数据调查的组织形式 1. 普查 (1)普查的概念 普查是为了某种特定的目的而专门组织的一次性的全面调查,用 以搜集重要国情国力和资源状况的全面资料,为政府制定规划、方针 政策提供依据,如人口普查、科技人员普查、工业普查、物资库存普 查等。普查多半是在全国范围内进行的,而且所要搜集的是经常的、 定期的统计报表所不能提供的更为详细的资料,特别是诸如人口、物 资等时点的数据。 (2)普查的方式 普查的组织方式一般有两种:一种是建立专门的普查机构,配备 大量的普查人员,对调查单位进行直接的登记,如人口普查等;另一 种是利用调查单位的原始记录和核算资料,颁发调查表,由登记单位 填报,如物资库存普查等。这种方式比第一种简便,适用于内容比较 单一、涉及范围较小的情况,特别是为了满足某种紧迫需要而进行的 “快速普查”,就可以采用这种方式,它由登记单位将填报的表格越过 中间一些环节直接报送到最高一级机构集中汇总。例如:我国采取第 一种方式普查的有:1953 年第一次全国人口普查,1995 年私营商业及 饮食业普查,1964 年第二次全国科技售货员普查,1977 年全民所有制 单位实际用工人数普查,1978 年全国科技人员普查,1982 年第三次全 国人口普查,1990 年全国第四次人口普查,2000 年第五次人口普查等, 采取上述第二种方式普查的有:1954 年黑色金属、有色金属和木材库 存普查,1954 年以后所进行的多次物资库存普查,1985 年第二次全国 工业普查等。 (3)普查特点 普查作为一种特殊的数据搜集方式,具有以下几个特点: ①普查通常是一次性的或周期性的。由于普查涉及面广、调查单 位多,需要耗费大量的人力、物力和财力,通常需要间隔较长的时间, 一般每隔 10 年进行一次。如我国的人口普查从 1953 年至 2000 年共进 行了五次。今后,我国的普查将规范化、制度化,即每逢末尾数字为 “0”的年份进行人口普查,每逢“3”的年份进行第三产业普查,每 逢“5”的年份进行工业普查,每逢“7”的年份进行农业普查,每逢 “1”或“6”的年份进行统计基本单位普查。 ②规定统一的标准时点。标准时点是指对被调查对象登记时所依 据的统一时点。调查资料必须反映调查对象的这一时点上的状况,以