[案例]《文学文摘》预测罗斯福竞选落败 在美国1936年的总统选举中,两位竞争者分别为民主党的罗斯福和共和党的兰登。一般民意测验认为 罗斯福将获胜,但是美国著名杂志《文学文摘》宜布,根据他们对240万人的调查,兰登将获得57%的选票。 最后的投票结果是,罗斯福赢得2770万张选票,而兰登只得到1600万张选票,罗斯福以绝对优势胜出。 为什么《文学文摘》调查的样本量如此之大,结果却那样离谱? 1.样本抽选有偏。兰登的支持者主要是富裕阶层、大资产阶级,而罗斯福的支持者主要是一般工薪阶 层、中下层平民。《文学文摘》调查的对象集中在富人圈,因为《文学文摘》是通过电话簿和俱乐部进行 调查的,而在1936年,美国约有1100万户家庭拥有电话,大多是富裕家庭,俱乐部成员(如高尔夫球)则 是更富裕的阶层,他们都支持兰登。美国当时有900多万失业人口,按《文学文摘》的调查方案,这些失 业人口难以被纳入样本中,而这些人中的绝大多数都是支持罗斯福的。 11
11 [案例]《文学文摘》预测罗斯福竞选落败 在美国1936年的总统选举中,两位竞争者分别为民主党的罗斯福和共和党的兰登。一般民意测验认为 罗斯福将获胜,但是美国著名杂志《文学文摘》宣布,根据他们对240万人的调查,兰登将获得57%的选票。 最后的投票结果是,罗斯福赢得2770万张选票,而兰登只得到1600万张选票,罗斯福以绝对优势胜出。 为什么《文学文摘》调查的样本量如此之大,结果却那样离谱? 1.样本抽选有偏。兰登的支持者主要是富裕阶层、大资产阶级,而罗斯福的支持者主要是一般工薪阶 层、中下层平民。《文学文摘》调查的对象集中在富人圈,因为《文学文摘》是通过电话簿和俱乐部进行 调查的,而在1936年,美国约有1100万户家庭拥有电话,大多是富裕家庭,俱乐部成员(如高尔夫球)则 是更富裕的阶层,他们都支持兰登。美国当时有900多万失业人口,按《文学文摘》的调查方案,这些失 业人口难以被纳入样本中,而这些人中的绝大多数都是支持罗斯福的
2.没有考虑缺失数据的影响。《文学文摘》在进行调查时发放了1000万份问卷, 但只回收了近240万份。例如,他们当年对1/3的芝加哥选民进行调查,却只有20%比 较富裕的阶层给予回答,而那些忙于生计的一般家庭大多数以拒绝回应。实际投票中, 在芝加哥市罗斯福以压倒性多数票胜过兰登。这说明,当回答者和无回答者有显著差 异时,忽略缺失数据进行推断一定会出错。 《文学文摘》的这次调查被称为美国历史上最失败的一次调查,作为数据收集失 败的案例,多次被写入各类调查图书。《文学文摘》最终也因此破产倒闭。 12
12 2.没有考虑缺失数据的影响。《文学文摘》在进行调查时发放了1000万份问卷, 但只回收了近240万份。例如,他们当年对1/3的芝加哥选民进行调查,却只有20%比 较富裕的阶层给予回答,而那些忙于生计的一般家庭大多数以拒绝回应。实际投票中, 在芝加哥市罗斯福以压倒性多数票胜过兰登。这说明,当回答者和无回答者有显著差 异时,忽略缺失数据进行推断一定会出错。 《文学文摘》的这次调查被称为美国历史上最失败的一次调查,作为数据收集失 败的案例,多次被写入各类调查图书。《文学文摘》最终也因此破产倒闭
非抽样误差 (1)抽样框误差 (2)回答误差 理解误差、记忆误差、有意识误差 (3)无回答误差 (4)调查员误差 (5)测量误差
非抽样误差 (1)抽样框误差 (2)回答误差 理解误差、记忆误差、有意识误差 (3)无回答误差 (4)调查员误差 (5)测量误差
(二) 随机抽样的方式 1.简单随机抽样(simple random sample) 也称为纯随机抽样,是在抽样框中的每个单位都具有相同的被抽中的机会。 例如抽签、查随机数字表 抽样框(sampling frame):通常包括所有总体单位的信息,如企业名录 (抽选企业)、学生名册(抽选学生)、住户门牌号码(抽选住户)等 适用范围:总体规模不大;总体内部差异不大。 14
14 (二)随机抽样的方式 1.简单随机抽样(simple random sample) 也称为纯随机抽样,是在抽样框中的每个单位都具有相同的被抽中的机会。 例如抽签、查随机数字表 抽样框(sampling frame):通常包括所有总体单位的信息,如企业名录 (抽选企业)、学生名册(抽选学生)、住户门牌号码(抽选住户)等 适用范围:总体规模不大;总体内部差异不大
如何使用随机数字表 4 5 6 9 0 5 8 2 7 9 9 0 4 4 7 8 9 4 0 8 S 1 3 3 9 0 5 4 2 8 0 5 4 3 2 0 7 6 > 8 8 3 3 6 3 2 9 1 3 5 7 8 3 9 0 1 3 8
如何使用随机数字表 4 5 6 7 9 0 1 1 5 8 2 7 9 5 9 0 4 4 7 8 9 4 1 0 8 0 1 3 3 4 9 1 8 0 1 0 5 4 2 8 5 0 5 6 8 4 2 4 3 9 9 7 2 0 4 9 5 1 7 6 6 1 4 6 1 5 7 8 3 8 8 7 0 3 7 4 1 6 1 7 1 2 3 2 5 3 6 3 3 3 9 3 5 8 4 3 4 3 0 2 6 2 6 7 2 8 4 7 9 3 5 7 0 2 4 3 8 3 9 1 7 3 5 7 8 3 9 0 1 3 4 8