跨时横截面的混合:简单面板 数据方法 Wooldridge chap.I3
跨时横截面的混合:简单面板 数据方法 Wooldridge chap. 13 1
独立混合横截面数据(pooled cross section data) 宅是在不同时点(经常但并不一定是不同年份) 从大的总体里进行随机抽样的结果。 ,由独立抽取的观测所构成。 ,和单独随机样本相比,独立混合横截面的差异在 于,在不同时点上对总体进行抽样可能导致观测 点(即观测结果)不是同分布的情形。 ,例如:随着时间的推移,工资和受教育程度的分 布都已经发生改变。 实际上,这是容易解决的问题,即在多元回归模 型中,容许截距甚至在某些情形中还容许斜率随 时间而改变。 >2
独立混合横截面数据(pooled cross section data) 它是在不同时点(经常但并不一定是不同年份) 从大的总体里进行随机抽样的结果。 由独立抽取的观测所构成。 和单独随机样本相比,独立混合横截面的差异在 于,在不同时点上对总体进行抽样可能导致观测 点(即观测结果)不是同分布的情形。 例如:随着时间的推移,工资和受教育程度的分 布都已经发生改变。 实际上,这是容易解决的问题,即在多元回归模 型中,容许截距甚至在某些情形中还容许斜率随 时间而改变。 2
面板数据(Panel data) >又称综列数据,或纵列数据(longitudinal data)。 是由数据集中每个横截面单位的一个时问序列组 成o 面枚数据有别于混合横截面数据的关键特征是: 同一横截面数据的数据单位都被跟踪(重复)一 段特定的时期。 例:在一个时点上,从某总体中随机地收集一些 人的个人工资、工作小时数、受教育程度和其他 因素的数据集,并在以后的若干个时点上,对同 样的这些人反复采访,以便得到一群人在不同年 份里的工资、工作小时数、受教育程度等数据。 3
面板数据(Panel data) 又称综列数据,或纵列数据(longitudinal data)。 是由数据集中每个横截面单位的一个时间序列组 成。 面板数据有别于混合横截面数据的关键特征是: 同一横截面数据的数据单位都被跟踪(重复)一 段特定的时期。 例:在一个时点上,从某总体中随机地收集一些 人的个人工资、工作小时数、受教育程度和其他 因素的数据集,并在以后的若干个时点上,对同 样的这些人反复采访,以便得到一群人在不同年 份里的工资、工作小时数、受教育程度等数据。 3
为什么我们要使用跨时期横截面的数据? >用于评估政策的效果 包会事前&事后 >用跨时期横截面数据有什么优势? ① 可以剔除不随时间变化的因素的影响—差分0FE ② 可以控制随时间变化的趋势—时间FE ③样本容量更大
为什么我们要使用跨时期横截面的数据? ➢ 用于评估政策的效果 包含事前 & 事后 ➢ 用跨时期横截面数据有什么优势? ① 可以剔除不随时间变化的因素的影响——差分 or FE ② 可以控制随时间变化的趋势——时间FE ③ 样本容量更大 4
一、跨时独立横截面的混合 1、利用跨时独立横载面的要求 ·利用独立混合横截面的理由是要加大样本量,把不同时 点从同一总体中抽取的多个随机样本混合起来使用,可 以获取更精密的估计量和更具功效的检验统计量。 ·只当因变量和某些自变量保持着不随时间而变化的关 时,混合才是有用的。 2、使用混合横载面带来的统计复杂性:总体在不同时 期会有不同的分布。 ①允许截距在不同时期(通常不同年份)有不同的值。 通过包含虚拟变量(比如除某一年外,每年都增加一 个虚拟变量,通常把样本中最早的一年选做基年)。 误差方差可能也随时间而变。 >5
一、跨时独立横截面的混合 1、利用跨时独立横截面的要求 • 利用独立混合横截面的理由是要加大样本量,把不同时 点从同一总体中抽取的多个随机样本混合起来使用,可 以获取更精密的估计量和更具功效的检验统计量。 • 只当因变量和某些自变量保持着不随时间而变化的关系 时,混合才是有用的。 2、使用混合横截面带来的统计复杂性:总体在不同时 期会有不同的分布。 ① 允许截距在不同时期(通常不同年份 )有不同的值。 通过包含虚拟变量(比如除某一年外 ,每年都增加一 个虚拟变量,通常把样本中最早的一年选做基年 )。 ② 误差方差可能也随时间而变。 5