截面DID如何构造相关论文与代码实现
最近听了导师的课,恰逢看了之前积累的截面DID论文,对截面DID有一个新的认识,记录记录。先总结如何构建截面DID,再搭配论文具体分解这个方法,最后附上相关的代码语句。
1.构建截面DID的思路:有时候我们只有截面数据,但是又想解决内生性问题,有可能构造两个维度的差分,这时候用截面DID是一个不错的选择。
为了说明如何构造两个层面,先放上DID的原理
2.结合文献来探讨如何构造截面DID
例一:金融研究中《回不去的家乡? ———教育公共品供给与人口回流的实证研究》
在这篇论文中,我们可以看出,以是否有适龄儿童来区分处理组和控制组(即模拟DID中是否受到政策影响,有儿童自然会受到撤点并校的影响,反之则没有),以撤点并校强度来模拟政策实施前后的影响(即DID中的政策实施前后)
例二:以周黎安的《The Long-Term Health and Economic Consequences of the 1959-1961 Famine in China》这篇论文为例,看到这篇论文感觉就是惊艳!构造好神奇啊,怎么这么有意思。因为选取的对象是幸存者,这肯定存在幸存者偏差,作者怎么解决这个问题的,就是神奇的DID!
本文原话是:A major innovation of this paper is to combine the variations of famine
effects across regions and cohorts to construct a difference-in-difference (DID) estimator.
在这个模型中,以年龄来区分控制组和处理组(即是否遭受饥荒经历的经历),地区的差异来模拟是否有受到政策的影响(有些地区受饥荒经历的影响,有些地区不受饥荒经历的影响);文章选取的是农村样本,以控制人口的流动所带来的影响,本文运用DID很好识别出饥荒对哪一阶段的儿童影响最大。
3.语句部分:
reghdfe yedu c.sdy_density#c.treat male han_ethn if rural==1, absorb(region1990 prov#year_birth c.primary_base#year_birth c.junior_base#year_birth) cluster(region1990)
由于语句还没有很好学习,下次学习PSM+DID时候,一起附上。
一千个人就有一千个哈姆雷特,从论文中得出什么内容和想法还是因人而异,想学习的可以学学以下的这几篇论文,还有相关的链接。
论文:
1.《The Long-Term Health and Economic Consequences of the 1959-1961 Famine in China》;
2.《Duflo,2001_Disease and Gender Gaps in Human Capital Investment:Evidence from Niger’s 1986 Meningitis Epidemic》;
3.《Early-life Deprivation and Health Outcomes in Adulthood: Evidence from Childhood Hunger Episodes of Middle-aged and Elderly Chinese》。
学习链接:
1.https://mp.weixin.qq.com/s/MHj66qhCaTeNJ8f_YrYZEQ
2.https://mp.weixin.qq.com/s/znzJqq72BMQyTG7LaEFkgA
weixin_57507286: 这样要怎么体现对照组和处理组的选择呀
不一样的邓先生: 110是什么数字啊?2018年是数据中的什么年份呢?
2301_80326228: 我也是加上时间就不显著,请问你是怎么解决的啊
lunanzhu: 取对数后还是不行,您好,pergdp是什么意思呢?我这边显示没有
ZUELer2022: 啊啊啊你是我的神!