大侦探的推理神器:断点回归

大侦探经济学  作者:李井奎

人类社会的行为常常受到一些规则的约束。

比如,假定我们国家高考理科重点线定在了580分,那么考了579分的同学虽然只是运气差了那么一点,但却无缘考上重点高校。

如果我们想知道,在中国一个人上一所重点本科院校和上一所普通本科院校,毕业十年后在收入上会相差多少,那么我们就可以使用高考分数线这个断点来进行相关研究。

首先,我们能不能直接把上过重点本科院校的学生毕业十年后的收入,与只上过普通本科院校的学生毕业十年后的收入进行比较,把前者的平均收入减去后者的平均收入所得到的差额,就看成是上重点大学的更高回报呢?

答案是不能。

因为你不是在拿同样的学生在进行比较。毕竟高于580分的同学很多,差别相当大;而低于580分却又能上一个普通本科的同学也很多,跨度也很大。比如,一个考了700分的同学,本身不仅天资聪颖,个人能力出众,而且还可能出身于书香门第,他在本科毕业十年后的收入很高的原因或许就是他个人能力出众,且家庭人脉更广所致。但一个刚刚达到高考本科线,勉强进入本地一所大学的学生,在个人能力上可能就比那个考了700分的同学差不少,也许家庭环境也会差一些。可是,个人能力、家庭人脉这些因素,我们都很难观察到,属于遗漏变量,关于它们的数据很难收集到。如果把这样的两组人的平均收入进行比较,我们就很难判断上重点大学所带来的收入增加值到底是多少,因为重点大学起到的作用和个人能力以及家庭人脉起到的作用混杂在一起了。

那我们该怎么把上重点大学这个因素与个人能力以及家庭人脉等因素分离开呢?

最好的办法是把所有能考上高考本科线的学生通过抽签的方式分为两组,一组让他们上重点大学,一组让他们上普通本科院校,然后统计他们各自在毕业十年后的平均收入,二者相减所得的差额,就是重点大学带来的收入增加值。这当然是最能给出因果效应的方法。但是,它的问题显而易见:这样的实验在现实中是不可能的,也通不过伦理审查。

那我们是不是就没有别的办法探察到这种因果效应了呢?

办法当然有。为了尽可能寻找在其他各个方面都很相似的学生,但有些上了重点大学,有些上了普通本科,我们只需要把580分附近的学生挑出来就可以了。

一般来说,高考成绩差一两分的,很可能是完全偶然的。尤其是语文和英语这类带有作文的科目,不同老师批改可能就会给出不同的分数,差上一两分也非常常见。如果两位改卷老师改出的分数差别很大,一般都会要求再找其他的改卷老师重新判给分数。所以,在580分附近的同学,应该说在个人能力上的差别很小,他们的分数差别往往是不由他们控制的运气造成的。运气好的,刚好考到580分,运气差的,刚好考到579分,就这样,他们的命运开始分岔。

假如在高考试卷的批改中,出现4分左右的运气分差别都是很正常的,那么,我们就可以把考了578分和579分,因而上了普通本科的学生分为一组,把考了580分和581分,因而上了重点大学的学生分为一组。前者叫作控制组或对照组,后者叫作处理组或实验组,这个处理就是上重点大学,用处理组学生大学毕业十年后的平均收入减去控制组学生大学毕业十年后的平均收入,得到的差额就是重点大学所带来的收入增加值。

这就是断点回归。由于在580分这个断点处,进入控制组和进入处理组的学生是非常明确的,所以这类断点,又叫清晰断点。

关于断点回归,还有一个著名的例子,就是对美国最低法定饮酒年龄的研究。[Carpenter, Christopher, Carlos Dobkin. 2009.“The Effect of Alcohol Consumption on Mortality:Regression Discontinuity Evidence from the Minimum Drinking Age.”American Economic Journal:Applied Economics, 1(1): 164-82.]

在美国,21岁生日是一个重要的里程碑,因为从这一天开始,你可以合法饮酒了。遗憾的是,21岁的生日,也可能成为死亡日期。

大侦探经济学
图2.1 生日与葬礼[引自Joshua D. Angrist and Jorn-Steffen Pischke. Mastering’Metrics. Princeton University Press,2014, 第四章图4.1。]

图2.1给出的是1997—2003年间,年龄在20岁至22岁的美国人的死亡人数。在这里,我们按照死亡时距离生日的天数绘出了死亡人数,并将生日这天标记为第0天。例如,有个人在1990年9月18日出生,在2012年9月19日死亡,那么就记这个人在22岁的第一天死亡。

在21岁生日附近,死亡风险急速上升。从这幅图中的尖峰形态可以看出死亡人数激增的事实。与平常每天死亡150人左右的基准情况相比,这个尖峰代表着死亡人数多出来大约100人。这个死亡人数可不是生日派对的狂欢造成的,因为如果是这样,这样的激增也应该出现在20岁和22岁的生日附近,但我们并没有观察到同样的情况。那么,21岁的生日一定有什么特别的地方。

我们发现,这个特别的地方就是在21岁生日,有一个法定最低饮酒年龄的规定。只要我们把这些死亡事件中与喝酒有关的案例挑出来,就可以检验法定最低年龄制度是否造成了死亡人数的上升。

2009年由克里斯托弗(Christopher)和多布金(Dobkin)发表在《美国经济期刊:应用经济学》(AEJ)上的文章《酒精消费对死亡率的影响:来自最低饮酒年龄的断点回归证据》[Carpenter, Christopher, Carlos Dobkin. 2009.“The Effect of Alcohol Consumption on Mortality:Regression Discontinuity Evidence from the Minimum Drinking Age.”American Economic Journal: Applied Economics, 1(1): 164-82.]向我们证实了这一点。

接下来,我们可以来看大侦探戴尔教授的工作了。

上一章:墨西哥... 下一章:墨西哥...
网站所有作品均由网友搜集共同更新,仅供读者预览,如果喜欢请购买正版图书!如有侵犯版权,请来信告知,本站立即予以处理。
邮箱:yuedusg@foxmail.com
Copyright@2016-2026 文学吧