大侦探的推理神器:工具变量回归

大侦探经济学  作者:李井奎

我们现在已经提到了意大利西西里的黑手党得以崛起并迅速发展的三个要素:土地改革、柑橘类水果的种植以及农民社会主义运动组织的兴起。问题在于,我们能否断定这三者谁才是黑手党崛起的真正原因呢?接下来,我们就来比较一下这三篇文章在这个问题上给出的答案。

首先,我们来看土地改革。正如班德拉教授自己指出的那样,在对数据进行经验分析上,班德拉教授明确认识到,她面临着遗漏变量的问题。也就是说,可能有一些变量,它们既会影响土地改革,同时也会影响黑手党的活跃程度(这是班德拉教授对黑手党崛起的度量指标),但这些因素并没有得到度量。如果是这样,我们就没有办法把班德拉教授通过简单的计量回归方法研究得到的土地改革和黑手党活跃程度之间的相关关系解释成因果关系,因为这种相关性可能是由遗漏变量造成的。要想确定二者的因果关系,就需要排除这种遗漏变量,但是很可惜,班德拉教授自己也承认,她所掌握的经验数据无法支持她做到这一点。

接下来,我们再来看柑橘类水果的种植这一因素。根据奥尔松教授等人的解释,柑橘类水果尤其是柠檬的种植需要受到保护,而黑手党的保护会促进柠檬的生产。这个因果性解释同样面临着遗漏变量的质疑,也就是说,同样可能有其他因素既影响了柠檬的种植,也影响了黑手党出现的概率,而这些因素却没有被奥尔松教授等人观察到。同时,奥尔松教授等人的这个解释还面临着另外一个质疑,那就是双向因果问题。什么是双向因果问题呢?柠檬的种植需要黑手党的保护,这是一种解释,但反过来,可不可以说,正是某个地方有了黑手党的出现,提供了国家没有提供的保护,当地人才敢种植柠檬呢?毕竟,种植柠檬需要多年的精心培育,才能最终有所收成。这两个问题都很棘手,如果不能妥善地加以解决,奥尔松等人给出的因果性解释就很可能站不住脚。正因为如此,奥尔松他们使用了一种因果推断的大杀器——工具变量。关于工具变量更多的内容和介绍,读者诸君可以参考本书终章中最后一个故事《御马监里的经济账——工具变量解纷争》,提前获得更多更有趣的了解。

为了识别出柑橘类水果的种植与黑手党出现之间的因果关系,我们能不能想出这样一个变量,它只对柑橘类水果的种植有因果性的影响,但与一个地区所有的其他因素都没有关系,而且也不会与被遗漏的那些因素产生任何关联,这样它就只能通过影响柑橘类水果的种植,从而影响黑手党的出现概率。而且,由于它只能通过影响柑橘类水果的种植而影响黑手党出现的概率,所以,黑手党的出现所提供的保护性服务反过来影响柑橘类水果种植的这条反向因果关系就可以被完美地切断。这样的变量,可以帮助我们识别出我们想要的那种因果关系,就像一个称手的工具一样,我们把它叫作工具变量。

工具变量并不好找,找到一个好的工具变量,很多时候需要运气。奥尔松等人找到的工具变量是西西里某个地区所处的“海拔高度”,他们的逻辑链条是这样的:一个地区的海拔高度会影响天气状况,而不同的天气状况会影响柑橘类水果的利润率。如果一个地区海拔比较高,种植柑橘类水果的利润率下降,那么寻求黑手党保护的意愿也就会下降。这里我们可以看到,“海拔高度”这个变量本身是不由谁选择的一个外生因素,而且,它可以通过影响柑橘类水果的利润率而影响柑橘类水果的种植,进而影响黑手党提供保护的意愿。大体来说,这满足了工具变量的基本要求。接下来,奥尔松等人使用地区“海拔高度”这个工具变量再次进行回归估计后,确实发现柑橘类水果的种植对黑手党出现的概率产生了更大的影响,这个结果也增强了我们对他们这种解释的信心。

但是,这个工具变量还是存在一些问题,用计量经济学的术语来说就是它还不够“外生”。说白了,就是它还是会影响其他的变量,而这些变量又会影响我们要解释的那个变量。在奥尔松等人的文章里,这个要解释的变量就是黑手党出现的概率。具体来说,“海拔高度”这个工具变量可能不满足我们前面提到的“它只对柑橘类水果的种植有因果性的影响,但与一个地区所有的其他因素都没有关系,而且也不会与被遗漏的那些因素产生任何关联,这样它就只能通过影响柑橘类水果的种植,从而影响黑手党的出现概率”这个条件。譬如,海拔越高的地区,往往地处深山,这里政府的力量本来就更为薄弱,更容易出现黑手党,如果是这样,这个工具变量就有问题,也就是说,地区海拔高度这个因素,本身就会影响一个地区政府力量的薄弱程度,而地方政府力量的薄弱程度又会转过来影响黑手党出现的概率。一句话,奥尔松等人对其解释所做的因果性识别并不干净,这里面混杂了政府力量的薄弱程度等其他遗漏变量的影响,所以他们估计出来的影响参数可能是不准确的。

最后,我们再来看大侦探阿西莫格鲁等人的识别方法。阿西莫格鲁等人的解释是,农民社会主义运动组织的兴起使得黑手党取得极大的发展。在赋予农民社会主义运动组织对黑手党大发展的因果性解释方面,他们同样要面临我们前面提出的两个问题:遗漏变量问题和双向因果问题。第一,可能有其他未被我们观察到的变量,它们既影响农业社会主义运动组织的兴起,也影响黑手党的发展壮大;第二,黑手党在一个地区的横行,可能更加激起了农民社会主义运动的深入发展,二者或许是双向影响、互相促进的关系。为了解决这些问题,阿西莫格鲁等人使用的也是工具变量方法,不过他们选的工具变量在识别效果上更加干净。

他们选的这个工具变量,是意大利在1893年春季发生的一场大旱灾。我先解释一下他们选这个工具变量的绝妙之处,然后再来解释他们的这个工具变量为什么在识别效果上更干净。

首先,1893年的这场旱灾对意大利的农业生产造成了严重的负面影响。大侦探们搜集到了1893年意大利24个地区20种庄稼的农业收成,在控制了不同地区的农业生产效率之后,他们先用简单的计量回归方法做出来一个结果,这个结果确证农业收成受到了1893年春季降雨量的负面影响,而且越是需要春季降雨的庄稼受到的负面影响越大。接下来,阿西莫格鲁等人再用计量回归方法来做,目的是要看看1893年春季的相对降雨量对农民社会主义运动组织发展情况的影响。这个结果非常显著:一个地区1893年的相对降雨量越低,农民社会主义运动组织就越可能在这个地区出现。然后,他们再次使用计量回归方法,也就是用第一阶段中由工具变量预测的农民社会主义运动的出现情况,来看它对黑手党发展的影响。这个回归结果表明,这个影响仍然非常显著,无论是否控制各个省份的具体特征,农民社会主义运动组织的出现都会明显使该地区的黑手党势力增强。至此,我们就可以肯定地说,农民社会主义运动组织的兴起对黑手党势力的发展具有显著的因果性影响。

其次,我们来看一看,为什么说阿西莫格鲁等人找到的“1893年春季的相对降雨量”这个工具变量要比奥尔松等人的那个“海拔高度”要好呢?原因就在于:前一个工具变量足够外生!1893年春季的这场旱灾,是一场天灾,是老天爷不高兴,而老天爷高不高兴,可不会与意大利各个地区的其他那些影响黑手党的因素相关。从这个角度看,奥尔松等人的“海拔高度”工具变量就不一样了,虽然“海拔高度”这个工具变量看起来也不能为我们左右,但它本身却会影响诸如政府治安力量分布这一类的重要变量,同时又通过这些变量来影响黑手党出现的概率,那么,这个工具变量就不够外生了。因此,奥尔松等人识别出来的因果关系就受到了其他因素的混淆,受到了污染,这个识别就不如阿西莫格鲁等人的这个工具变量设计来得干净。

工具变量的故事非常多,我们这次先讲这么一个,将来还会继续讲述它的其他具有传奇色彩的侦探故事。

上一章:黑手党... 下一章:国家能...
网站所有作品均由网友搜集共同更新,仅供读者预览,如果喜欢请购买正版图书!如有侵犯版权,请来信告知,本站立即予以处理。
邮箱:yuedusg@foxmail.com
Copyright@2016-2026 文学吧