御马监里的经济账——工具变量解纷争

大侦探经济学  作者:李井奎

话说悟空自西天取经回来之后,一直闲来无事。这一日,他突然心血来潮,想来一番故地重游,就到了天宫御马监里走了一遭。

御马监监丞听说之后,赶忙迎了出来。带悟空游览了一圈御马监、天河牧马场,还有天马饲养舍等地。时光仿佛倒流了500多年,悟空一路兴致颇高。

只见天河牧马场上,天马行空,龙马精神,真是看得悟空心中大悦。

最后,悟空和监丞来到了千里马培育基地。这个基地是悟空走后设立的,所以悟空并不熟悉。

监丞向悟空介绍道:“大圣,这是你走了之后由天宫创新突击办公室设立的。在这里培养天宫的千里马。天马若是到了凡间,当然个个都是千里马,但在这天上,若是能取得千里马之称,一天能跑出凡间的数百倍距离,当真称得上是神驹了。我们在这个千里马培育基地,这些年来已经培育了一大批千里马,成绩傲人啊!”

这时,一旁的副监丞忙过来说道:“禀大圣,之所以千里马基地能够取得这样的成绩,和我们监丞引进的一套绩效评价系统有很大的关系。因为培育千里马,不仅需要运气,还需要马倌们的精心喂养和训练,非常不容易。”

悟空一边听,一边看天河牧马场上的一匹神驹。只见它四脚腾空,如同风驰电掣,一会儿工夫就消失在云峦之巅。如此神骏,确实难得!悟空跳上了一匹正在奔跑中的千里马,一勒马缰,那马前蹄离地,一声骅骝,疾驰而出。悟空不禁大笑,连呼“痛快!”

一行人回到千里马培育基地的休息室,正要喝茶休息片刻,只听外面一片吵闹声。监丞忙问副监丞:“不知出了什么事情?”副监丞出去了解了一下情况,很快回来禀报道:“原来是最近千里马培育基地的马倌们起了一点纷争,要求重新分配千里马培育基地的小马驹。情况是这样的,最初基地成立的时候,这些马倌各自都分了一批马驹回去喂养,进行培育和训练。后来他们各自培养,那些马驹长大之后,再生育后代,生下小马驹,继续培育。这些年来,有的马倌培育出来的千里马比例更高,这样一来,他们的后代产下具有千里马潜质的小马驹的概率也会更高。这就形成了一种互相促进、互为因果的关系。也就是说,你越是精心喂养小马驹,对它们勤加训练,并且培训得法,你就越可能培育出千里马。而你越是可能培育出千里马,你的马生下的小马驹就越有可能成为未来的千里马,但所谓的更有可能,也都是在同样的马倌手里培养出来的,很难说这到底是因为马驹质量好,还是马倌培育更加精心得法所致。”

悟空问道:“那现在这些马倌在争吵些什么?”

副监丞回答:“现在,有些培育千里马不力的马倌就把责任推到他们的马驹品种不好,认为那些培育千里马成绩优良的人实际上不过是运气好而已,不是他们更努力,而是他们更有运气。所以,这些人要求重新分配小马驹。但那些培育出较多千里马的人却认为,他们的成绩好,纯粹是因为他们努力工作,更加细心地喂养和训练小马驹才得来的。他们的成绩来之不易,不能都归功在当初的马驹品种上,而且现在这品种的改善,也是他们自己努力的结果。这些人认为前面那些马倌自己不努力,现在想来夺取他们的胜利果实,自然是不肯相让。”

监丞听了,不禁犯起难来:“大圣,你看这事情,精心训练出好的千里马,可能会带来更多好的小马驹,而更多好的小马驹,又可能更容易地训练出千里马。到底马倌们精心喂养、努力训练对于培育千里马起的作用有多大呢?这里面总混杂着小马驹的质量情况,而二者又相互影响、互为因果,真是很难清楚地把它们分开呀。”

副监丞这时插嘴道:“大圣,监丞,其实小马驹的质量也要看年份,大部分年份当然没有什么特别的地方。不过,不定哪一年王母娘娘寿诞,玉帝若是心血来潮,高兴起来会普降甘露,那一年的小马驹质量都会提高,而且所有马倌的小马驹都能得到甘露,从质量上看那一年的小马驹就都很不错。”

孙大圣听到这里,不禁哈哈大笑,说道:“监丞何必忧心!你所说的这个问题,正是因果推断中的一个难点,也即所谓‘逆向因果’或‘双向因果’问题。一个变量影响另一个变量,而另一个变量也会反过来影响这个变量,彼此相互交融,互相影响,到底谁是因谁是果确实很难分清。”

监丞皱起了眉头,问道:“大圣,那这该怎么办呀?我们希望激励马倌好好养马,如果那些不好好养马的马倌编造说辞,把原因都归到马驹质量上,我们又该如何回应?事实上,我们也确实无法监督到每个马倌,看他们是否在努力培育千里马,我们只能根据结果对马倌进行表彰。”

大圣道:“解决这类双向因果问题,不是没有办法,有一种计量方法,叫‘工具变量’回归,十分巧妙,而且非常有用。当然,这工具变量方法不仅可以用来解决双向因果问题,也可以解决像遗漏变量等许多其他问题。但这种方法需要一个外生的变化,也就是说,在这里,它与影响是否能培育成千里马的其他变量没有什么关系,但它却可以单独影响小马驹的品质,从而影响到培育千里马的成功率。”

监丞听说有办法可以把小马驹的质量对千里马培育成功率的影响估计出来,不禁大为兴奋道:“大圣,既然这工具变量之法如此神奇,那赶紧把工具变量这尊大神请出来,为我们释疑解惑吧。”

悟空笑道:“哪里有什么工具变量神仙?这工具变量,找起来可是不易,需要有慧心之人细心查访,有时候可以称得上是妙手偶得之。”

监丞面有失望之意,道:“那这该如何是好?”

大圣道:“监丞不必担心,我刚才已经找到了一个可称如意的工具变量,可以助你寻找出小马驹质量提高带来的千里马培育成功率的变化,但你需要把往年这些马倌培育千里马的信息都给我找来。此外,副监丞,还要劳烦你把玉帝老儿普降甘露的年份都找来,我有妙用。”

监丞和副监丞领命而去。不多时,所有这些数据都拿到了悟空跟前。

悟空道:“现在,我们找到的这个工具变量,就是玉帝在某年是否降下了甘露。若是玉帝降下甘露,这个甘露会影响马驹的品质,而马驹的品质又会影响千里马培育的成功率。同时,玉帝是否降下甘露,全看玉帝那一年是不是心血来潮,这一因素完全随机,与其他那些使千里马培育成功或失败的因素都不相干。这样,玉帝某年是否降下甘露这个变量就满足了工具变量的两个条件:第一,与我们所关心的那个原因变量具有相关性,这就是相关性条件;在这里,这个原因变量就是小马驹的品质改善。第二,与其他那些影响被解释变量的因素无关,这就是外生性条件;在这里,这个被解释变量就是千里马培育的成功率,其他因素就是除了小马驹质量这个因素之外的其他影响千里马培育成败的因素。除此之外,我们还需要把玉帝没有降下甘露的年份中各个马倌的千里马培育成功率进行加总后平均,也把它作为控制变量加入进来,这样可以进一步保证我们估计出来的小马驹质量对千里马培育成功率因果效应的精确性。”

副监丞带领众随从依命一一做了指标的编制、数据的清理,并进行了回归。结果,他们发现:小马驹质量因玉帝普降甘露得到改善之后,千里马培育成功率确实有所增加;但是,那些在平常年份培育千里马成功率更高的马倌,因甘露而得到的成功率提高得更多,而那些平时就不大能培育出千里马的马倌,虽然培育的千里马也有所增加,但从量上看要少得多。

众人见大圣为他们解决了纷争,纷纷夸赞悟空法力高深。那些勤劳的马倌个个前来给悟空磕头道谢,感谢大圣让大家认识到他们努力的成果,表示从此将会更加勤劳地培育更多千里马。

孙大圣嘱咐大家多学科学知识,注意数据分析,尤其是在天宫进入大数据时代之后,更应该努力跟上时代,不然无论他法力如何了得,最终都会被时代抛弃。大家纷纷点头称是,与大圣挥手作别!

工具变量回归方法最早就是为了解决计量经济学中双向因果关系问题而提出来的,见于菲利普·赖特(Philip G. Wright)1928年的著作《动物油脂和植物油脂的关税》的附录B[Wright, Philip G. The Tarif on Animal and Vegetable Oils. Macmillan Company, 1928.]。这本书前面的285页,讲的都是20世纪初动植物油的生产、运输以及销售的情况。计量经济学家们独独对该书285页之后这个附录B感兴趣,因为这个附录给出了我们现在称之为工具变量估计量的“引入外部因素的方法”的两种推导,并且利用这一方法估计了黄油和亚麻油的供给和需求弹性。

了解一点经济学知识的读者可能知道,在竞争性市场中,向上倾斜的供给曲线和向下倾斜的需求曲线交叉,在交点处确定了均衡价格和均衡数量。但是,人们只能观察到市场上的均衡价格和均衡数量,却不知道怎么由这些数据得到供给曲线和需求曲线,因为这些均衡价格和均衡数量是由供给和需求共同决定的,你若想画出供给曲线,就得保持需求不变,但数据无法做到这一点。在赖特生活的年代,人们对计量经济学知识知之不多,他们发现这两个变量几乎是同时被决定的,因此感到束手无策。

在这篇附录B里,赖特运用联立方程模型对此进行了较好的阐述。它向人们解释了为什么可以用在一个方程中出现、但在另一个方程中不出现的变量来解决这个问题。他把这个未出现在另一个方程的变量叫作“外部变量”,通过移动外部因素所在的这个方程,他们可以追踪到不包含外部因素的那个方程的运动轨迹。这就是说,对后一个方程而言,这个变量是“外生”变量。我们今天把这种移动的外部因素称作“工具变量”。比如,赖特在对亚麻籽市场进行分析时,使用需求曲线的变动因素替代价格,这个需求曲线的变动因素,就是每亩产量的变化主要受天气条件影响,而天气条件就是那个工具变量。[参阅:《精通计量》,第三章“工具变量”中“计量大师:了不起的Wrights”这一小节。]

赖特这本书的附录B,非常了不起,是一个出人意想的计量思想的重大突破。但赖特只是一位默默无闻的经济学家,除了这个附录之外,几乎没有留下什么其他的思想遗产。他从哈佛大学拿到硕士学位之后,在美国伊利诺伊州盖尔斯堡一所偏僻的规模较小的隆巴德学院当了很多年老师。这所隆巴德学院甚至没能抗住大萧条的冲击,后来也很快倒闭了。但赖特的儿子斯维尔·赖特(Sewall Wright)却成长为一位杰出的人口遗传学家和统计学家。由于附录B中的数学内容与全书其他地方的风格似乎有所不同,因此很多计量经济学家认为,这篇附录有可能是菲利普的儿子斯维尔匿名所撰。

那么,这篇附录B到底是出自谁之手呢?是父亲还是儿子呢?

事实上,这对父子都可能是作者,具体到这篇附录的作者到底是谁,却是一个悬案。老赖特曾在1915年的一篇文章里说明了为什么数量对价格的回归在一般情况下并不能估计出需求曲线。在20世纪20年代初,小赖特正在研究遗传学中包含多个因果变量的多个方程式的统计分析,他之所以能在1930年到著名的芝加哥大学任教,部分原因也是因为这个研究。

但这也还是难不倒善断奇案的经济学大侦探们。

哈佛大学经济学教授、著名计量经济学家詹姆斯·斯托克(James Stock)与合作者弗朗西斯科·特来布(Francesco Trebbi)使用了所谓文风计量学(Stylometrics)[Stock, James H., and Francesco Trebbi. 2003“Who Invented Instrumental Variables Regression?”Journal of Economic Perspectives, Vol. 17, No. 3(Summer):177-94.],研究了小赖特的作者身份文体。文风计量学可以分辨出作者的词汇使用和句法结构的统计规律。从这种文风上进行分析,两位大侦探确认,老赖特才是附录B的作者。后来,这两位大侦探还通过这对父子在20世纪20年代中期的书信往来表明,工具变量的思想应该是二人一起合作的共同结晶。

至此,这一桩工具变量思想的发明权悬案终于告破。

上一章:高老庄... 下一章:后记
网站所有作品均由网友搜集共同更新,仅供读者预览,如果喜欢请购买正版图书!如有侵犯版权,请来信告知,本站立即予以处理。
邮箱:yuedusg@foxmail.com
Copyright@2016-2026 文学吧