第二十二回 赌神索普创造传奇 香农凯利协防有功

偷窥者  作者:唐朝

天生学霸

索普出生于1932年8月14日,从小就是传说中那种天才儿童的标准模样。比如3岁能数到100万;5岁能背诵历史上几十位英国国王的名字、登基和退位的准确时间;6岁能够进行任意数字的四则混合运算,能口算平方根、立方根,各种心算比旁人按计算器速度还快……

索普从小酷爱各种实验,对木工、电工、制图、无线电等技能具有浓厚的兴趣。由于家境不好,索普11岁就和巴菲特一样送报挣钱,并依赖这些收入购买各种实验材料。索普在13岁拿到联邦政府认证的无线电发报员证书,14岁成功自制炸药和强效染料。

高一时索普得知,如果在全国化学竞赛里拿到前三名,可以获得大学奖学金,于是找来化学教材自学。结果考试时因为不知道需要配备昂贵的专用计算尺,索普在竞赛时间内凭手算完成1000分里的873分题目,得分869,获全美第四,痛失奖学金。

为了挣到读大学的奖学金,索普高二参加过全加州物理竞赛,以931分(领先第二名50多分)获冠军。高三参加过西屋科学奖[西屋科学奖(West House Science Prize)被称为“美国中学生的诺贝尔奖”,由美国西屋电气服务公司于1942年创建,目的在于发现具有科技创造潜力的青年人]大赛,以一篇计算天体轨迹和玻璃棱镜折射率方法的论文,从1.6万名竞争者中脱颖而出,成为40名获奖者之一……多项优异表现,让索普有了在加州随心所欲挑选大学的权利。

本来加州理工学院是他最心仪的大学,但是该校的奖学金仅包含学费,索普没钱支付住宿费和生活费。于是他选择了提供包含学费、生活费和住宿费奖学金的加州大学。

当严谨的学术应用于赌博研究

读书期间,有次同学们聊天聊到轮盘赌的话题。大家的观点分为两派,一派认为轮盘赌纯粹是随机运动,无法预测;一派认为轮盘赌设备不可能完美,总有物理缺陷导致某些数字出现的概率会更高,从而可以利用这种概率赢钱。索普对两种观点都持认可态度,他认为如果轮盘赌是完美的,可以利用物理学知识预测小球轨迹赢钱;如果轮盘赌是不完美的,那会导致某些数字具备微弱的胜率,通过计算这个概率,也可以赢钱。

不过很可惜,索普没钱购买赌场专用的轮盘赌设备来研究,该想法暂时搁置。直到1956年的一次聚会上,已经拿下物理学硕士学位的索普,偶遇加州理工学院最负盛名的物理学家理查德·费曼[费曼是1965年诺贝尔物理学奖得主,纳米科技之父,量子计算理论奠基者,美国曼哈顿计划创立成员,美剧《曼哈顿计划》主人公查理的原型]。两人在聊天中也聊到轮盘赌,费曼说目前科学界还没有能够打败轮盘赌的方法。见全美顶级的物理学家持如此看法,索普隐藏内心的对轮盘赌的兴趣又浮上心头。

因为利用物理学知识计算轮盘里小球的落点需要大量的数学知识,索普为此恶补数学,并顺便于1958年6月拿到数学博士学位。拿到博士学位后,索普暂时担任加州大学洛杉矶分校数学系临时讲师。

当年冬天,索普携妻子到拉斯维加斯过圣诞节。之所以选择拉斯维加斯,一者因为索普此前从未参与过赌博,他想亲眼看看轮盘赌的运作;二者因为当地政府为了吸引更多赌客,已经将当地打造为一个性价比极高的旅游度假区,可以节省费用。

出发前,学校一位教授向索普推荐了一种21点的策略,是四位知名数学家刚刚发表的论文。这种策略将庄家的优势压低为0.62%,是所有赌博活动中庄家优势最小的一种。这虽然依然无法确保赢钱,却已经是最接近公平的赌博。索普打算拿10美元去试试。

结局没什么意外的。依靠一张密密麻麻写满数字的策略卡片,在超人的记忆力和严谨的心算能力帮助下,索普无视干扰、冷静分析,在15分钟时间,成功地输掉了8.5美元,离开了赌场。

回家后,索普的注意力就从轮盘赌转移了。因为21点不需要购买什么昂贵的设备,只需要思考和计算就可以了,更适合数学家,尤其是贫穷的数学家做研究。虽然学界普遍认为战胜赌场的策略是不存在的,但索普经过深刻的思考后,发现一种理论上的可能性。

理论上说,每张牌出现的概率一样,这种情况下赌场拥有0.62%的胜率优势,但随着一张张扑克牌暴露在赌桌上,剩余的牌出现的概率会发生改变。举个简化的例子,如果发了20张牌,其中出现四张5,那么剩下的牌堆里再出现5的概率就不会是4/32,而是0。由于玩家掌握是否下注和下注多少的主动权,因此存在一种可能,就是玩家只在剩余扑克会导致自己赢面高于50%时下注,并在赢面大时下较大的注,似乎就有了战胜庄家的可能。

索普写信给在21点上已经有深入研究的那四位数学家。经过交流和讨论,索普得到了四位数学家数千页的原始实验手稿。伴随索普继续研究,他发现整套策略要面对庄家10种手牌和玩家55种手牌的组合。这550种组合下,每副牌有3000多万种变化,全套策略靠人工计算需要大约4亿年。

幸运的是,1959年索普申请到麻省理工学院两年的讲师合同,而麻省理工拥有一台IBM公司1957年4月推出的IBM 704大型计算机,运算速度为每秒4万次。有了704的帮助,索普终于在1960年夏天完成测试,证实了自己的猜想。

院士助力,赌博研究更上一层楼

他计划向《美国国家科学院院刊》提交论文。但向这份具有学术影响力的杂志投稿,需要一位院士的推荐才行。于是索普求见麻省理工学院唯一一名国家科学院院士——信息论的创立者、数字计算机和数字电路设计理论的奠基人、伟大的数学家和密码学家、麻省理工终身教授克劳德·香农[克劳德·香农(1916年4月30日—2001年2月24日)取得的成就,被认为是“自文艺复兴以来无人企及”。他独立开创了一门重要的新科学:信息论。信息论是计算机、互联网和其他一切数字媒体的理论依据。简单地说,我们今天能用上电脑、手机,能上网、听音乐、看电影,就依赖于香农建立的二进制数字在电路里的表达方式]。

香农的秘书给索普安排了几分钟会面时间,但索普的介绍迅速吸引了香农的注意。几分钟的会面变成长达数小时的沟通,最终香农同意推荐索普的论文。不仅如此,香农这个老小孩,后来还和索普一起下功夫研究轮盘赌,一起去赌场实践。为了提升参与轮盘赌的胜率,香农和索普共同发明了人类最早的数字可穿戴智能设备。

香农对索普最大的帮助,除了作为论文推荐者,还在于帮助索普解决了不同胜率情况下赌注分配的问题。他给索普介绍了同事凯利的研究成果:凯利公式(也称“凯利准则”)。他们之间的对话大概是这样的。

索普:“香农,我还有一个问题没解决,如何确定每一副牌下注多少,才能既保证最大化地赢钱,又能防止因连续很多次运气不好而赔光所有的筹码呢?”

香农:“这个问题,你去看一篇贝尔实验室约翰·凯利1956年的一篇论文就知道了。”

凯利公式

约翰·凯利(1923—1965年)是物理学博士。他和香农同在著名的贝尔实验室任职。他那篇论文题目原本叫作《信息理论与赌博》,1956年发表,发表时考虑公众影响改名为《信息率的一种新解释》。公式起源于凯利对信息噪音的研究,同属于香农的信息论理论范畴。具体理论深奥,与咱们投资领域无关,老唐举个简单的例子来帮助读者理解信息噪音。

信息的传递是有噪音的,比如你收到一条信息,内容是“索普没有偷你的钱”。这句话要传达的真实信息,可能是以下任何一种:

①索普没有偷你的“钱”——他偷的是你的手表。

②索普没有偷“你”的钱——他偷的是老唐的钱。

③索普没有“偷”你的钱——他只是拿走了属于他的那部分。

④索普“没有”偷你的钱——所以你的钱还在原处。

⑤“索普”没有偷你的钱——是其他人偷的。

……

凯利由此联想到一个数学命题:假设在赌场、赛马场或者股市,有个内线经常给你传递内幕消息。但一者由于内幕消息不能保证100%正确,二者在消息传递过程中或许会因噪音发生误解(就像巴鲁克那位买入联合煤气的美女亲戚),那么,赌徒收到内幕消息后,应该如何下注,才能既保证最大化地赢钱,又能防止因连续多次运气不好而输光赌本呢?

在香农教授长途电话噪音问题的研究基础上,凯利最终推导出著名的凯利公式。公式为:f=(bp-q)/b。其中,f就是需要计算的最优下注比例,b为赔率,p为胜率,q为败率=1-p。在这个公式指导下,一个胜率51%,赔率为1∶1的赌局,每次下注比例为(1×51%-49%)/1=2%。

举个简化的错误定价游戏。一个公平的抛硬币游戏,正反面出现的概率均为50%,即p=50%,q=1-p=50%。如果此时有个赌局,开出的赔率为2∶1,即正面朝上你赢2元(含本金拿回3元),反面朝上你输1元,b=2。

很显然,参与这个游戏具备显著的胜率优势,但是赌徒每次应该拿多少钱下注呢?凯利公式的答案是每次拿出全部资金的25%下注,可以在保证永远不会出局的前提下,获得最大化盈利。计算过程:f=(bp-q)/b=(2×50%-50%)/2=25%。

索普的研究成果,解决了如何取得相对于庄家的胜率优势,而凯利公式则解决了在不同优势胜率下的最优下注比例问题。通过凯利公式我们可以发现,有些赌局一分钱都不应该投。比如b≤0的,公式无法计算。什么是b≤0呢?简单一点说,就是正面他赢,反面你输的游戏。赌桌上不会有这种游戏,但证券市场很常见,而且参与者众。

再比如同样是抛硬币,胜率还是50%,如果赌局开的赔率是0.9∶1,即正面朝上拿回1.9元,反面朝上输1元。根据凯利公式计算结果,下注比例f=(0.9×50%-50%)÷0.9×100%=-5.56%,f小于零,不参与。

相反,如果胜率100%的游戏,赔率只要大于零,无论多小,都应该下注所有资金。因为f=(b×100%-0)÷b×100%=100%。

理论结合实践:战绩不俗成“赌神”

索普就有个经典的、下注所有资金的知名案例,该案例创造了纽约交易所有史以来(截至1981年)最大单笔成交纪录。有趣的是,该案例的投资手法,和格雷厄姆套利G公司一模一样。

1981年美国政府认定AT&T公司形成垄断,公司被要求将下属7个子公司分拆出去。AT&T公司股东将获得对应比例的7家下属子公司的股票以及一家“新AT&T公司”股票。在分拆实施过程中,新老AT&T以及下属7家子公司的股票均在市场有交易。

索普和年轻的格雷厄姆一样,发现老公司股价低于对应的8家新公司股价之和,价差很小,除去交易成本后利润微薄。当时索普管理的普林斯顿-新港公司资金总额约6000万美元。鉴于这场交易获利确定性为100%,索普借入3.3亿美元,买进老AT&T公司股票500万股,同时等量卖空8家新公司股票。分拆后的新股到账,归还卖空股票,差额为净利润。索普支付80万美元的利息之后,净赚160万美元。

获利概率100%,按照凯利公式应该押上所有的钱。这种案例早在这笔“有史以来规模最大”的投资引起媒体注意之前,索普其实已经演练过很多回了。比如1974年,他就做过一笔更加精彩的套利,只是那时资金还比较少,没有1981年这笔动人心魄罢了。

当时,美国汽车公司(AMC)的可转债在市场流通,债券面值1000美元,票面利率是5%,每张可转债可以随时申请转换为100股公司股票,到期日是1988年。

在1973年爆发的全球性股灾后,AMC股价一路下跌到6美元,此时可转债市价跟随下跌至600美元。索普发现了这个荒谬的市场定价,立刻押上全部资金并使用了杠杆。他购买AMC可转债,并抛空等量的AMC股票,即每买入一张面值1000元、市价600元的可转债,对应抛空100股股票。这是一个100%确定获利的交易。

由于持有一张可转债,可以享受面值5%的年利息,对于花600元买下的索普而言,年回报率是50÷600×100%=8.33%。同时,只要公司不破产,最长持有到1988年,还能确保收回额外的400美元差额。由于债券随时可以申请转换成100股股票,所以一张可转债很明显比100股股票更有价值。索普买入可转债并卖空股票后,只需等市场发现这一点,导致债券价格涨幅大于股价涨幅时,卖出债券同时平仓股票空单,即可兑现利润。

如果这家公司最终破产,债券股票双双下跌呢?索普会赚得更多。因为公司一旦破产清算,拍卖资产的收入将优先分配给债券持有者。AMC股票将变得一文不值,而债券持有者除了获得持有期间的利息,还可以获得清算收入。对于持有债券同时卖空股票的人,破产带来的获利空间更大。

即便是最糟糕的情况:价格原地不动,或债券与股票价格比始终保持1∶1,索普仍然能够获得可观的收益。600美元买入可转债,年收入50美元利息,回报率8.33%。索普以8%的利率借钱购买债券,年回报率0.33%。同时,索普可以将卖空AMC股票收到的现金,以6%的利率出借。这样,即使最糟糕的情况出现,索普每年仍能保证赚到6.33%——这还是由于条件所限,索普出借资金利率低于借入资金利率的情况下。

经过索普几本畅销书的科普,加上索普基金的辉煌战绩,今天凯利公式已经是赌博界和投资圈,尤其是量化投资领域必不可少的风控工具。然而,凯利公式的使用其实存在巨大的认知风险,不仅以保罗·萨缪尔森及其弟子默顿为代表的主流经济学家写过大量论文驳斥凯利公式的有效性,就连有效市场理论的反对者,推荐凯利公式给索普的香农教授,在处理自己的投资时,也没有采用凯利公式操作。这是为什么呢?

上一章:第二十一回 下一章:第二十三回
网站所有作品均由网友搜集共同更新,仅供读者预览,如果喜欢请购买正版图书!如有侵犯版权,请来信告知,本站立即予以处理。
邮箱:yuedusg@foxmail.com
Copyright@2016-2026 文学吧