第16章 死神之首

药物简史  作者:德劳因·伯奇

到1947年,英国结核病人的数量仅为20世纪初的八分之一。这并不是因为治疗方法有所改进,或是气候变得更利于健康,而是由于更好的饮食、居住条件和卫生状况让人们对结核杆菌产生了更强的抵抗力。磺胺类药物和盘尼西林虽然对这种细菌本身没有效果,却有助于对付结核病人较易感染的其他细菌。1935年,英格兰与威尔士共有70000人死于结核病,1947年仅有55000人。

几个世纪以来,试验理念时不时出现在这儿或那儿,但其产生的影响微不可闻,且往往随着时间流逝而消失不见。对照组、以大样本克服偶然性的问题,这些都已扎根于医学思维之中。到物理学家开始制造核武器的时候,医生已经清楚,可靠的证据只能来自分组比较,而且不能只是一个病人用药,一个病人不用,规模得比这大得多。

自弗朗西斯·高尔顿以降,进步不断发生,如连珠缀玉。研发药物的方法不仅很快得到优化,也逐步有了章法。弗朗西斯·高尔顿被视作偶像,他的工作则由卡尔·皮尔逊(Karl Pearson)继承发扬。他们的相遇大约是在20世纪初,当时皮尔逊40岁,高尔顿80岁。皮尔逊赞誉道,高尔顿将被历史奉为18世纪诗人兼医生伊拉斯谟·达尔文(Erasmus Darwin)最伟大的孙辈,比这一地位的另一竞争者查尔斯·达尔文还要略胜一筹。在人们心中,进化论对人类的实用价值要比掌握统计方法小多了。

皮尔逊的研究范围十分广泛,其中的核心在于认识论。为了更好地理解世界,人们应当如何整理组织他们的经验?应当如何使用数据来帮助他们思考事物的本质,探索事件之间的关系,区分巧合与因果?皮尔逊感到人类已经走到了认识与改造世界的新路径的边缘。他的激进思想包罗甚广,除了统计学及与之相关的认知理论之外,他也对其他事业抱有热情。激进社会主义就是他的关注领域之一,他还将其与极权主义视角下的优生学、种族差异、以战争来保持优越种族的纯洁性等观点自由结合。

不出意外,皮尔逊是以智慧聚拢人心,而不是靠热情。年轻的爱因斯坦在读过他的书后也乐于向他人推荐。皮尔逊的影响在于,他将统计学从绅士的业余爱好变成了占据科学方法核心位置的学科。他的任教职位——伦敦大学学院应用数学与力学系、皇家学会的发祥地格雷沙姆学院几何系——都没那么妥帖,这是因为统计学在学术界还未得到过认真对待。在皮尔逊的启迪下,这种情况发生了变化。

梅杰·格林伍德(Major Greenwood)是皮尔逊的一位重要同伴,他奇怪的名字可不是指军衔[Major也有“少校”之意。——译者注]。1904年,格林伍德在24岁时取得了行医资格,并像阿奇·科克伦那样,一待条件成熟便很快离开临床工作,前往伦敦与生理学家伦纳德·希尔(Leonard Hill)共同工作。希尔的妻子对此并不支持,她对丈夫说:“我希望你别让那个愤世嫉俗的小人来做你的同事。”伦纳德·希尔回答道:“这孩子有头脑,他当医生是不会有出息的,我得给他个机会进入学术界。”格林伍德很快就开始为卡尔·皮尔逊的统计学期刊《生物统计学》(Biometrika)撰写文章。这两人对数字的热爱旗鼓相当,他们为数学世界所吸引的原因或许也有共通之处。“有些人认为他选择统计学作为终身职业,是因为这是医学中最不带感情色彩的一个分支。”格林伍德的一位好友这样解释道,“也许他们说得没错。”

1928年,格林伍德48岁,他被委任为伦敦卫生及热带医学学院流行病学与生命统计学的第一位教授。不管是入选皇家学会,还是获得这个教授职位,都标志着统计学已开始发挥它的影响力。格林伍德称被皇家学会提名“对于医学实验室研究人员运用现代统计工具是莫大的鼓励与促进,同时也让我作为医学研究理事会的统计委员会主席,能够充分保障实地调查的计划与实施”。

正如药物学近一个世纪来所实践的那样,医学试验开始讲求团队合作。这意味着人们必须思考如何组织团队,团队核心领导者则要管控一线工作者,确认他们如何收集整理经验数据及试验结果。格林伍德的一则讣告中写道:“在未来,或许确能认定他的最大贡献之一——如果一定要加上‘之一’——就是他的远见。统计学当时还是全新的、长期遭到怀疑的方法,而他却将其引入了医学。他不断地、真诚地奋斗着——为了逻辑,为了准确,为了积跬步而致千里。”讣告中也指出,格林伍德对数字的感情中也包含了对待人际关系的笨拙。

对有些人来说,他显得疏远而难以亲近,另一些人觉得他愤世嫉俗、吹毛求疵。他确实不那么容易让人深入了解……对浮夸与自命不凡也的确态度严苛,而对不合逻辑乃至愚蠢批评起来简直毫不留情。他在医学期刊上的文章精辟而辛辣,让广大读者或觉酣畅淋漓,或觉如坐针毡——取决于其不同立场。

这篇讣告的作者就是奥斯丁·布拉德福德·希尔,生理学家伦纳德·希尔的儿子。奥斯丁·布拉德福德·希尔生于1897年,即19世纪行将结束之时。在成长过程中,他得益于拥有一位受过教育、思想深刻且体贴入微的父亲。伦纳德·希尔出版的作品包括原创性的生理学著作、自传性质的《一个生物学家的哲学》(Philosophy of a Biologist)、《猴子吱吱书》(The Monkey Moo Book)及其他童话故事集,后面几本显然对奥斯丁的童年更有意义。在这样的家庭环境中,一个成长中的孩子能很好地体会到,对数字的热爱与人性的温暖可以完美兼容。

第一次世界大战爆发时,希尔参军,成为一名飞行员。皇家海军航空部队在1914年正式设立,但海军(因为陆军控制了1912年成立的皇家陆军航空队而恼怒不已)在未获得许可的情形下就早已开始操练。希尔在1917年被派往加里波利(Gallipoli),这时距英联邦对此地惨烈的保卫战已过去两年。他经由陆路穿过法国和意大利,当到达爱琴海时,他在途中染上的结核病严重发作,导致他直接被遣送回家。

结核病侵染了他的肺部,这让他的病情变得难以预料。有一阵子,他仿佛就要一命呜呼,然而在医院度过两年后,他活了下来,虽然身体虚弱,但仍然活着。希尔因病弱而无法追随父亲的脚步取得医学学位,之后他又花了两年进行康复,直到身体足够强健,才开始寻找工作。这时,梅杰·格林伍德伸出了援手,作为对伦纳德·希尔当年给予支持的回报,他给奥斯丁提供了医学统计学的入门机会。希尔进入医学研究理事会,在卡尔·皮尔逊手下学习统计学。在格林伍德担任流行病学与生命统计学的教授后,他就将奥斯丁任命为准教授。

希尔的职责之一是给医务人员讲授统计学,这让他意识到,要让医生们容忍这一学科的存在就已经很困难,更别提去理解它。他在20世纪30年代将自己的讲义改写成一系列文章,发表在《柳叶刀》上。随后它们被结集出版,即《医学统计学原理》(Principles of Medical Statistics)。

“这种数学方法在医学上的应用是像有些人认为的那样,只是种无足轻重、浪费时间的花哨机巧,还是如另一些人所称,是医术发展过程中的重要阶段?”《柳叶刀》在1921年提出了这样的问题。医疗行业倾向于希望是前者,因为过去只要有某个医生的睿智意见就足够了,不用和这些烦人的数字打交道,这要让人舒心得多。希尔在书中注意到了这种不情愿,耐心地表达了同情之意,但也在书中指出,医生不可能心甘情愿地投降,他们就是爱把统计学视为“晦涩难懂、令人讨厌的东西”。要破解统计学的晦涩,需要付出艰苦的努力去研究学习,必须克服或者忍受它令人抗拒的本质。

如今统计学已经稳居医学研究的核心位置,但这并不意味着临床医疗界已经完全转变了,这一领域中的多数医生都是在统计学进入课表之前就已经毕业。虽然越来越多的医学论文都会稍微涉及点儿数学,但很少有研究者真正理解它们。对照组、病例分析、百分比和其他量化指标都只是用来装点内容,就像以前的医生会在文章中到处引用盖伦或者希波克拉底,现在他们则改为堆砌数学术语。充斥在医学期刊和教科书中的大部分数字明显都毫无意义,这种对统计学毫无意义的拙劣模仿更加深了医生的不信任感。

面对这些情绪,希尔论述道,从实践中获取的经验和知识还不足以解释疾病的表现形式和治疗的生效路径。他问道:“这种用来解释数字含义的简单方法仅仅等同于常识,还是涉及另一种可资传授的技艺或知识?”他劝说医生们应当相信,“如果你熟悉医学统计学,就一定会得出这样的结论,仅有常识是不够的。”希尔十分小心不去吓坏那些刚刚萌发的兴趣。在书中,他几乎是带着歉意指出自己所说的内容十分浅显,本来没必要专门说明——只是从事实看来,医生们并不能自己领会(他尽可能用最礼貌的方式表达了这个意思)。

希尔解释说,统计学方法是将世界当作一个大型实验室,实验桌前的化学家可以控制所有影响实验结果的因素,每次只改变一个变量,以此来获知其作用。但医生面临的情况是,总有无数影响因素交织在一起,统计学就是将这些因素一一扯开的方法。世界的本性就是无拘无束、任性妄为,分析数字是理解它的广博的唯一途径。

以对照组为例。“在一项简单的实验中,问题的核心在于……事先确认对照组和治疗组在所有与病情相关的方面都尽可能相同。”希尔着重强调了其中的难点。无论你要测试的是什么药,你不可能完全确定有哪些要素会影响病人对药物的反应。你尽可以从年龄、身高、体重等方面小心匹配对照组,但你能保证他们在所有产生影响的地方都相同吗?就算可以,也总可能存在令人难以发现、不可预知的差异。这意味着你的对照组总是不够匹配。比如在肺结核患者中,有些人的肺部虽然受到你的挤压,但如冥冥中的定数一般,他们就是要比其他没接受治疗的人好得更快。原因与结果太容易被混为一谈。

弗朗西斯·高尔顿也曾涉足过这个问题。一次,他以一贯的奇思妙想,半开玩笑地试图用统计学来研究祈祷的力量。英国教堂的礼拜仪式包括为贵族祈求长寿而念颂祷文,贵族的地位越高,为其祈祷长生的信众就越多。国王和王后位于金字塔的顶端,为他们祈祷的人比下面的任何人都多。但高尔顿留意到,他们的寿命事实上比其他任何贵族都要短——甚至比军官、艺术家、作家、科学家还短,而这些人是不会有谁为之祈祷的。这么看来,祈祷好像并没有效果。然而也存在另一种可能,那就是贵族等级越高,健康状况就会越差,要不是有这么多民众在祈祷,皇室成员和其他贵族都要短命得多。仅仅依靠这两项观察结果,无法明确得出一个是否导致了另一个的结论。

因此希尔清楚,统计上的相关性并不一定代表着因果关系,也没有一个对照组可以在所有因素上达到完美匹配。医生们辩驳道,这些问题都说明了统计学的作用不过是愚蠢的错觉;专业意见是可能有错,但肯定要比非专业意见的错误少些。

希尔说:“这不对。如果你积极介入,而不仅是在旁观察,那么就有可能将因果关系和相关关系区分开。或者至少可以说,如果你能解决分组匹配的问题,有足够信心确保找到两组相同的病人,这就是有可能的。换句话说,如果你能找到两组病人,彼此在想到及想不到的一切方面都一模一样,就可以对一组加以操作,而另一组则什么都不做,任何结果差异都肯定源自你的操作。”但怎么能找到两个完全一样的人呢?即使还在子宫里,基因完全一样的一对双胞胎也已经开始拥有不同的经历。世上没有两个完全相同的人。

希尔在他发表在《柳叶刀》上的文章和他的著作中提出的方法,就是“交替分配病例”。这和用马血清治疗肺炎的试验中所用的方法一样,你把一个人分到这组,下一个进来的无论是谁,都会被分到另一组。只要人数足够,所有差异都会被抵消。这种方法的闪光之处在于,无论你是否知晓这些差异,它们都会互相抵消。这就是问题的答案,这种方法产生的分组不仅在你知道的方面彼此相同,在你不知道的方面也都一样。当然,你没法百分百保证他们的匹配性,但肯定相去不远。连续掷一千次硬币,全部都是正面的可能性仍然存在;但你掷的次数越多,就越有信心正反面——平均而言——会一样多。

但在希尔的文章中,仍有些明显的疏漏。希尔用医学研究理事会以血清疗法治疗肺炎的试验数据为例,来说明交替分配的实际效果,但当时的特征分布明显有一处缺陷。年轻病人更可能获得血清治疗,而年长的病人拿到血清的可能性则较低。由于随着年龄增大,肺炎会变得更加致命,这种年龄失衡就会成为问题。希尔并没有对这两组病人为何会产生差异进行评论,但言下之意是这次试验只是因为规模太小,才无法平滑组间差异。试验仅包含322名病人,希尔指出其中159名为对照组,163名则以血清进行治疗。他没有提及这一数据存在的问题:如果这些病人确实是被交替分配的,一个到这组,下一个到那组,那么322个人就应该被平均分开;但事实并非如此。

那么只剩一个解释,而希尔并未提到这点:医生们在试验中作弊了。交替分配法的失败是因为医生可以影响分配过程,他们会凭直觉认为这个人应该使用血清,或者那个人不应该用,于是试验效果便打了折扣。医生总有冲动尽量为年轻病人多做些事,他们难以抵挡提供帮助的诱惑。只要有办法为患者指定治疗方式,似乎他们就会这么去做。而如果能挑选某一类病人进入其中一组,就意味着试验结果将变得毫无意义。这种做法并非出于恶意,希尔也不是不能理解,但这依然是个问题。但要如何克服,希尔并未在书中进一步讨论。

在年轻时,罗纳德·艾尔默·费希尔(Ronald Aylmer Fisher)对要追求生物学还是数学犹豫不决。根据他的皇家学会回忆录记载,当他看到博物馆里展出的一条鳕鱼时,才终于做出了决定。这条鱼的头骨被拆分了开来,并仔细地一一标注。看到这些,费希尔立刻选择了数学。

在剑桥大学时,他接触到了卡尔·皮尔逊的研究,并受到很大影响,不过这两人后来在“似然比”这一统计学概念上产生了分歧。当第一次世界大战爆发时,费希尔想要参军,但遭到了拒绝,理由是他的视力太差。于是他继续进行统计学研究,这为他带来了赞誉,也促使皮尔逊给他提供了一份工作。费希尔预感到这会是长期不和的开始,便拒绝了皮尔逊,但他仍很有兴趣去鉴别哪些问题需要以数学解答。他在1935年写道:“一位女士宣称,她只要尝一口奶茶,就可以辨别出杯子里是先放的奶还是先放的茶。考虑这个问题时,我们要以能够检验这一说法的方法来设计实验。”

他就职于一家农业研究机构,并投身于研究如何用统计学来为科学发现提供最可靠的帮助。他提出了人类历史中最重要也最显而易见的一个观点:在特定情形下,“只有随机分组才能有效地检验显著性”。

科学方法指的不仅是做个试验,而且要做出可靠的试验。否则,试验的种种诱人之处就都不过是谎言,是用来自欺欺人的方法,会让自己以为已经获得了真相,而实际并非如此。费希尔指出了希尔在解释试验设计时的缺失部分,交替分配机制还不够稳健,无法阻止医生作弊,这就意味着病人并非在两组之间随机分配。

费希尔当时考虑的不是一个个病人,而是一方方土地。他在农业研究上的目标是以事实取代迷信。你怎么才能找出真正有效的东西呢?没有两块土地是完全一样的,也不可能选出两组完美匹配的地块,它们和人一样千差万别,包括能够发现并计量的方面,也包括不可知或不可测的方面。但如果有足够多的地块,并将它们随机分配,那么所有因素都会互相抵消。这就能让你的检验有效,让科学研究真实可靠,让取得的结论具有最大价值。

受到链霉素在美国获得商业成功的刺激,英国制药公司也摩拳擦掌,准备自己生产。在他们成功之前,药品供应极其短缺。虽然美国愿意向英国出口一定量的药物,而且50公斤已经不少,但还是一样有限。1946年,这些药物涨到了天价,进口总价达到30多万美元。

读一读药品进口后的相关记录,你就会感到医生的工作完全受限于可以获得的药物量。像结核病这种常见疾病,50公斤离医治所有病人相差甚远。医学研究理事会因此决定,药物只能配发给那些患了最凶险的那类结核病的病人,比如在结核病侵染大脑外膜后产生了脑膜炎。这些病人是不幸的少数,对他们来说,除了死亡之外的任何结果都是这种新药见效的明证——副作用则完全不在考虑范围之内。

但大多数结核病人完全不是这样,很多人不用链霉素也会好转,往往还能彻底康复。对他们来说,副作用就成了关键因素。而且由于许多人无须任何帮助就能从结核病中康复,这就很难确定药物起了多大作用。医学研究理事会称自己的行动是当时的唯一选择,是一次精心组织的试验。

如果放在今天,这可能确实是真的,但在1946年却不过是种宣传口径。链霉素可以公开在市场上销售,也可以平均分配给医生择机使用,这些都是常规做法,美国就是这么做的。医学研究理事会如此煞费苦心,让人觉得唯一的前进路径就是进行一场试验,是因为它想要说服那些仍然对试验怀有敌意的人。它不仅想确认一种新药的疗效,还想开创先河。

医学研究理事会的链霉素试验成了一个标志,一场变革[这是一个被过度滥用的词。它起初是指一种剧变,将世界拉回到其最初的轨道上,回归世界应有的模样,回到堕落前的伊甸园。这种本意在此处反而十分贴切。纵观历史,药物的目的就是提供治疗、帮助人类,但几乎在任何时候都没能做到。现在医学研究理事会要确定自己对链霉素已经足够了解,才能只发挥它好的一面的作用。药物也需要回归本源,不是回到它之前的实际状况,而是回到它应有的样子。]的开始。但这场变革并不是广大医生期望见到的,他们仍然过于自信,几乎不受他们所了解的那一丁点儿统计学知识的影响。而医学研究理事会则认为,自己有责任带领医生按它认为的最佳方式工作。自从《1911年议会法案》颁布以来,所有结核病人都由地方政府负责看护,这就令治疗方式的控制权有效集中。由于药物的进口量受到限制,因此全部被收归到了医学研究理事会的管制之下。如果医生想要取得药物来医治病人,就必须按要求行事。就算有些医生不愿相信对照组,或认为凭自己的技术,不必参加可靠性试验也能够预测用药结果,他们也没什么施展空间。理事会的下属委员会很清楚,许多结核病疗法实际上都没有效果,甚至还有危害。他们了解硫代硫酸金钠,也知道它的教训。

1947年1月到9月,医学研究理事会招募了109名病人参加链霉素治疗肺结核的试验。按照事先排好的随机分配表,55名病人将获得链霉素治疗及卧床休息,另外52名则使用次优的治疗方法——在专门的结核病疗养院卧床休息。还有2人在参加试验的第一周就去世了,还没来得及被分配到任何一组。

为了尽可能避免结果受到人们期望的影响,试验本身是保密的。无论是接受链霉素治疗的病人还是卧床休息的病人,都未被告知实际情况。医学研究理事会没有给对照组使用伪装药,他们知道这或许是个隐患,也明白仅住院和住院且获得注射所带来的安慰剂效应可能会有差异。但链霉素需要一天四次通过疼痛的注射给药,不是经由血管,而是深深注入肌肉之中,而且需要连续打上好几个月。如果给对照组病人注射水,或许会让两组的相似度更高些,但他们一致同意这种差异应该没那么重要,不需要如此折磨病人。

在试验进行6个月后,医生们发现无论病人是否接受链霉素治疗,大多数体内仍然有结核杆菌存活。但稍微令人振奋的是,两组病人的死亡率产生了明显差异。对照组中有14名病人死亡,而抗生素组仅为4人。“两组间的差异在统计上显著。”试验人员报告说。他们解释了自己的计算方法,差异来自偶然因素的可能性不足1%。

结果表明,链霉素的最终效果比较复杂。结核病菌在病人体内会很快产生耐药性,这意味着即使药效确实存在,单独以这种药物来治疗结核病的表现也会很差。(在试验结束后的6个月内,对照组中又有9名病人死亡,但这次链霉素组的死亡人数达到8人,不再具有显著差异。)

从某种意义上说,医学研究理事会的链霉素试验并不像表面看来的那样具有创新性。使用对照组与随机选择的观念正在普及,而且并不限于医学领域,它们的成功应用已近在咫尺,这次试验不过是加速了这一进程。这甚至不是第一个充分运用新的随机选择技术的医学试验,医学研究理事会的另一个关于咳嗽疫苗的试验也在进行当中,其中也有希尔的参与,不过链霉素试验是首先完成并发表的。

用行政力量来保障试验进行也并不新鲜。医生与其他研究者组成的核心小组已经发展了一段时间,力量也越来越强。在产业化、药物成本、国营健康服务机构兴起等因素的综合作用下,医学研究理事会更容易开辟出一条道路。“和同时代的无数其他项目一样,”理查德·多尔对此评论道,“就像美国战时的盘尼西林研究,中央控制能让研究者们遵循他们事先设定的方针。”这就令情况大不相同。

在生命即将到达终点的时候,奥斯丁·布拉德福德·希尔揭开了他在书和文章中只提到交替分配法的原因。希尔从一开始就故意忽略了随机化的概念,因为他相信当时的医生还无法接受随机分配病患这种方式,他担心这会把他们彻底吓跑。至少要等哪次试验展现出随机化的价值,让他们不得不心悦诚服。“且不说外科医生,”希尔写道,“愿意将自己的理论暴露在冰冷的科学研究之下的内科医生就少之又少。”

链霉素的短缺与权力的集中,让医学研究理事会确立时代方向的试验成为可能。但这也是因为有一小部分人相信,只有统计方法才能让药理学有别于异想天开。而他们能够说服他人,就意味着基于可靠证据——而不是传言、印象或直觉——的医学已经开始确立。这比链霉素更能有力地抗击结核病。其他的新抗生素也很快被研发出来,并经过反复检验,直到找出最可能消灭致病菌又对病人没有损伤的组合。

结核病曾被称为“死神之首”,事实也的确如此。它能出现在任何地方,随心所欲地将人打倒,不管你是衰老还是年轻,强壮还是虚弱,富贵还是贫穷,传统的治疗方法统统无效。科赫在保罗·埃尔利希的惊叹面前、在全世界面前揭开了结核杆菌的真面目,这已是一项突出贡献。而随机对照试验虽然少人喝彩,实际却比这更重要。

统计学至今仍然不太受欢迎,充满技术与运算的特点令它缺乏吸引力。况且这一领域又困难重重,很容易就会陷入差错、误解和有意误导之中。但它的价值确凿无疑。数字或许会冰冷严苛,但它却可能带来温暖、悲悯与人道。

由于统计学常被不当使用,特别是在新闻报道里,这让人们误以为它全无价值,甚至是骗人的把戏。缺少分母的分子、不恰当的相互比较、对数据来源或所代表的意义含糊其词,这些都让统计学丧失了原有的价值。然而要回答关于世界的某些特定问题,就必须用到定量方法。医学领域中有许多这样的问题,错误的答案会令人遭受痛苦甚至死亡,若不依靠计算,就得全凭猜测。

上一章:第15章 下一章:第17章
网站所有作品均由网友搜集共同更新,仅供读者预览,如果喜欢请购买正版图书!如有侵犯版权,请来信告知,本站立即予以处理。
邮箱:yuedusg@foxmail.com
Copyright@2016-2026 文学吧