摘要 本文是《漫谈现代统计“四大天王”》系列随笔的第二篇。这个系列随笔主要记叙波澜壮阔、精彩纷呈的统计世界里那些令笔者印象深化的故事与传奇、试图去了解和恢复现代统计的逻辑与思想;也难免有些偏重个人兴味的思索与评论,未见高明,是为“漫谈”,仍与读者分享,以求同乐。 本篇的中心人物——费希尔——这是今天任何人不论是学统计还是用统计,就绕不开的名字,由于现代数理统计的大半江山都源自于他一个人的原创思想。 2 费希尔篇 2.1 实验该怎样做? 毫不夸大的说,在费希尔之前,可能没有人想过这个问题。 我们以至不分明,这个问题在问什么。由于长期以来,在“决谈论”的世界观下,我们从不觉得存在讨论这个问题的必要:用实验去发现新知,难道不是自但是然?好比,哈维做了解剖实验就发现了血液循环;伽利略从比萨斜塔扔下去了两个大小不同的球就发现了自由落体定律;孟德尔做了豌豆杂交实验就发现了遗传规律……不就是这么“直接”做嘛?哪里还有什么“怎样做”的问题? 但读者如能联络一下本系列 第一篇 里,我们谈到“世界的实质是随机的”——这一统计学最底层哲学观念,会不会就有一丝的踌躇:觉得刚刚那些说的那些,其实不是“直接”,实则是有点“简单粗暴”呢?当然,暂时不明白也没关系,让我们从下面这个“女士品茶”的故事说起——这个颇有 维多利亚时期言情小说调调的典故,其实大有来头。 话说,
费希尔(Sir Ronald Fisher 1890~1962) 故事说到这里,大家可能猜到故事里这个“厚厚眼镜”、“留着尖髯”的男子就是费希尔。我们稍加停顿,无妨带入他的角色,深化地思索一下:如何做实验来检验这个命题。 或许你觉得这个简单啊:直接给她一杯用两种方式之一混的茶,让她去区别就好了嘛。但假如她说对了,就能阐明她有鉴别才干吗?假如她说错了,就能阐明她一定没有鉴别才干吗?或许,你觉得一杯还不够,要多试几杯。那到底要试到多少杯呢?而关于她的判别结果,又回到了原来的问题:全对是不是意味着她一定有分辨才干,全错是不是一定没有分辨才干?可能更复杂的是,假如她有的对,有的错,又如何下结论呢? 到往常,你大约终于明白了本节的题目:实验怎样做,大有学问! 还是以女士品茶问题为例:假定她完整没有分辨才干,给她一杯茶,她随意猜一个答案其实也有50%的可能说对;假定她有分辨才干,但种种缘由(好比茶还混得不好,混合的温度错误,她之前吃的甜食影响了她的味觉,再或者……想想你怎样和父母解释为什么你考试没考好,你就能帮她想出无数的“客观缘由”),她也有可能犯错啊。 我们可能想到,要多试几杯,那到底试几杯怎样定?另外,我们要怎样去试,即方式、次第,和向这个女士透露多少信息呢?好比,定下测试十杯,一种计划能够是分五组,每组有一杯茶加奶,另一杯奶加茶,并告知这个女士,让她一组一组判别。另一个计划,随机地选十杯,没有任何提示,让她逐一判别。当然了,实验设计计划远不止这两种,以至是要多少有多少的。那么,应该选那种呢? 再者,从女士的判别结果如何得出结论呢?好比,她10杯里分辨对了8杯,这阐明什么?这和前面的实验设计计划当然是息息相关。不用计算,我们大约也能觉得得到,在刚刚举例的两个计划中,第一种计划说对8杯,应该比第二种要“容易”不少。 费希尔的名作《实验设计》 这个“女士品茶”的案例就出自费希尔的经典名作《实验试剂》,他在书中计算了在各种状况下,女士有分辨才干和没有分辨才干时呈现不同结果的概率。哇哦——是不是赞扬不已?何其有开创性和适用性啊!他的这些成果对后世影响深远,奠定了科学的实验设计思想,彻底改动了人们的“实验”观念,并普遍的应用于实践,指导各行各业的实验设计。 2.2 逆境天才 罗纳德.费希尔爵士(Sir Ronald Fisher 1890~1962,也经常有书译做“费雪”)出生于一个七个孩子的中产大家庭,父亲是胜利的商人。他童年至青年的长大道路,今天能够作为“逆境天才”的模范:体弱多病,鳏寡孤独,视力严重受损——为维护他高度近视的双眼,医生遏止他在灯光下读书。十几岁的时分又家道中落——母亲病逝,父亲破产。但这些似乎对他的“学霸”之路没有丝毫影响:从小酷爱数学和天文,7、8岁曾经列席著名天文学家罗伯特.鲍尔的大众讲座,14岁进入哈罗公学读书展示了惊人的数学才干——荣获全校数学征文竞赛的大奖,赢得了足够上大学的奖学金。 童年时期的费希尔 费希尔在剑桥的毕业照 在剑桥大学读书时,他取得了受人尊崇的“牧人”头衔——在剑桥,学生只需经过一系列难度极高的口头和书面考试,才干成为“牧人”;每年能成为“牧人”的尖子不外一两个,有些年以至基本没有。他本科期间就发表了第一篇科学论文,并且由于出色的数学才气,结识了当时统计界数一数二的大牛,好比“学生”戈塞特(就是“学生散布”的发明者,学生是他的笔名),还有我们上一篇引见过的当时如日中天的统计“一哥”—— 卡尔.皮尔逊 。留意,费希尔此时只是个剑桥的本科生,却经常写信给大佬们,一两周以至一两天可能就处置了大佬们长期思索而不得其解的问题。 费希尔有着“超乎常人”的几何直观才干——这种才干应该是他一路读书求学期间为了抑止搅扰他终身的严重眼疾练就的——由于不能在灯光下看书,夜晚助教给他上课和辅导,完整不能运用笔纸等任何教具。是不是像足了武侠世界里那些盖世大侠——诸如,傅红雪、张无忌、令狐冲等等:“那些没有消灭你的东西,会使你变得更强壮”。大约正是这种才干,成就了传奇的费希尔——那个总有无数原创性的思想、摆平了统计诸多难题的费希尔;也是那个难于了解的、偏执的、火暴的费希尔——
费希尔早期写的一类文章数学性十分强——运用大量的数学符号,一页里有一多半都是数学公式。这样的文章对大众简直是“令人生畏”的,就是数学基础不弱的同时期统计界大拿前辈们(戈塞特、皮尔逊)也在通讯中直接表示:看不懂。这是他和卡尔.皮尔逊日后交恶的一个客观缘由。不外起初,皮尔逊应该还是很注重费希尔的,还约请过他参与自己的实验室——那可是当时业界人人向往的统计“一哥”门下。当然,我们在 上篇 提到过,在“一哥”手下其实对有独立见解的青年才俊一定是什么好事。不外,费希尔也没接受。 青年时期的费希尔 费希尔和皮尔逊交恶的细致事情不可考。但有一些事实还是很明晰。费希尔这辈子只在皮尔逊的掌管下的统计顶级杂志《生物统计》发表过独一的一篇文章——这篇文章里,他处置了皮尔逊耐久思索的高尔顿相关系数统计散布的难题,只花了一个星期,经过将问题转化成几何公式,得到了完好的解答。可惜,大佬们都没看懂。皮尔逊知道特殊状况如何求得问题的部合成,而他的措施需求大量的计算,他让手下同事计算这些解,发现逐一契合费希尔给出的普通解。但皮尔逊依旧没有发表费希尔的论文。而是不时请求他修正,降低其普通性。前前后后,拖了一年,这个文章才最后发出来,而且只是作为皮尔逊的大型计算表格的注解附录发表的——在读者看来,费希尔的数学处置仅仅是对皮尔逊及其同事做的大量重要计算的一个弥补阐明而已。 而尔后,《生物统计》再也没有发表过费希尔的文章,而该范畴另一份有名望的期刊《皇家统计学会期刊》也没有发表费希尔的相似论文。他觉得到,似乎有一股强大的权力把他阻挠在数学和统计的主流圈子之外,文章要想发表,只能另辟蹊径找一些圈外的杂志,以至有时还要自掏腰包。他日后就成为了皮尔逊文章的专业挑错者。皮尔逊对他的批判自然也十分猛烈。他回击的炮火也不会轻到哪里,并随着他日后江湖位置上升(究竟他年轻许多啊)而愈加猛烈。 2.3 从“曲线救国”走向辉煌 分开剑桥后,费希尔先后在投资公司做统计,在加拿大的农场里工作,在多所公立学校当数学和物理教员。
兜兜转转四五年后,费希尔接受了洛桑农业实验站的一个工作职位——剖析那里积聚了90年的农业实验数据。之后7年的辛劳工作,他发表了一系列让他声名鹊起的重要结果《收成变动研讨》。这些工作是在条件相当艰苦的状况下完成的,由于其中的计算量十分大,皮尔逊能够有一个实验室的“统计员”,他只需自己一个人和一台手摇机械计算机。 搜了一个1900年左右的机械计算器,一定就是费希尔用的那种,但大家感受下~~
洛桑农业实验站 在这些工作中,费希尔提出了数据剖析的原创性工具,提供了这些工具的数学推导过程,描画了它们的应用范畴,并把它们应用在洛桑90年的数据中,得到了诸如“随机对照实验”、“方差剖析”、“自由度”这些对后世影响甚巨的概念和措施。 当然你肯定猎奇,都在哪里发表呢?农业科学杂志。这绝对是最胜利的“曲线救国”的实例,费氏研讨措施很快就在大多数英语国度的农学院占领了统治位置。他的工作反响庞大,成为了热点,引出了一大批的数据处置、实验设计的科学文献,应用提高农学以外的其他范畴,包含医学、化学、工业质量控制等等。 这次胜利,也与费希尔新的写作作风大有关系——与传统数学书籍作风悬殊,好比,他1925年出版的在农业和生物范畴影响深远的名作《研讨工作者的统计措施》 完整没有公式推导和证明!有实例,有引见图表制造措施,有剖析数据的措施,有解释结果,有罗列公式,以至细致引见这些公式在机械计算机上的运用措施。但是,一切的公式都没有数学的推导和证明!我们提到过其他几个名篇:包含之前的《收成变动研讨》、以及后来出版的《实验设计》,其实都有相似的特性:
我猜测,他一定是预估了读者群,觉得最省力的措施就是“不证明”,结果也的确十分胜利。以至,正是由于没有引见太多的数学理论,这些工作很快在科学界盛行,且需求量十分大。你只需求对一个实验室技术员中止最低限度的数学培训,他就能够运用这些书中提供的措施。 费希尔的名作《研讨工作者的统计措施》 自发表以来就十分盛行 多次再版 好用归好用,胜利归胜利,但费希尔的工作(特别是其背地的原理和思想)简直是公认的难于了解。
又好比,
直到1945年,瑞典数学家克拉默写了一本书《统计学的数学措施》,对费希尔很多说法提供了细致证明过程。此书一经发表就成为人们解读费希尔的范本和经典,教育了几代数学家和统计学家。但其实这个解读版本并不完好,费希尔还有大量结论没有包含在这本书里。1970年,耶鲁大学的萨维奇又重新研讨了费希尔的原始论文,发现了克拉默遗漏的许多东西;他以至惊奇地发现,费希尔早已完成了人们后来做的一些工作,而且处置了20世纪70年代许多依旧没有处置的问题。 1934年,费希尔终于作为皇家统计学会的受邀嘉宾在最高规格的会议上展示他的成果。这是一项殊荣,只需在该范畴最出色的人士才干取得这样的约请,完整是一种江湖位置的意味。自20世纪20年代,费希尔事实上脱离了统计学主流,往常,他的天才终于得到了招认,皇家统计学会终于让他进入了该范畴的指导者之列。之后的有生岁月里,各种荣誉纷至沓来,不夸大的说,是他拿奖拿到手软的时期。他还在1952年被册封为爵士。 风华正茂的费希尔 至此,他和卡尔.皮尔逊的学术斗争以他的全面胜利而告终,但费希尔的争斗还将继续下去。 卡尔.皮尔逊三年前从伦敦大学退休,大学将他创建的生物统计系一分为二。原属 卡尔.皮尔逊的“高尔顿”教席和优生学系系主任,归属费希尔。 卡尔.皮尔逊的儿子埃贡.皮尔逊接纳团结过后的生物统计系,并同时担任《生物统计》的编委。费希尔对埃贡.皮尔逊饱含敌意——他不喜欢埃贡的父亲,也不喜欢埃贡的朋友和重要协作者、统计届冉冉崛起的新星——内曼;埃贡.皮尔逊完整是受了牵连。不外,埃贡.皮尔逊是个十分温和内敛的年轻人,他十分尊崇费希尔,也注重他的工作。固然两个人关系慌张,但两个人还是在同一栋楼里共同工作了数年,互派研讨生参与对方的讲座,且没有发作过明显的争论。 (关于埃贡.皮尔逊和内曼更多的故事,我们会在以后的篇章讲到,敬请等候。) 2.4 卡尔.皮尔逊与费希尔的哲学之争 卡尔.皮尔逊与费希尔在统计措施上的差别应上升到哲学层面。 仔细的读者在本系列读 第一篇 引见卡尔.皮尔逊关于统计的哲学观念时,可能会提出一个相关的问题:假如世界的实质是随机的,不存在误差,那么,也就不存在误差估量了? 从卡尔.皮尔逊的角度,是的,由于,
从费希尔的角度,答案是承认的。
怎样去了解呢?无妨先回想一下我们高中物理学到的一些观念。学到最后,教员普通会问及这两个世界观的问题:宇宙有终极谬误吗?我们能够发现终极谬误吗?第一个问题,我们的回答是“有!”——这源自于我们关于科学的信仰。第二个问题的解答,则是一种“模型”的观念:我们不能直接发现“谬误”,而是一系列关于谬误的“模型”。模型和谬误应然是有差距的,而我们追求谬误的过程,就是不时用更好的模型更新和扬弃那些旧的不那么好的模型的过程。 再用我们中学熟习的学问举个例子,在卢瑟福的alpha粒子轰击金箔散射实验之前,汤姆生的“枣糕”模型就是最好的原子结构模型,由于它能解释当时一切已知实验现象(如,原子的电中性,以及金属在紫外线的映照下能发出电子等等现象)。但散射实验之后,“枣糕”模型对新的实验现象不能自圆其说了,于是,卢瑟福的“行星模型”就取而代之。这并非是说,我们认定原子构培育是“行星”这个样子——其实我们永远都不肯定原子究竟长什么样;我们只是说“行星”模型是当下最好,最少曾经足够好——足够简单又足够解释一切已发现的实验现象。以后当然还会有新的实验发现——“行星”模型也有不能自圆其说的一天,我们就会展开更好的模型取代它。科学研讨就是这样基于“模型”持续不时自我更新的过程。 科学研讨是基于“模型”持续不时自我更新的过程 同时,模型也就意味着一种谦卑的、开放的世界观——我们可能永远不能发现“终极谬误”,但在追求更好的模型的过程中,我们能够无限地接近它。由于模型不是谬误,就不存在“对”“错”之别,但却十分考究“好”“坏”之分。于是,鉴别和评价模型好坏在科学研讨中是至关重要的。 我以为,费希尔的哲学观念,就比较接近这种“模型”观念。我们对理想生活中需求研讨的目的(参数)做的丈量只是一种有限的抽样(丈量值),用这些抽样,我们其实是在树立“统计模型”(统计量)。举个例子,教员需求知道全班学生控制学问的水平(参数),于是组织了一次考试(设计实验),经过测试分数(丈量值),最后得到平均分(统计量)。且我们当然有多种树立统计模型的措施,好比,假如不用平均分,还能够用中值、最高分、最低分,以及各种你结构的关于分数的函数……所以,这个时分我们就需求提出准绳和规范来判别和评价模型能否好,怎样个好法——费希尔就提出了几个规范,好比,分歧性,无偏性,有效性等。 往常,再回过头来看看 卡尔.皮尔逊的观念,则更像对第一个问题的回答——世界有终极谬误吗?——有,且终极谬误就是“随机”。这样了解后,其实和上述费希尔的观念也并不矛盾。留意,费希尔的统计模型也是“随机”的,但模型的散布可不能说就是“终极谬误”的散布啊。但皮尔逊的问题在于,他是没有模型观念的,在他那里可不存在两个散布,只需一个散布——即你察看到的就是“终极谬误”(散布)!假如将这种观念作用于实践,能够想见,对很多状况可能不好用(当两个散布差别很大的时分),基于此得出的结论错得离谱也不稀奇。这就是为什么
但是,
我们再从费希尔的观念来思索:两个散布有没有同等的可能呢?当然有,思索极限状况嘛,观测足够多,抽样数目接近无量大了,那么,模型不就无限接近“谬误”了嘛?这在统计教科书里普通称为“大样本理论”,是20世纪70年代展开起来的,取这个名字是为了和费希尔的工作相区别(相应的,费希尔的工作被称为“小样本理论”)。由于极限状况下大样本散布的渐近性质和小样本下散布各种性质差别十分大,所以把它独立出来作为一个新的研讨范畴。 固然学术界普通以为“大样本”的哲学源头在 卡尔.皮尔逊,但我想,假如 卡尔.皮尔逊和费希尔活到今天,看到这些展开,费希尔肯定是了解得更快的那一个。 卡尔.皮尔逊则可能会一头雾水:“肯定是我的理论?”;费希尔应该会一脸厌弃:“这算啥啊?早知道了。太trivial,懒得写。” 能把开发这套理论的学者们气得要吐血(费希尔绝对有这个身手,不信看下节,哈哈),那还是投 卡尔.皮尔逊门下吧,好歹也是祖师爷啊。 2.5 天才的偏执 费希尔的天才,是无须置疑的;但谈起他的个性,总会让人不由想起英特尔的开创人和成就者——安迪.格鲁夫的那个著名的书名《只需偏执狂才干生存》。 费希尔积极参与“优生运动”,他在优生学上的一些见解,简直会让人误解他是个“法西斯主义者”。他提出,国度应进步专业阶级和高级工匠阶级的生育率,而压制下层社会的生育率。
而且在这点上,费希尔完整是“知行合一”的——哪怕这直接招致了他的家庭经济的慌张——他和妻子一共生育了九个子女! 不外,要思索历史局限性,不可苛求前人,这也算是他的“白璧微瑕”吧。既然曾经提到了费希尔的优生学研讨,也很有必要说一句,他在遗传学上的成就与名望简直和他在统计学上同样出色。其实他有一半的工作都和遗传学有关。维基百科称他是“继达尔文之后最巨大的生物学家”。今天深化人心的关于基因的许多观念——好比,动植物的各种性状是各种基因以不同的概率相互作用的结果——其实都源自费希尔。要知道,费希尔做出这些发现,并不像人们臆想中的能察看到什么实体的基因或是细胞制造各种蛋白质云云,而仅仅是一堆概率散布!我们所说的基因,即DNA链,正是来自这些散布。哇!是不是想想都觉得很酷?另外,费希尔还指出了孟德尔豌豆实验数据作假——
数学天才真是不得了! 另一个让费希尔饱受争议的事情是:他终身不接受“吸烟招致癌症”这个结论,坚持以为人们用于吸烟招致肺癌的证据存在严重缺陷,以至责备研讨人员伪造数据。他的顽固简直让人狐疑他是收了烟草公司的钱。当然,这个狐疑从未被实证,但费希尔喜欢烟草则确信无疑,不少照片里的他都烟斗不离身。 费希尔终身不招认“吸烟会招致肺癌” 当然今天吸烟有害健康、招致癌症曾经成为学术界的主流观念。但认真查验费希尔的争辩,却又并非完整没有道理: 其一,树立这个观念的早期研讨数据确有瑕疵。好比范围小,针对人群单一,没有发布细致数据(只发布总结性数据)。除此,还有一些矛盾的中央:当初的调查询卷中有一项讯问被调查者是“深吸式”,还是“浅吸式”,结果发现浅吸式吸烟者的患癌人数比深吸式还要多。费希尔对此大加讽刺,质问为什么研讨者不将真正的研讨结论公之于众:吸烟有害健康,不外你一定要吸烟,那么你最好将烟气深深吸到肺里!(哈哈,领教了费希尔炮火的凶猛了吧) 当然,研讨者的解释是,研讨对象可能没有了解这个问题。于是他们在之后的更大范围的研讨中删掉了这个问题。这当然让费希尔愈加愤恨,以为他们完整就是应用政府的权威和资金在大众心中散播恐惧,与纳粹经过行动支配人心有什么实质区别?(费希尔炮火,一万点伤害+1) 其二,就触及统计另一个很本源的问题:相关性与因果性怎分辨?费希尔提出了另一种可能:
我们当然能够说,费希尔这个论点很极端;但也还没有人用实证将其完整驳倒,究竟因果性的证明原本就十分复杂。谁是谁非,读者自行判别。不外有一点小结论很明显:要是费爷生气了,结果很严重。哈哈。 千万不要惹费爷:费爷很生气,结果很严重 不外,有一个人 ——内曼,可能就不太走运了。
你猜,内曼会怎样做呢?听说:
哇,真是让人惊叹啊!孔子云“人不知而不愠,不亦君子乎”,原来这样的古风君子在现代也是真实存在过的! 还有一则小故事特别好玩。
哈哈,我猜测,你一定十分等候关于内曼其他的故事,我们下篇再谈。 |