友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!
第三电子书 返回本书目录 加入书签 我的书架 我的书签 TXT全本下载 『收藏到我的浏览器』

女士品茶-第24部分

快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部! 如果本书没有阅读完,想下次继续接着阅读,可使用上方 "收藏到我的浏览器" 功能 和 "加入书签" 功能!

在12岁的时候,古德进入由缝纫用品商公司开办的艾斯克(Aske)男子中学 就读。这所学校位于哈姆斯代德(Hampstead),是专门为商贩的孩子们开办的学校,校规一向非常严格,它的校训就是要学会服务和服从(serve and obey)。在就读的所有学生中,大约只有十分之一能够升到最高年级;而这十分之一当中,又只有六分之一最后能进大学。在早年的求学生涯里,古德的老师是斯马特(Smart)先生。斯马特先生经常在黑板上抄一组练习题让学生去做,其中有些题是非常难的,他知道这要耗费学生很多时间,这样一来,他就可以利用这段时间在讲桌上做自己的事情。有一次,当他刚写完最后一题时,小古德就举手说:“我做完了。”斯马特先生略带惊讶地问:“你做完第一题了吗?”“不!”古德回答:“我全部都做完了。”
那时候,古德对数学难题的书异常地着迷。他喜欢先看答案,然后再在题目与答案之间找出一条捷径。在面对“一堆弹子”的问题时,他一看答案,就知道可以用比较繁琐的计算方法求出问题的解来。但对他来说,他感兴趣的是探索如果归纳解题的方法。在这个过程中,他发现了数学归纳法的原理,并完善了它。而这个原是仅仅是在300年前才被早期的数学家所发现。
19岁的时候,古德进入剑桥大学。在此之前,有关他的数学天才的传闻,却比他的人更早传到那里。尽管如此,他还是发现,在剑桥有许多同学和他一样具有数学天分。那时候,剑桥耶稣学院(Jesus College)的数学导师似乎更喜欢规范的数学证明方式,以至于在整个数学证明过程中,任何直觉的思维成分,都要受到排斥。更糟糕的是,导师在黑板上写证明过程时的速度非常快,往往学生还来不及抄下来,就已经被擦掉,又写上了新了内容。古德在剑桥表现杰出,连一些资深的数学家都对他特别青睐。1941年,他获得数学博士学位,论文阐述拓扑学的偏维(partial dimension)理论,是对亨利?勒贝格(就是前面曾提到过的那个成就令奈曼敬仰,但初次见面却对这个年轻人异常粗鲁的数学家)思想的扩展。
二战期间,古德成为一名密码破译员,他工作的地方就在伦敦附近的布莱奇利公园(Bletchley Park)里的一个实验室,其工作就是破译德国人的密码情报。一组密码往往由表述信息的字母转换成的一连串的符号或数字构成。在1940年,这些密码已变得非常复杂,转换的模式甚至可以随着每个字母的不同而改变。例如把“战争开始了”(war has begun)这段信息编成密码,一种方法是将这段话的每个字母配上一组数字,这样就构成了由12 06 14 09 06 23 11 19 20 01 13这样一行数字组成的密码。破译人员会注意到,其中06这组数是重复出现的,从而是可以判断它代表着同一个字母。如果这段信息足够长,且大约知道不同字母在语句中出现的统计频率,再加上一点幸运的猜测,密码破译员就有可能在几小时内把这段情报破解出来。
在第一次世界大战的最后几年,德国人研制出一种编码机器,可以为每个字母变换密码。譬如,第一个字母的编码也许是12,而当这个字母第二次出现时,机器就会给它一个与上次完全不同的编码,这个字母的编码可能就变成了14;等到第三次遇到同一字母时,也许编码又变了,如此这样编下去。依靠此种方法,密码专家就不会把上次已经使用过的数字,作为同一个字母的编码,再次使用。不过,作为密码的未来接收者,他们也必须了解这种新型密码的编制规律。因此,就机器编码来说,从一种编码转换为另一种编码,还是有一定的规律性的。密码破译专家可以依据一定的统计模式,估计出编码的规则性,从而找出破解密码的方法。然而,对于密码破译者来说,密码破译工作的难度还是越来越大:一旦最初的编码被一种固定程序所替换,那么整个程序就有可能被一种更高级的固定程序所替换,从而使衍生出来的新密码的破译难度更大。
所有这些工作,都可以用一种数学模式来表示,它很像第13章里讲到的贝叶斯分层模型。编码的每一级的变换形式,都可以用一个参数来代表,因此,我们所面临的就是如何测量的问题:编码资料里的数字可当成观测的初始值,参数代表第一层编码,超参数描述参数的改变,超超参数代表超参数的变换,如此一层层下去。最后。由于密码总要被接收者破译,因此,到最后一层,此时的参数是固定不变的,所以理论上这种密码也是可以破解的。
古德的一项主要成就,就是他从做密码分析师的工作发展出来的经验贝叶斯法(empirical Bayes)与层次贝叶斯模型(hierarchal Bayes methods)。由于战争时的工作经验,使他对数理统计的基础理论产生了极大兴趣。后来他在曼彻斯特大学(University of Manchester)教了一段时间的书,但英国政府又诱劝他回到情报单位工作,在这里,他成为电脑处理分析密码的重要人物。电脑可以大量检验各种数字的可能组合,使他有机会研究分组理论(classification theory),在分组理论中,观察单位按“贴近度”(closeness)的不同定义来组织。
在英国情报单位工作的同时,古德又拿到两个更高的学位,即剑桥与牛津两所大学的理学博士。他1967年到美国,被维吉尼亚理工学院(Virginia Polytechnic Institute)聘为大学杰出教授,一直到1994年退休。
古德永远对偶然出现的数字巧合感兴趣。“我在本世纪第七个十年的第七年、第七个月的第七日的第七时,抵达(维吉尼亚州的)布莱克斯堡(Blacksturg),被安顿在第七街区的七号公寓)一切就是这么巧合。”接着,他又说:“我有个不太成熟的想法,上帝对那些愈不相信他存在的人,提供的巧合愈多。让这些人自己相信比强迫他们相信要好得多。”这双能发现数字巧合的眼睛,也瞄上了统计估计理论中的工作。由于人类的眼睛可以在纯随机的数字中,看出某些模式,因此他会问,这样一个明显的模式,它的真实意义是什么?古德用他的头脑,探索出了数理统计模型的根本意义,正因如此,他后来所写的论文和书籍,哲学的味道愈来愈浓。

迪亚科尼斯
佩尔西?迪亚科尼斯(Persi Diaconis)是希腊移民的后代,1945年1月31日生于纽约。他的经历与I?J?古德完全不同,但和古德一样,他从小就喜欢数学谜题。古德看的是H?E?迪德内(H。 E。 Dudeney)写的书,书的内容在整个维多利亚时代的英格兰都很盛行;而佩尔西?迪亚科尼斯读的是马丁?加德纳(Martin Gardner)为《科学美国人》(Scientific American)杂志撰写的“数学娱乐”(Mathematical Recreations)专栏。后来还是在高中的时候,迪亚科尼斯遇到了加德纳,加德纳的专栏经常介绍一些玩扑克牌的小把戏,和一些使事情看起来很不同的方法,这些都使佩尔西?迪亚科尼斯非常着迷,尤其是有关概率的复杂问题。
由于佩尔西?迪亚科尼斯太沉迷于扑克片游戏,因此14岁时就离家四处游荡。其实早在他5岁时,就表演一些魔术游戏。在纽约,他经常到一些魔术师聚焦的饭店或商店去。在一家餐饮他碰到了魔术师迪亚?弗农(Dia Vernon),弗农在全国各地旅行,表演魔术。弗农邀请他当助手,一起旅行表演。“机会来了。”佩尔西?迪亚科尼斯叙述到,“马上出发。我没有跟父母说一声,就跟弗农走了。”
当时弗农已经60多岁了,佩尔西?迪亚科尼斯跟了他两年,把他的道具与技术都学到手了。后来弗农在洛杉机安顿下来,开了一家魔术道具店,佩尔西?迪亚科尼斯继续一个人旅行表演魔术。别人觉得他的姓氏拼写比较麻烦,因此他给自己取了个艺名佩尔西?沃伦(Persi Warren)。就像他回忆的那样:
那并不是什么了不起的生活,但日子过得还不错。有一次,我在卡兹奇(Catskill)表演,有人看了我的表演之后觉得很喜欢,就过来说:“喂,老兄,想不想到波士顿表演?……我可以付你200元美金。”……然后我就去了波士顿……安顿好表演场地,按确定的表演日期表演,……这时,或许就有经纪人来邀请你到别处去表演,日子就像这样。
24岁的时候,迪亚科尼斯厌倦了旅行表演的生活,回到纽约。但他没有高中文凭。他原本在学校念书的时候还曾跳级,但14岁离家出走时,还差一年高中才毕业。由于没有高中文凭,他注册念纽约市立学院(City College of New York)的成人教育班。后来他发现在他离家的这些年里,许多军队和大学与理工学院都寄信给他,请他去读书,而且信的开头都称呼他为“亲爱的毕业生”。看来在他离家逃学之后,学校的老师决定无论如何还是让他毕业,因此把最后一年的分数也给了他,使他能顺利拿到毕业证书。迪亚科尼斯并不知道,其实他已经是纽约华盛顿高中(Washington High School)的正式毕业生了。
迪亚科尼斯上大学的理由很奇怪。他曾经买过一本研究生程度的概率论教科书《概率论导论及其应用Ⅰ》(Introduction to Probability Theory and Its Application; Vo1。Ⅰ),作者是普林斯顿大学的威廉?费勒(William Feller)教授。他发现要看懂这本书很难(想看懂费勒这本书的大部分人都这样认为 )迪亚科尼斯进入纽约市立学院,想学到足够多的数学理论,以便把费勒搞懂。1971年,他26岁时拿到了纽约市立学院的学士学位。
有好几个大学的数学研究生院都接受了他的就读申请,以前有人告诉他,哈佛大学数学系从没收过纽约市立学院的毕业生(其实是误传),因此他决定申请哈佛的统计系而不是数学系。他想去哈佛,他认为,进入哈佛后,如果自己不喜欢统计,“那我可以转念数学或其他学科。他们会知道我很棒……”因此会接受他转系。结果,他对统计很感兴趣,在1974年拿到数理统计博士学位,并接受斯坦福大学的一个职位,还一直升至教授。写本书时,他是哈佛大学的教授。
电脑完全改变了统计分析特性的结构。开始,它用来做费歇尔、耶茨及其他统计学家做过的同样类型的分析工作,只不过快得多,能量也大得多。还记得(在第17章)杰里?科恩菲尔德要算一个24阶矩阵的逆矩阵时遇到的困难吗?现在我桌子上的电脑可以算出100阶矩阵的逆矩阵(尽管总是碰到这种情形的人大概没有很好地定义问题),就连一些条件不够充分的矩阵,也能通过去处,求出广义的逆矩阵,这在20世纪50年代还只是纯理论的概念。对于实验设计产生的数据(涉及多重处理与交叉对照),大量复杂的变异分析都可以通过电脑来完全,这类工作涉及到的数学模型和统计观念,其实可以追溯到1920年到1930年。试问,电脑还有什么不能做吗?
在20世纪70年代,迪亚科尼斯和一些年轻的统计学家在斯坦福成立了一个研究小组,试图研究电脑和数理统计的结构,设法回答上述问题。他们最早提出的答案之一是“投影追踪”(projection pursuit)数据分析法。现代电脑带来的其中一项弊端,就是很可能组成一些难度庞大的数据组,假设我们正在跟踪一群经诊断为高危心脏病的病人,他们每半年到医院检查一次,检查时,每个病人抽取10毫升的血,分析血液中100种不同酶的尝试,其中有许多种被认为心脏病有关。此外我们为病人做心电图检查,测量六种不同的项目,并进行心电图监控(或者要求他们一整天都载着监控器,记录一天下来约90万次的心跳)。为了医疗诊断,该测的测了,该量的量了,该抽的也抽了,得到了3040个测量结果。
怎么处理这些数据呢?
假设每位病人每次检查会产生500个测量值,而在研究期间必须跟踪10次,一个病人就有5000个测量值。如果总共研究2万个病人,可以描绘成一个5000维空间里的2万个点。通常在科幻小说里,仅有四维空间就可让人晕头转向,但在统计分析的真实世界里,处理数千维空间则是很平常的事。在1950年,理查德?贝尔曼(Richard Bellman)就提出了一组定理,他把这组定理称为“维度的诅咒”(curses of dimensionality)。这组定理表示,当空间的维度增加时,得到确切参数估计的可能性就越来越小。一旦分析空间维度达到10至20个,观测值又少于10万,那么就分析不出任何结果。
贝尔曼的定理是基于标准的统计分析方法论。但斯坦福的研究小组发现,在这个5000维的空间里,这些真实的数据并非分散分布,实际上趋向较低的维度空间。假设这些分散在三维空间的点,全都落在同一个平面甚至同一条线上,这正是真实数据呈现的状态。每个临床研究病人的5000个观测值,不会毫无关联的呈分散状态,因为其中很多的测量值是彼此相关的。(普林斯顿大学和贝尔实验室的约翰?图基也曾提出过这种看法,他们认为至少在医学研究上,数据的真正“维度”通常不会超过5。)根据这种思想,斯坦福研究小组发展了一种电脑应用技术,以找出实际存在的低维度空间。这些技术应用最广的就是“投影追踪”。
在此期间,由于大量的无序信息的增加,引起了其他科学家的注意,许多大学纷纷设立信息科学这门新科学。由于这些受过工程训练的信息科学家并不知道数理统计界的最新发展,因此会在计算机科学领域做平行发展,因而有时会重新发现一些统计学上已经知道的事,但有时也会打开一个全新的、费歇尔或他的追随者不曾预料过的领域。本书的最后一章,还会讨论这个问题。
第22章 统计学界的毕加索
我在1966年完成博士论文后,曾经拜访过一些大学,介绍我的研究成果,看看是否能找到一份工作。我的第一站是普林斯顿大学,当时约翰?图基亲自到火车站来接的我。
在我求学期间,就已听说过关于图基学术上的传说,图基单自由度交互效应(Tukey’s one degree of freedom for interaction)、图基快速傅立叶变换(Tukey’s fast Fourier transform)、图基快速检验(Tukey’s quick test)以及图基引理(Tukey’s lemma)。这些还不包括他在探索性数据分析(exploratory data analysis)研究中的成就和他在此后年代中的杰出贡献。图基是统计系主任(同时也供职于贝尔实验室),他亲自到火车站接我,使我受宠若惊。那天图基穿棉织长裤和休闲运动衫,脚上是一双运动鞋,而我却是西装革履。60年代时尚风潮还没在大学教师中兴起,所以我的着装风格比他更正式。
图基带我穿过校园。路上我们谈论了在普林斯顿的生活条件,他还询问了我做论文时所用的电脑程序,他告诉我一些技巧,以避免程序中取整数上的差错。最后终于来到我要演讲的大厅。他把我介绍给大家后,就爬上了大厅的最后一排坐下。我开始演说,同时注意到,他正忙于修改学生的报告。
我讲完之后,有几个听众(都是研究生或教员)问了一些问题,并对一些细节提出建议。当确定没有人提问或评论时,图基就从后排走下来。他拿起粉笔,在黑板上把我的主要定理重写一遍,并且完全用我的符号 ,然后用另一种方法,很快证明出这个花了我
返回目录 上一页 下一页 回到顶部 0 0
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!