中外数学故事-神奇概率的故事
首页 上一章 目录 下一章 书架
    扔铜钱决胜疆场

    宋皇五年,即公元1053年,发生了宋与侬智高之间的战争。

    侬智高,是北宋广源州(今越南高平省广渊)壮族首领,庆历元年(1041年)建“大历”国,后又袭占安德州(今广西清西)建南天国,随之上书宋朝廷要求封为岜桂节度使,没有得以满足。皇四年(1052年)五月,侬智高率众反宋。侬军沿左江攻破岜州等八州,并多次在贺州等再打败宋军。九月,侬军又攻破宾州。一时间打得宋军不可招架,纷纷弃城而逃。

    面对侬智高反叛朝廷一时得势,宋朝统治者怎能善罢甘休,仁宗赵祯遂命枢密院副使狄青为宣抚使,率军南下平息叛乱。皇五年(1053年)正月,狄青率大军开始南征。狄青所指挥的部队都是岭南驻军,由于前时侬智高军气焰嚣张,连克宋军九座城池,对侬军作战自然心有余悸。狄青对此了如指掌,他打仗一向注重激励军中士卒。他本是由皇帝卫士提拔起来的战将,身经百战所向披靡,深得范仲淹的赏识,后官至马军副都指挥使,仁宗念其功高,特意让他敷药以除去面涅(士卒面部刺的符号),狄青则留其面涅作为激励军士的范例,向士卒表明朝廷是不论门第,只论功擢升,士卒只要战功卓著,完全可以大有作为。这次,担此大任,大部分军校还没有从以前的失败情绪中解脱出来,自然对胜利就缺乏信心了。

    狄青不愧是带兵打仗的行家里手,他自有激励军心士气的灵丹妙药。当他率大军行至桂林以南时,一座神庙出现在眼前。据百姓传说,这座庙供奉的神特别灵验,既然如此,何不用之祈祷一番,狄青下令部队在庙前停止前进,亲自率众将入庙祈祷,以求神灵在平叛作战中取胜。只听他说道:“此次出兵,胜负无以说明。如果能够大获全胜,我撒出去的钱全是钱面朝上。”说完就要把手中的一小袋钱币撒出去。众将见状,不由得面呈难色,这样的祈祷未免太冒险,别说那么多钱币,就是一枚钱币也只有50%的把握,这一撒出去,钱面全朝上的把握实在是太小了,这样做,很难如愿,反而会长了他人的威风,灭自己的志气。众将念及此举非同小可,一齐劝阻狄青。狄青根本不听劝阻,他似乎信心十足,挥手把百枚铜钱抛撒出去。众将的心“嗵嗵”直跳。铜钱从空中落下来,挣扎几下躺在地上。众人瞪大眼睛去寻找那难以出现的结果。但奇迹发生了,地上的铜钱清一色的钱面朝上,真是“神灵”有眼,诚心让宋军得胜。众将不禁转忧为喜,此事在军中传开,上下齐声欢呼,士气大振。

    狄青乘军心大振,士气旺盛之时,一举突破昆仑关,收复岜州,平定南疆,把侬智高赶往大理。后来狄青命众将观赏这神力无比的钱币,这时方才恍然大悟,原来狄青抛的是两面都一样的钱币,无论怎样,结局都是一样的币面。学过高中代数课概率这一章的人都知道,自然界的现象大致可分两类,一类是确定性现象,另一类是随机现象。而随机事件在现实生活中是广泛存在的,从表面看,对随机现象的每一次观察,结果总是偶然的、不可预测的,但多次观察一个随机现象,便能从中发现规律。这种寓于偶然中的必然的学问就是高中代数课所学的概率。其定义是指在大量重复进行同一试验时,某事件发生的频率总是接近于某个常数,在它附近摆动,这个常数便是概率。身为大将军的狄青在当时可能不甚清楚有概率论这门学问,但作为生活经验他何尝不知道,掷一枚铜钱,出现正反面是随机的,钱面可能朝上,也可能朝下,有两种不同结果呢?也就是朝上有1的可能性。当然2扔2枚钱时,会有4种结果,而2枚都朝上只是其中一种,其可能性为1。同样,扔3枚钱时,钱面全部朝上是有1的可能性;2223扔4枚钱时,钱面全部朝上有1的可能性;……以后每多掷一枚24铜钱,各种正反的配合种数便增多1倍。扔100枚钱时,钱面全部朝上的可能性只有1,这个数字几乎等于0了。这就是说,2100要想使100枚钱币扔出去全部朝上,这几乎是不可能的事。这应当是人所共知的经验。

    投掷次数越多,频率越接近于05。这中间究竟有些什么奥妙?现代概率论给予了科学的回答:即是当试验次数很大时,事件出现的频率和概率有较大偏差的可能性很小,因此可用频率来代替概率。可见,在大量纷纭杂乱的偶然现象背后,隐藏着必然的规律,“频率的稳定性”就是这种偶然中的一种必然。可见,要想使100枚钱币扔下去全部朝上显然有违常规。狄青的僚属正由于深知这一点,才力劝主帅放弃这种尝试的。广大的士兵出于对鬼神的崇拜、经验的启示和对主帅的神秘感,则半信半疑,拭目以待,而这种可能性微乎其微的事竟然发生了,将士们自然认为是有神灵护佑。这是古代将帅使用“愚兵计”的治军用兵的典型事例,这我们姑且不论,还是回过头看看狄青如何在破敌凯旋后,来感谢神灵的吧。

    狄青带着部队凯旋回来后,便当即命人把战前动员时所投下的100枚铜钱上的钉子拔起来,在那一刹那,他的僚属们才恍然大悟,原来,这些钱币都是狄青特制的,两面都只铸了正面!聪明的狄青,注意到人们在观察随机现象时,往往过于相信自身的经验,而忽视了前提条件。从而利用了人们的思维定式和敬畏鬼神的迷信心理,机智巧妙地采用偷梁换柱的手法,更换了“铜币有正反两面”的前提,把铜币两面铸成一样。这时,对狄青来说,100枚钱全部朝上是个必然事件,但在别人看来,却是几乎不可能出现的事件,然而这不可能发生的事竟然发生了!那时那刻,在众人的心目中,兴奋战胜了怀疑。众士兵自然觉得,神灵的护佑是这种超乎寻常巧合的唯一解释。于是,一种对科学的愚弄,骗过了他的部下,竟然激发起千军万马的勇气,鼓舞了士气,赢得了胜利。从这个故事中可以看出,大将狄青不愧是一名有勇有谋的猛将。

    概率解锁送情报

    一天,智身和师傅为给八路军送情报,师徒二人一路沿途化缘来到一座大山脚下,此山上密林葱葱,轻雾缭绕,颇有一派人间仙境的风光。师徒二人稍稍休息,便起程上路。不想当二人来到一处稍平坦的地域时,突然丛林中窜出几条大汉,不由分说将师徒二人捆绑起来,蒙住眼睛,带到不知何处。当师徒二人被拿掉蒙眼布时,他们看见眼前是一位凶神恶煞般的山大王,以及周围的诸多喽,原来是一群土匪。此情景使师傅打了个冷战,心想:“这下可完了,情报送不成了,命也难保住。”扭头看智身,只见徒弟面不露惊色,从容不迫,师傅不禁面露愧色,随之稳定精神。打劫者没有抢到什么财物,便想刁难一下他们再放走师徒二人。于是便出了几个智力题让他们回答,如果回答不上来,便要他们留下为奴。不想智身一连答对了这几个问题,山大王不得不履行诺言,放他们走。谁知因智身的机智惹恼了山大王,临下山之际他突然改变了主意,叫来两名喽,用铁锁把智身师傅的双脚锁住了。

    智身气愤地问:“你把他的双脚锁起来,叫他怎样走路?”

    “哈,哈……”山大王一阵狂笑说,“你应该帮助他呀!我已经把下山的路线写得清清楚楚,剩下的事情就由你这个徒弟来做了。”

    山大王指着智身的师傅脚上的锁说:“这是把密码锁,密码是由六位数字1abcde组成。把这六位数乘以3,乘积就是abcde1,你们可以算算这个密码是多少。不过,你们要注意,算对了就能打开锁。如果算错了,拨错了密码,锁会变得非常紧,你师傅的脚就要被夹坏呀!”

    愤怒的智身问:“可以走了吗?”山大王石手向前一伸说:“请!”

    智身也没搭话,背起师傅就走。按照山大王给的图示上所标的路线,来到了一条大河边。河上架着一座用绳子绑成的木板桥,桥还挺长,中间用几根木柱支撑着。桥边立着一块木牌,上面写着:此桥最多承重50公斤。

    智身将师傅放到了地上,擦了把汗问:“师傅,您有多重?”师傅回答:“35公斤。”

    智身说:“我40公斤,看来我背着你过桥是不行了。”

    师傅说:“智身,你先下山送情报吧。叫你背着我走,你的负担太重了。”

    智身也很着急,他既不想把师傅扔下不管,又不想耽搁了八路军的情报,怎么办呢?智身焦急地在桥边来回遛了两趟,突然他双手一拍说:“有主意啦!”智身解开绑桥板的绳子,拆下一段桥板,又用绳子的一头拴住木板,让师傅平躺在木板上。智身跳到水里游了一段,又爬上木桥,他用绳子拉着木板一同往前走,很快就把师傅拉过了河。

    师傅高兴地说:“利用水的浮力,你把我拉过了河。”

    智身一拍大腿说:“嘿!咱俩可真糊涂。把密码锁打开,不是一切问题都解决了么!”

    师傅说:“这要算半天哪!密码的六位数字是1abcde,乘以3之后,得abcde1,可以列个竖式。e×3的个位数是1,只有7×3=21,e必定是7;由于21在十位上进了2,这样d×3的个位数必定是5,那么d一定是5;同样可以推算出c=8、b=2、a=4。”师傅在地上写了几个算式:

    1abcde

    ×3abcde1

    1abcd7

    ×3abcde7

    1abcd57

    ×3abc571

    师傅高兴地举起双手说:“哈哈,我算出来啦!密码是142857,我来把锁打开。”说完就要开锁。

    “慢,”智身说,“如果错了,可就糟啦!铁锁会越来越紧。这样吧,我用列方程的方法再算一遍,看看得数是否一样。如果一样了再开锁也不迟。”

    智身在地上边算边写:

    设abcde=x,那么1abcde=100000+x,因为abcde1=10×abcde+1=10x+1,可列出方程3×(100000+x)=10x+1,展开300000+3x=10x+1,7x=299999,x=42857,∴1abcde=142857。

    师傅高兴地说:“结果一样,没问题啦!”

    智身小心地把密码锁拨到142857,只听“咔嗒”一响,锁打开了。两人非常高兴,顺顺利利地将八路军的情报送到了。

    数理统计解战争名著案件

    “1919年11月,克拉斯诺夫将军的白军重新集结力量对察里津发动了新的攻击。白卫军把第9集团军逼向北部,在第10集团军的右翼转入了进攻,夺取了杜博夫卡后,向伏尔加河前进。杜博夫卡是战局转换的一个枢纽,如果重新占领它,那么将恢复察里津东北地区的局势,而且可以将卡梅申战斗地段与保卫察里津的整个战线连成一片。为此,布琼尼率领的骑兵们以隐蔽动作到达冲击出发点古姆拉克,11日发动突然袭击,于12日中午攻克杜博夫卡,共消灭敌军4个骑兵团和2个步兵团,随后向达维多卡发动了进攻……”

    这是1918年察里津保卫战中的片断。这样激烈的战争场面,当它被描写进小说《静静的顿河》里之后,理所当然要引起文坛的注意。因此,1965年它获得了诺贝尔文学奖也是不足为奇的。

    然而《静静的顿河》的故事远不止这些。先是两位苏联作家亚历山大·索尔仁尼金与罗伊·麦德维杰夫指控肖洛霍夫是个骗子,声称《静静的顿河》不是肖洛霍夫写的,真正的作者是哥萨克地方民族主义者费奥尔·克鲁乌科夫。而肖洛霍夫只不过将已去世作家未出版的作品手稿重新改写了前两卷的5%,后两卷的30%,就改头换面,以自己的名义发表了。接着是克鲁乌科夫的未亡人出来大闹天宫。近年来,又杀出一位程咬金———挪威首都奥斯陆大学的苏联文学教授盖尔·克其萨,他用电子计算机对文学作品进行分析研究,其别具一格的论文曾发表在世界知名的权威性杂志《计算机与人文科学》上,轰动一时。

    克其萨教授与他的挪威、瑞典同事,使用乌普沙拉大学的一台IBM370/155电子计算机对《静静的顿河》的文章风格与其他一些特点与克鲁乌科夫的公认作品,进行了统计分析:抽取样品,编制程序,测定句子的长度,计算词类的分布与组合情况,力求得出一个客观的结论。他们主要研究了三个重要参数,为了对比,把肖洛霍夫的无可争辩的作品作为第一组,《静静的顿河》作为第二组,克鲁乌科夫的作品作为第三组。

    第一个参数是一部作品中不同词汇总量与总词汇量的百分比。统计结果表明:第一组为656%,第二组为646%,两者非常接近。而第三组却只有589%,明显低于前两个数据。这说明,克鲁乌科夫在其作品中,更喜欢经常重复使用同样的词汇。

    第二个参数是词汇分布频谱。对比,也是第一组与第二组比较接近。学者们选取了20个俄文中常见的词汇来研究比较。它们占作品中全部词汇的百分比分别是:第一组228%,第二组233%,第三组262%。

    最后一个参数是作品中只出现过一次的词汇所占的百分比。对此,肖洛霍夫的作品为809%,《静静的顿河》为819%,克鲁乌科夫的作品则只有769%。

    研究结果表明,所有的参数都存在一个一致的趋势,即克鲁乌科夫的作品与《静静的顿河》之间,存在着显著的统计差异。由此可见,这部杰作的真正作者很难说是克鲁乌科夫。相比之下,肖洛霍夫倒更像是《静静的顿河》的原作者了。

    数理统计使文坛上这宗多年悬而未决的案件进一步明了,笔墨官司打到如此地步,看来对肖洛霍夫是有利的。至于将来究竟如何结案,还要看文坛专家的结论。

    弓箭战中的概率问题

    在中世纪的历史上,虽然英、法两国关系非常密切,也时常发生冲突。早在10世纪末的时候,法兰克王国分裂成许多公国,其中最强大的是西部的诺曼底公国。诺曼底公国与英吉利王国只相隔一条拉曼什海峡(今称多佛尔海峡)。11世纪下半期,诺曼底公爵威廉趁英吉利王国内讧,渡海进攻,打败了英国,不久进入伦敦,加冕为英吉利国王。这就是历史上的“诺曼底征服”事件。

    到12世纪中期,威廉的后裔不仅占领了英吉利的疆域,而且以法王封臣的身份,在法国占有了比法兰西王室多6倍的领土。法王为了取得法兰西的统一,时常同英国发生武装冲突。

    1328年,法王腓力六世与英吉利的国王爱德华三世,为了争夺富饶的纺织地区佛兰德尔,发生冲突,爱德华三世以自己是法王腓力四世的外孙,与腓力六世争夺国王的继承权为借口,引发了两国之间长达百年之久的战争。

    战争于1337年11月开始的时候,双方的军事行动都很缓慢,但到了1340年,当英国海军在击溃了法国的舰队后,英国便获得了海上优势。6年后,英国陆军又出现在法兰西土地上,此举引起了法王腓力六世的雪耻解恨的复仇心理。一天清晨,他亲自统帅着队伍,从行宫所在地阿柏维尔城出发,向英军驻地进军。当传令兵前来报告前方已经看到了英军的旌旗时,腓力六世立即传令各部队马上停止进军,原地待命。但不知什么原因,尽管最前面的部队已经停下,后面的部队却继续向前行进。这样队伍发生了混乱,国王和将军们都无法控制他们。没多久,法军就全部暴露在英军面前。

    当时指挥英军的英王太子见到法军接近,就立即命令英军排列成三道战线:弓箭手排成方阵,重骑兵列在战线底层,第二线的兵力整齐地展开成为翼形,随时准备应援。

    这边腓力六世看到英军以后,顿时满腔怒火,眼睛通红。他不顾自己队伍混乱,就命令弓箭手们上前,立即开始战斗。

    法王这次带来的弓箭手有15000名之多,都是从热那亚招募来的雇佣兵,每人每分钟能射出四支飞箭。但是他们背着弓箭,走了这么多的路,已经非常劳累,加之天公不作美,电光闪闪,大雨倾盆。这些士兵早就失去了战斗力。看到这情形,腓力六世气得青筋在鬓边迅速跳动。他抽出宝剑,猛地向旁边的一棵树砍去:“传我的命令,立即进行战斗,否则就地处死!”

    双方打了一阵子,雷雨停止,天气晴朗,阳光灿烂。那光芒从英军背后照耀过来,正好映入法军眼帘。法军的弓箭手们集合起来开始进攻了。他们先是又跳又叫,肆意辱骂英军,但英军丝毫不为所动,继续保持原有阵势。法军士兵拉起弓来激烈地发射,但是,由于对着阳光,非常耀眼,不大能命中目标。

    看时机已经成熟,英王太子一声号令,英军的弓箭手们前进一步,开始发箭。那些箭既集中,又有力量,连珠炮似的发射到法军弓箭手的头上和胸部,吓得他们狼狈后退。原来,英军的弓箭手虽然也是雇佣兵,但都是从本国招募来的。他们能用很重的弓,把箭准确地射中350步远的目标,而且发射速度远比热那亚人的快,每分钟能射出15支;加上他们所处的位置好、不耀眼,因此在这场弓箭战中占了上风。

    法王见自己的弓箭手们乱纷纷地后退,便下令杀掉雇用来的弓箭手,以清除前进的障碍。于是,立即有一队重骑兵冲到后退的弓箭手队伍中举刀砍杀,法军的队伍一片混乱。被砍杀的法军弓箭手成了亡命徒。其中一个弓箭手不顾一切抓起一簇箭射向砍杀他的骑兵,他将一半的箭用于自卫,箭数的平方根的4倍杀死了一些战马,有6支箭射中了举旗的法军骑兵,3支箭射破了法军的旗帜,最后一支射得准极了,正好穿透了砍杀他的骑兵的头颅。(这个弓箭手到底拿了多少支箭?)英军见法军阵势混乱,继续不停地把利箭发射到法军的重骑兵中去,接着,骑兵和步兵又冲进法军队伍,大肆进行砍杀。腓力六世见势不妙,带领残兵仓皇逃走。

    战后英军打扫战场时发现,有85%的弓箭手被砍掉了耳朵,80%的弓箭手被打瞎了眼睛,75%的弓箭手被砍掉了手,70%的弓箭手被砍断了脚。英王太子高兴之余,便问士兵在这次战斗中,同时失去耳朵、眼睛、手和脚的弓箭手至少占多大比例?

    在英法的这场冲突中,涉及两个数学问题。先来分析前一个问题,弓箭手到底拿了多少支箭?

    不知读者们注意到了没有,里面有一句话提到了平方根,也就是说,要知道答案,就必须解一个无理方程。可是在当时,无论是法军的弓箭手还是骑兵都不知道无理方程是什么,也不知道怎样去解。用现代的数学知识是很容易解决这个问题的。

    是1

    如果设弓箭手射出的箭数为x支,那么他用于自卫的箭数就2x,箭数的平方根的4倍即4槡x支箭射死了一些战马,而射中旗手的是6支,射破旗帜的有3支,射中骑兵的有1支,把这么多支箭加起来就是弓箭手射出的箭数。

    方程为:1x+4x+6+3+1=x

    2

    方程两边都减去1x和10,得

    2

    1

    4槡x=2x-10

    方程两边都平方,得16x=1x2-10x+1004x=100或x=4由于射中旗手的箭就有6支,这样x=4不符合题意(舍去),所以弓箭手一共射出了100支箭。由此可知,其中用50支自卫,用40支箭射死了一些战马。

    再来看第二个问题,即英王太子的问题,

    因为85%的弓箭手失去了耳朵,80%的弓箭手失去了眼睛(两个百分数之和为165%),那么他们至少有65%的人同时失去了耳朵和眼睛。又因为同时失去耳朵和眼睛的人不少于65%,而失去手的人又占75%(这两个百分数的和是140%),那么,同时失去耳朵、眼睛和手的人至少是40%。由于同时失去耳朵、眼睛和手的人至少是40%,失去脚的人占70%(这两个百分数的和是110%),那么,同时失去耳朵、眼睛、手和脚的人至少是10%。

    细菌战中的数学意义

    这是朝鲜战场上的第二个春天。春天的田野里,一个十来户人家的小村庄被青山绿水环绕。村东头的小学校,从地下室传来孩子们清脆的歌声。美国强盗的炮弹挡不住孩子们上学。

    放学了,孩子们背着书包唱着歌蹦蹦跳跳沿着小溪往家走,走着走着,前面的孩子停止了歌声,捂住了鼻子。接着,其他的孩子也闻到了一股臭味。他们迎着飘来的臭味找去,发现绿草中有一枚大弹壳,里面是一堆臭老鼠。死老鼠怎么钻到弹壳里面去了?原来这是美国强盗投的细菌弹。孩子们飞快跑回村子报告了志愿军,志愿军的卫生队立刻对现场进行消毒。为了保证朝鲜人民的安全与健康,战斗胜利后,志愿军的医疗队马上对附近地区的1400户朝鲜居民进行霍乱、肝炎检查。普通的检查方法是:由医疗人员到各个普查点抽取每位受检人员的少量血液,做好标记,由医疗人员带回逐一检查,最后再把检查结果告诉每一位被检查者。这种普查方法虽然很有效,但是检查过程费时费力。由于医疗队的人数有限,不可能做到一一验血,那么有没有省时省力的办法昵?答案是肯定的。

    对于肝炎检查来说,医疗人员抽取血样带回以后,有两种验血方案可供选择。第一种是普通的方法,即对每份血样逐一进行检查。另一种方案是把所有血样先进行分组,每组100份,从同一组的每份血样中抽取一部分(验血只需要极少量的血样)进行混合,然后再对混合后的血样进行检查。如果检查结果呈阴性,即没有检出肝炎病毒,则表明该组100份血样都无病毒;如果检查结果呈阳性,即检出肝炎病毒,表明该组100份血样中有某一份或某几份带有病毒,为了查明到底哪一份或哪几份血样带有病毒,必须对这100份血样再逐一检查一遍。那么到底采用哪种方案好呢?

    如果采用第一种方案的话,每组血样要做100次检查,而若采用第二种方案,每组血样可能只要做一次检查,也可能要做101次检查。为了作出比较,必须求出采用第二种方案时每组血样需要做的平均检查次数,而这又需要知道两种检查次数出现的可能性有多大。

    根据以往资料,细菌战中肝炎病毒染病率为1%,即平均每100人中有1人为病毒携带者,或说每份血样中带有病毒的可能性是1%。因此每组血样中每份都不带病毒的可能性是:

    (1-1%)100≈0366

    而有一份或几份带有病毒的可能性是1-0366=0634。因此,采用第二种方案验血,每组血样需要检查的平均次数为:1×0366+101×0634=644(次),比采用第一种方案节省了356次。如果每验血一次需要花费10元钱的话,采用第一种方案进行检查要花14万元,而采用第二种方案只要花14×644×10=9016元,比采用第一种方案节省了4984元。

    事实上,采用第二种方案进行验血时,并不一定每组含100份血样,也可以每组含50份或150份血样,等等,有兴趣的少年朋友可以试着计算一下,此时又能比采用第一种方案节省多少费用。

    用统计方法来验货

    我们在商店购买东西时,都希望买到质量好的商品,比如要看产品的信誉保证书、生产日期、保质期等等。其实商店在进货时,也是十分注意商品的质量的,为了维护商店的自身信誉,一定会严把质量关。

    一般来说,产品的生产厂家也是要维护自身信誉的,所有的产品都有出厂合格的标签,有质量保证书及售后服务等项目提供给商店的进货人员。进货的人员不仅要认真阅读这些资料,还要对所进的产品进行必要的检验。

    以商店从某工厂购买一批灯泡为例,工厂的产品说明书中保证这批灯泡的平均使用寿命不少于2000小时,标准误差是200小时。商店在检测时会随机地抽取10只灯泡进行检验,看看这批灯泡的质量是否真正如厂家所说的那样。

    设10只灯泡的测试寿命为如下小时:

    2250、1580、1790、3020、1850、2360、1430、2050、1960、1690把这十个数求一下平均值,为1998小时。少于2000小时,但是在标准误差200小时的范围内,这是否说明这批灯泡的质量就不如厂家所保证的那样,因此商店就不进这批货了呢?

    其实商店是该进这批货的。厂方保证的2000小时指的是全体灯泡的平均使用寿命,而商店只抽取了10只灯泡进行检验,这个检验的结果带有随机抽取的偶然性,并不能完全代表这批灯泡的总体质量。由于标准误差是200小时,而1998小时与2000小时之差是在200小时之内的,所以商店应该进这一批货。

    在数学上使用统计方法来检验大批量产品的质量,也就是说只考查个别产品的检测结果,比如本例子中的10只灯泡,从而用来考查整批产品的质量或合格度。商店还可以再重新抽取10只灯泡,重新检验它们的寿命,求出平均寿命。如果多次检测的结果都在标准误差的范围内,可以认为这批商品是合格的。

    如果厂家生产的是货真价实的产品,那么绝大多数灯泡的寿命都应该接近平均寿命,与平均寿命相差较大的只占极少数。统计的曲线呈现中间高,两边低的样子,那么无论商场怎么抽取,10只灯泡的平均寿命都应该接近2000小时。

    相反,如果厂家生产的是假冒伪劣产品,那么检验的合格率就不可能有厂家说的那么高。若商店多次检验都发现,灯泡的平均寿命与2000小时相差200小时以上,则应拒绝进货。

    骰子中的概率论

    数学家们从17世纪起开始研究概率论。但对排列与组合的研究却有更悠久的历史。印度人,特别是公元前300年左右的耆那数学家,开始对排列与组合显示出了极大的兴趣。耆那数学家是出于宗教的原因研究排列与组合的,而后来的数学家则是为了分析比赛的概率而研究这一课题的,即预测可能出现的结果及建立公平的游戏规则。由于概率论和统计学交织在一起,人们研究出同时可以应用于物理世界和社会科学中的,分析数据的新方法,尽管研究总是与游戏相关联。启蒙时期的统计学被认为是指导公共利益准则以及确保道德公平和社会公平的数学方法。

    耆那教起源于印度,与佛教基本是同一时期的产物。耆那数学文献记载了公元前3世纪或前4世纪的耆那数学的发展。耆那人对处理数字有着特殊的兴趣,并且发明了表示极大数的方法。他们讨论了不同类型的极大数及生成这些数的方法。还讨论了以不同形式来组合非常多个对象的方法。他们利用组合五官感觉的方法来研究这一问题。在吠陀梵文文献中,我们还发现了关于排列的研究,这些研究所涉及的都是在祈祷及诗文中安排音节的排列方法。9世纪,耆那数学家大雄(Mahavira,约850年)拓展了这一研究,给出了现在所用的排列与组合的规则。

    排列与组合的研究现在被称为组合数学。13世纪后期,加泰隆哲学家及神秘主义者勒尔将组合数学应用于宇宙论及神秘主义。但是,他的著作似乎被许多数学家所忽视。赌博推动了组合数学的发展。但丁的《神曲》论及了冒险游戏。该游戏使用了3个骰子,一个人掷骰子,另一个人猜骰子上点数之和。在13世纪由假冒奥维德所写的一首诗给出了56种不同的骰面组合。这些工作引发了许多关于游戏的数学规则的评论。这一主题的“史前阶段”可能是以卡尔达诺的《骰子游戏》为终止的标志。该书出版于卡尔达诺死后的1663年,但它写于100年前,讨论了在骰子游戏及纸牌游戏中如何合理地下赌注。

    帕斯卡与费马于1654年的通信,使概率论进入了一个新的阶段。他们讨论了赌徒的点数问题。这一问题是进行赌博的两人之间在赌博过程中如何下注的问题。这一问题也曾经被许多意大利文艺复兴时期的数学家们研究过。包括帕乔利、卡尔达诺及塔尔塔利亚。但没有一个人给出过完满的结果。费马提出了一个方法,就是列出所有可能结果,然后每次都为完胜者记数。当游戏的局数增加时,这一方法的计算量也快速增加。而帕斯卡提出了预测的方法。帕斯卡在《算术三角形》一书中,他阐明了帕斯卡三角形中的数字与所需要的组合数之间的关系。帕斯卡三角形的每一行给出相应的二项式展开的系数。例如第三行给出了数1,3,3,1,它们是(a+b)3=a3+3a2b+3ab2+b3的系数,第二个数3是指a2b有3种组合,即aab,aba,bba三种情况。因此,利用帕斯卡三角形的适当行,帕斯卡可以快速地决定赌注的分配问题。如果玩家A需要赢两局,而玩家B需要赢三局,那么两个人一定在四局内决出胜负;从帕斯卡三角形中的第四行的数1,4,6,4,1,确定赌注应该以(1+4+6)∶(4+1)即11∶5的比例分配。

    这样的问题通常是以比的形式来讨论的,而不是用概率的形式。对取值于0与1之间的概率的最早理论研究,出自伯努利的《猜度术》。该书出版于伯努利死后的1713年。伯努利还指出可以通过观察发生的频率来估计概率,并寻求建立获得高可信度来评估概率所需试验次数的上限。不幸的是,为了满足这样苛刻的条件,需要做大量的试验。例如为了确定盒子里颜色球的比,如果可信度为999%的话,那么需要做25500次实验。计算实验次数的过程被德·莫维热改进,他以二项式展开的极限的形式给出了正态分布,并且给出了用试验值逼近真概率时,所需的更加合理的实验次数的上限。德·莫维热出版了《年金》一书的各种版本。在书中,他把上述发现应用于确定养老金金额及生命保险政策上。将概率方法运用于人口统计的推动力,则是来自不同的方面。在这里我们再次把视线转向星空。

    试图寻找精确的行星轨道的天文学家们需要依靠大量的观测,而这每一次观测都容易有误差。因而,每一次测量都会给出行星略有不同的轨道方程,而且不清楚用什么样的方法来确保从给定的数据集合中计算出最精确的行星轨道。开普勒和伽利略两人致力于这一问题的研究。解决这一问题的根本思想,是寻找使总体误差为最小的曲线。1805年,在《确定行星轨道的新方法》

    一文中,勒让德阐述了用最小二乘法给出这一曲线的方法。1809年,高斯发表了《天体沿圆锥曲线绕日运行运动理论》一文,在文中他声称从1795年他就开始使用了最小二乘法,从而引发了高斯与勒让德谁是最先发现最小二乘法的争论。高斯似乎在1801年使用了这样一个方法来计算新发现的小行星谷神星的轨道。在计算这一轨道时,他仅仅使用了前几年所得到的不精确的观测数据。他还指出了误差分布是高斯分布,也称正态分布。高斯推广了德·莫维热的早期研究成果。高斯依据的是,高斯分布是使平均观察最可能的分布。拉普拉斯得到了更强的关系:不管个别测量的误差分布是什么样的,它们的平均分布都趋向于正态分布。他还证明了勒让德的最小二乘估计也趋向于正态分布。天文学家们很快就意识到这一方法的有效性。特别是正如人们已知的那样,天文观测中的误差是固有的,它不仅仅是由仪器的局限性引起的,同时也与当星光穿过不稳定的大气圈时所产生的失真有关。1812年,拉普拉斯发表了他的巨著《概率的分析理论》,该书综合了直到当时为止概率论的所有发展成果。在随后的20~30年中,该书是概率论的主要教科书。

    在社会环境中,概率论被看成是“理性行为的微积分”。

    1814年,拉普拉斯说,概率论是减少计算的灵丹妙药。启蒙运动时期的数学家们认为开明的人采取理性的行为,而概率可以为大众提供一个可定量化的尺度,利用这一尺度,人们至少可以效仿英才们的见识。概率论的目标是为人类行为制定一个普遍的标准。关于博弈的研究仅仅是为了寻找在不确定的环境下作理性判断的工具。例如,拉普拉斯等人将概率运用于确定陪审团人数的问题上。然而,另外一些思想家不完全同意法国大革命的理性主义世界观。约翰·斯图尔特·穆勒认为:判断力应该建立在观察和实验之上,而不应该是建立在纯概率的假设之上。

    阿道尔夫·凯特尔是比利时数学家和天文学家。他把从天文学发展起来的统计学和人口普查联系起来。正态分布的思想来自“中等人”的思想。正如对星球的不准确的观测值总是围绕着它的真实值一样,人的特征值也是环绕着中等人的数据分布的。因此,与这一理论上的标准值的偏差被视为一种误差。他认为收集和分析人口数据是政府的职能之一,从而使社会学家可以像物理学家揭示物理规律一样揭示社会规律。他试图证实,虽然出生率、死亡率、犯罪率和结婚率等数值可能因国家不同而异,但是,从整体上看,这些数据年复一年都保持平稳,从而验证了每个社会实体都是稳定的,但又是稍有不同的“社会物理现象”。

    从17世纪起,人们开始收集上述关于社会实体的数据。

    1662年,约翰·格朗特发表了论文《从自然界和政治方面观察死亡登记表》,该论文基于对伦敦死亡率的统计分析。每周发表伦敦死亡率报表的目的,是预告各种瘟疫的流行趋势,从而适时给人们以警告,逃离城市。1693年,天文学家哈雷发表了基于布莱斯劳的死亡率报告的统计表。这些数据比格朗特更加精确。哈雷还成功地指出,当时的政府过于便宜地出售了人身保险。数理统计可以看成是19世纪末期天文学的统计方法和保险统计员数据采集相结合的产物。

    生物统计学的创始人弗朗西斯·高尔顿(FrancisGalton,1822—1911)是达尔文的堂弟,他将统计方法运用于分析人口统计数据和遗传特性。优生学的主要目的,是通过有选择的繁殖来改善人类素质。统计学为进化过程提供了可量化的工具。高尔顿从达尔文根据自然选择的进化论中领悟出,对生物变异需要分析的是生物本身的状态而不是它与某个理想标准之间的偏差。高尔顿把正态分布作为偏差的一种度量,而很少把它作为“误差曲线”。

    正是高尔顿引进了有关回归与相关性的概念。回归的统计学概念,来自对豌豆的研究。高尔顿将大量的种子根据种子的大小分成七组。种植后的第二代种子大小有的与其双亲相同,有的则不同。所有种子的平均大小是一个常数,但是每个组的平均值偏离了其双亲的平均值而趋近于总体的平均值。因而,每个组的平均值向总体平均值“回归”。1885年,高尔顿弄清了回归的现象,并于1889年提出了与回归有关的相关性的概念。通过适当放大两个相关的变量并在图上标出它们的值,高尔顿发现了一个可以用来表示两个变量间有关的指标。这一相关系数取值于-1和1之间。1表示绝对正面的相关性,-1表示绝对负面的相关性。相关系数趋近于零时,表示变量间没有关联。相关系数本身并不能表明变量间的因果关系,但是可以通过调整以后的实验来发现变量间的因果关系。

    高尔顿研究的是连续变异的遗传性,而孟德尔研究的,则是离散变异的遗传性。两人相互不知道对方的研究。孟德尔是一位数学家和物理学家。在1865年的一篇论文中,孟德尔提出了基因的存在。后来,他的这篇论文在1900年再次成为生物学家们的话题。他的有关基因存在的观点引起了许多的争议。达尔文的进化论的忠实拥护者们强烈反对这一基因的概念。皮尔逊认为基因的思想过于超自然,而且认为离散的个体无法显示出连续的特性。直到1918年费希尔提出了“只要有足够多的基因,孟德尔模型就会产生生物学所研究的相关性”的观点之后,这一问题才得到解决。这与离散的二项式分布相似:随着实验次数增加,它趋向于正态分布。

    关于基因的哲学争论不是本书的范畴。但是我们应该强调,统计学并不是作为数学的一个独立的分支而发展起来的。它的发展及相关的分析工具,与社会所关注的问题紧密相关。高尔顿晚年在伦敦大学设置了优生学教授的职位(现在称为人类遗传学)。获得该职位的第一人是皮尔逊(KarlPearson,1857—1936)。第二位获得者是费希尔(RonaldAylmerFisher,1890—1962)。1901年皮尔逊和高尔顿创办了《生物统计学》杂志。该杂志成了当时著名的统计学杂志。该杂志不仅刊登了高尔顿的回归和相关性的理论,也刊登了皮尔逊的在1900年开发出来的x2检验法。这一检验法重新解决了评估理论上的分布与实验数据是否吻合的问题。1908年,在吉尼斯酿酒厂工作的生物学家戈塞特(WSGossett)引入了小样本的t分布。他用笔名“学生”

    (Student)发表了这一结果,所以t检验有时被称为“学生检验”。费希尔推广了皮尔逊的许多研究。费希尔引入了方差分析。这是一个在实验中检验数据重要性的有力工具。这一分析方法最初被用于在农业中检验肥料效力等的随机实验中。这一方法的关键是在数学上把效用从偏差中分离出来。如果实验揭示出真实的效用,那么这一方法将显示出效用相对于误差的强度。

    从19世纪20年代起,数学家们开始把统计学作为一个正式的研究对象,这使统计学成为更严格、更精确的方法。费希尔的试验设计和方差分析的思想,是他的《试验设计》(1936年)中最杰出的部分,对英国和美国产生了极大的影响。这些思想迅速改变了科学中的试验实践活动,这些活动所处理的,是在实验室重现的条件下不可控制的可变资料。

聚合中文网 阅读好时光 www.juhezwn.com

小提示:漏章、缺章、错字过多试试导航栏右上角的源
首页 上一章 目录 下一章 书架