| 网站首页 | 数学新闻 | 数学文化 | 数学教研 | 考研数学 | 高考数学 | 竞赛数学 | 数学资源 | 数学图片 | 数学商城 | 关于我们 | 数学留言 | 数学博客 | 数学论坛 | 
最新公告:

  没有公告

您现在的位置: 中国数学教育网 >> 数学文化 >> 数学名词 >> 正文
专题栏目
更多内容
最新推荐 更多内容
相关文章
概率论的产生
更多内容
[组图]生活中的概率         ★★★
生活中的概率
作者:佚名 文章来源:别处引用 点击数: 更新时间:2006/4/14 7:47:22
概率论渗透到现代生活的方方面面。正如19世纪法国著名数学家拉普拉斯所说:“对于生活中的大部分,最重要的问题实际上只是概率问题。你可以说几乎我们所掌握的所有知识都是不确定的,只有一小部分我们能确定地了解。甚至数学科学本身,归纳法、类推法和发现真理的首要手段都是建立在概率论的基础之上。因此,整个人类知识系统是与这一理论相联系的……” 

婴儿出生时的男女比例

     一般人或许认为:生男生女的可能性是相等的,因而推测出男婴和女婴的出生数的比应当是1:1,可事实并非如此.
    公元1814年,法国数学家拉普拉斯(Laplace 1794-1827)在他的新作《概率的哲学探讨》一书中,记载了一下有趣的统计.他根据伦敦,彼得堡,柏林和全法国的统计资料,得出了几乎完全一致的男婴和女婴出生数的比值是22:21,即在全体出生婴儿中,男婴占51.2%,女婴占48.8%.可奇怪的是,当他统计1745-1784整整四十年间巴黎男婴出生率时,却得到了另一个比是25:24,男婴占51.02%,与前者相差0.14%.对于这千分之一点四的微小差异,拉普拉斯感到困惑不解,他深信自然规律,他觉得这千分之一点四的后面,一定有深刻的因素.于是,他深入进行调查研究,终于发现:当时巴黎人“重女轻男”,有抛弃男婴的陋俗,以至于歪曲了出生率的真相,经过修正,巴黎的男女婴的出生比率依然是22:21.

一名优秀数学家=10个师

     在第二次世界大战中,美国曾经宣布:一名优秀数学家的作用超过10个师的兵力.这句话有一个非同寻常的来历.
     1943年以前,在大西洋上英美运输船队常常受到德国潜艇的袭击,当时,英美两国限于实力,无力增派更多的护航舰,一时间,德军的“潜艇战”搞得盟军焦头烂额.
    为此,有位美国海军将领专门去请教了几位数学家,数学家们运用概率论分析后分析,舰队与敌潜艇相遇是一个随机事件,从数学角度来看这一问题,它具有一定的规律性.一定数量的船(为100艘)编队规模越小,编次就越多(为每次20艘,就要有5个编次),编次越多,与敌人相遇的概率就越大.
    美国海军接受了数学家的建议,命令舰队在指定海域集合,再集体通过危险海域,然后各自驶向预定港口.结果奇迹出现了:盟军舰队遭袭被击沉的概率由原来的25%降为1%,大大减少了损失,保证了物资的及时供应.

什么是概率天气预报

    概率天气预报是用概率值表示预报量出现可能性的大小,它所提供的不是某种天气现象的\"有\"或\"无\",某种气象要素值的\"大\"或\"小\",而是天气现象出现的可能性有多大。如对降水的预报,传统的天气预报一般预报有雨或无雨,而概率预报则给出可能出现降水的百分数,百分数越大,出现降水的可能性越大。一般来讲,概率值小于或等于30%,可认为基本不会降水;概率值在30%-60%,降水可能发生,但可能性较小;概率在60%-70%,降水可能性很大;概率值大于70%,有降水发生。概率天气预报既反映了天气变化确定性的一面,又反映了天气变化的不确定性和不确定程度。在许多情况下,这种预报形式更能适应经济活动和军事活动中决策的需要。
文章来源:气象影像网 龙虎网

生命中的危险概率

    生活就是一场冒险。日常生活中出现一些危险是难免的,问题是遭遇某种危险的概率有多大。一般说来,如果遭遇某种危险的概率低于十万分之一,我们还能坦然视之;但如果危险概率提高到万分之一,我们就得小心了。每年都可能遇到的危险机会有:
   受伤:危险概率是1/3
   难产(行将生育的妇女):危险概率是1/6
   车祸:危险概率是1/12
   心脏病突然发作(如果您已超过35岁):危险概率是1/77
   在家中受伤:危险概率是1/80
   受到致命武器的攻击:危险概率是1/260
   死于心脏病:危险慨率是1/340
   家中成员死于突发事件:危险概率是1/700
   死于突发事件:危险概率是1/2900
   死于车祸:危险概率是1/5000
   染上爱滋病:危险概率是1/5700
   被谋杀:危险概率是1/1110
   死于怀孕或生产(女性):危险概率是1/4000
   自杀:危险概率分别是1/20000(女性)和1/5000
   因坠落摔死:危险率是1/20000
   死于工伤:危险概率是1/26000
   走路时被汽车撞死:危险概率是1/40000
   死于火灾:危险概率是1/50000
   溺水而死:危险概率是1/50000
   如果您自己不吸烟,而您的配偶吸烟,那么您可能受二手烟污染而死于肺癌:   危险概率是1/60000
   被刺伤致死:危险概率是1/60000
   死于手术并发证:危险概率是1/80000
   因中毒而死(不包括自杀):危险概率是1/86000
   骑自行车时死于车祸:危险概率是1/130000
   吃东西时噎死:危险概率是1/160000
   被空中坠落的物体砸死:危险概率是1/290000
   触电而死:危险概率是1/350000
   死于浴缸中:危险概率是1/1000000
   坠落床下而死:危险概率是1/2000000
   被龙卷风刮走摔死:危险极率是l/2000000
   被冻死:危险概率是1/3000000
   一生中可能道遇到的危险有:
   死于心脏病:危险概率是1/3
   死于癌症:危险概率是1/5
   遭到强奸(女性):危险概率是1/11
   死于中风:危险概率是1/14
   死于车祸:危险概率是1/45
   自杀:危险概率是1/39
   死于爱滋病:危险概率是1/97
   死于飞机失事:危险概率是1/4000
   死于狂犬病:危险概率是1/700000

艾滋病的传染概率有多大

    艾滋病传染概率有多大?据地坛医院性传播疾病防治中心徐克沂主任介绍,艾滋病是通过3种传播途径传染给他人的,即:血液传播、性传播、母婴传播。如果一个正常人输进了HIV(艾滋病病毒)阳性感染者或艾滋病病人的血液其感染的概率是95%,而一个HIV阳性感染者或已经发病的病人与一个正常人发生性关系的感染概率和性别有一定关系,男传给女的概率是0.2%,女传给男的概率是0.l%,男传男的概率要比以上两种方式大得多。如果母亲是一个HIV阳性或艾滋病的病人,其感染给胎儿的概率是25%,但是如果母亲经过AZT的抗病毒治疗,其胎儿的感染概率下降到8%;经过联合疗法(鸡尾酒疗法)治疗胎儿的感染概率可能下降为2%

    艾滋病病毒是一种十分脆弱的病毒,它对热和干燥十分敏感。在干燥的环境中,艾滋病毒10分钟死亡,在60摄氏度的环境中30分钟灭活。如果一支刚接触病人身体带有血液的注射器,马上刺入正常人体内,其感染的概率小于0.3%。蚊虫叮咬不会传染艾滋病就是因为这个原因。

    在医学史上人类经历了霍乱、鼠疫、黄热病和天花等多种流行病的侵害,而人类最终还是战胜了它们。如今面对艾滋病,有关遏制艾滋的医学研究也正在紧锣密鼓开展,例如用传统医学方法研制的艾滋疫苗;用中医药技术研发的艾滋抗体及从计划生育角度转而提倡运用的“避孕套”,这些都让我们看到人类克服艾滋病的曙光。

彩票中奖概率话你知

“367”“265”概率

    据有关专家介绍,广东省目前发行的体彩“36选7”、南粤风采“36选7”、南粤风采“26选5”均属于数字组合型玩法,其中奖概率的计算方式也是相同的,其中“36选7”玩法的头奖命中概率为1/8347680,“26选5”玩法的头奖命中概率为1/65780;目前体彩“36选7”二次开奖的中奖概率仍为1/8347680,南粤风采“36选7”全省特别奖(中8个号码)的中奖概率为1/32060340,南粤风采“36选7”南粤福星奖(中9个号码)的中奖概率为1/94143280,南粤风采“26选5”幸运奖(中7个号码)的中奖概率为1/657800。

excel函数可计算中奖概率

     针对类似“36选7”的数字组合型玩法,数学专家还向记者推荐了一种利用excel表格软件函数计算的简单方法,打开电脑中的excel软件,在“粘贴函数”栏内选择“数学与三角函数”中的“combin”函数,填入相关数据就可以计算出相应的中奖概率,如“36选7”的概率计算公式为:combin (36,7),南粤风采“36选7”全省特别奖和南粤福星奖的计算公式分别为:com-bin(36,8)、combin (36,9),彩民朋友可以根据公式自行计算“×选×”型彩票玩法的头奖中奖概率。

幸运七星及足彩中奖概率

    体彩“幸运七星”则属于数字型玩法,即从0000000~9999999共1000万个号码中任选一个七位数号码组成,每个号码均从0~9共10个数字中开出,“幸运七星”头奖的理论中奖概率为1/10000000。

    目前最受彩民欢迎的足彩实际上也是一种数字组合型玩法,不过计算方法相对比较简单,13场比赛均选“3、1、0”可组合出3的13次方1594323注单式号码,一等奖的中奖概率为1/1594323,换句话说,每销售320万元的足彩,平均就可能诞生一个一等奖。而如果将足彩竞猜的场次增加到14场,足彩的头奖中奖概率则降低为1/4782969,难度增加了3倍。

吸烟危及生命概率:50戒烟等于自救

    1987年11月,世界卫生组织(WHO)在日本东京举行的第6届吸烟与健康国际会议上,建议把1988年4月7日,也就是世界卫生组织成立40周年纪念日,作为“世界无烟日”,提出“要吸烟还是要健康”的口号。1989年,世界卫生组织又把这一天改定在每年的5月31日。

    今年5月31日,我们将迎来第17个世界无烟日,但目前我国吸烟现状却不容乐观:烟民人数不断增加,达3.2亿人,烟民平均年龄在降低,女烟民及青少年吸烟的数量在不断增加。

    我国烟草生产和消费还居八个“世界第一”:烤烟种植面积世界第一;烤烟产量世界第一:烤烟增长速度世界第一;卷烟产销量世界第一;卷烟增长速度世界第一;吸烟人数世界第一;吸烟人数增加数量世界第一;烟税增长速度世界第一。

    吸烟有害健康,这句话人人会讲,但是,你可知道,吸烟危及生命的概率究竟达到了何种程度吗? 

    探究吸烟与戒烟
   一,吸烟为什么会上瘾?
   烟民往往都有烟瘾,这主要是尼古丁长期作用的结果。尼古丁就像其他麻醉剂一样,刚开始吸食时并不适应,会引起胸闷、恶心、头晕等不适,但如果吸烟时间久了,血液中的尼古丁达到一定浓度,反复刺激大脑并使各器官产生对尼古丁的依赖性,此时烟瘾就缠身了。若停止吸烟,会暂时出现烦躁、失眠、厌食等所谓的“戒断症状”,加上很多吸烟者对烟草产生一种心理上的依赖,认为吸烟可以提神、解闷、消除疲劳等,所以烟瘾越来越大,欲罢不能。
   其实烟草与吸食海洛因引起的成瘾性不同,前者是完全可以戒掉的,关键要戒除心理上对烟草的依赖。这种心理依赖导致吸烟者的一种行为依赖,使得吸烟者感到戒烟困难甚大,无形中增加了戒烟的难度。
   二,二手烟危害他人健康?
   一个人吸烟似乎“无关他人”,其实不然,其家人正受到被动吸烟的危害。根据世界卫生组织的定义,被动吸烟是指不吸烟者一周中有一天以上每天吸入吸烟者呼出的烟雾长于十五分钟。中国71%的家庭、32.5%的公共场所和25%的工作场所,因有人“吞云吐雾”而成为被动吸烟场所。
   被动吸烟也即是吸“二手烟”,目前我国有六亿人受到被动吸烟的危害。被动吸烟者所吸入的有害物质浓度并不比吸烟者低,吸烟者吐出的冷烟雾中,烟焦油含量比吸烟者吸入的热烟雾中的多1倍,苯并芘多2倍,一氧化碳多4倍,如此多的有害物质对周围的人特别是儿童、孕妇和老年人造成很大的危害:
   据估计,美国每年有四百万儿童因吸入“二手烟”而患病。父母吸烟使儿童下呼吸道疾病如哮喘、肺炎的发生率增加50%,儿童易出现各种慢性呼吸道刺激症状,如咳嗽、咳痰、喘息等,甚至出现持续的肺功能损害;
   被动吸烟易引起中耳积液,使儿童中耳炎的发生率增加;
   被动吸烟可以使哮喘患儿的哮喘发作次数与严重程度明显增加,对有过敏体质的患儿更易诱发哮喘发作;
   被动吸烟与婴儿突然猝死综合征(SIDS)的发生密切相关;
   父母吸烟使儿童更易成为吸烟者;孕妇吸入“二手烟”易引起流产、早产、出生低体重儿以及婴儿先天性畸形如唇裂、颚裂等;
   老年人长期吸入“二手烟”易引起肺炎、急性心脑血管疾病的发生……
   三,戒烟为何戒不了?
   有研究表明,吸烟者中有11.7%的人是复吸者,而且复吸者的肺部损伤程度较一直吸烟者为重,原因有多方面:复吸者较其他吸烟者更易成瘾,复吸后其吸入香烟的数量更多,且每口烟的吸入程度更深,对身体的影响不言而喻。对于每一个吸烟者来说,在一些特定的“危险”情形下(当周围人吸烟、感到压力大、心情烦躁、饮酒后)会更有吸烟的冲动,那么请尽量避免这些情况的发生,当有吸烟冲动时做几次缓慢的深呼吸或从事其他活动转移注意力是个好方法。
   四,戒烟后生活会变化吗?
   如果您选择戒烟,您将选择告别咳嗽气喘、烟灰异味、污浊空气、皮肤衰老、疾病困扰……让我们看看您戒烟后生活发生了哪些变化:8小时后血液的氧合作用恢复正常,患心肌梗塞的风险开始降低;24小时后口气清新,肺开始排泄粘液和焦油,患呼吸道感染、支气管炎和肺炎的风险开始降低;48小时后血液中不再检测出尼古丁;1周后味觉、嗅觉得以改善;3—9月后呼吸得以改善(咳嗽、气喘减少),肺功能提高5%—10%;1年后患心脏病(如心肌梗塞)的风险减半;5年后患脑中风、口腔癌、食道癌、膀胱癌的风险减半;10年后患肺癌的风险减半,患脑血管突发事件(脑“中风”)的风险与未吸烟者持平……所以选择了戒烟,你就选择了一个健康清新的生活。
   “吸烟危及生命的概率是50%,戒烟等于自救”。这是法国国家戒烟委员会和烟草预防办公室在巴黎举行的第30届法国医学沙龙上对所有吸烟者发出的警示和呼吁。

   复旦大学附属中山医院呼吸内科瞿介明宋琳
消息来源:上海疾控中心

10%的酗酒概率

     我们经常见到,当全家人围坐在节日餐桌旁的时候,父母让年幼的孩子喝上一点酒,这是否对孩子有害?专家们的看法是:90%的情况下不会有任何危害。但是,仍有10%的孩子,因为基因的特殊性而导致日后酗酒。谁来给这10%的孩子上保险,不致使他们进入这10%的行列?美国总统夫人弗尔德描述了自己酗酒的情况。她回忆说,当她感冒的时候,她妈妈将一勺威斯忌倒进了她的茶里。这足以使她成年后成了酗酒者。

中数字出现的稳定性(法格逊猜想)

     在的数值式中,各个数码出现的概率应当均为.随着计算机的发展,人们对的前一百万位小数中各数码出现的频率进行了统计,得到的结果与法格逊猜想非常吻合.

我们是不是该相信小概率事件?

文/葛民勤

一、什么是小概率事件?

 小概率事件,字面意义就是发生的可能性极小的事件。比如,北京地区出现日全食;山西洪洞发生里氏5级地震,新疆吐鲁番地区下了一场暴雨,小行星撞地球等等。以上这些是发生在自然界的小概率事件,发生在人类社会的小概率事件诸如上证指数突破2000点,某特定国家通过允许同性恋的法律,某两个国家统一等等。至于发生在日常生活中的小概率事件,也是不胜枚举,如某个特定的人中了彩票头奖,某日某地有人跳楼自杀,等等。

 小概率事件是要和不可能事件,也即无概率事件区别开的。所谓不可能事件,就是指完全不可能发生、概率为零的事件。不可能事件可以分为三类。第一类,如某人某时刻既在甲地又在乙地,世界上既有能刺穿一切盾的矛又有能抵挡一切矛的盾等等,属于自相矛盾的事件,违反了逻辑,也就绝对不可能发生。这类不可能事件显然没有研究意义。

 第二类,如日本没有进行南京大屠杀、诸葛亮的隐居地在河南南阳而不是湖北襄阳等等,是对于历史上确凿发生过的事件的否定,也即对必然事件的否定,其概率自然为零。但是这种不可能事件在统计学上也没有研究意义,因为统计学更多地是关注在一定条件下可以重现的事件以及一般性的事件,而不是永远无法重现的个别事件。

 不可能事件的第三类,如永动机、常温常压下纯冰在零摄氏度以下自发融化、地球接收到三秒钟前太阳发射的光线等等,违反了最基本的自然规律,也是对必然事件的否定,因而发生的概率也为零。永动机违反了热力学定律;常温常压下纯冰在零摄氏度以下融化违反了冰的相图,实质也是违反了热力学第二定律;地球接收到三秒钟前太阳发射的光线则违反了相对论“真空光速不变”的原理。不过,某些这一类的不可能事件的判定不是很简单的,后文还要提及。

二、基本的概率计算方法

 小概率事件彼此也可以相差很大的。例如,同样是发生里氏5级以上地震,在日本和在山西洪洞的概率就明显不同。日本几乎每年都会发生至少一次里氏5级以上地震,而山西洪洞发生里氏5级以上地震的概率大约是200年~300年一遇(同一地震序列中的几次5级以上地震按一次计算)。又如同样是干旱地区,吐鲁番和南美洲智利阿塔卡马沙漠的暴雨概率也大为不同。1958年8月14日,吐鲁番突降36.0毫米的暴雨,引发山洪泛滥;这种暴雨在有记录以来的阿塔卡马沙漠地区还从未出现——相反,阿塔卡马沙漠曾创造了1845-1936年间整整91年没有降水的纪录。

 要对小概率事件发生的可能性有正确的认识,就必须估计出小概率事件的概率。概率计算的最基本方法,是先估计出与该事件互不相容(即永远不可能同时发生)的所有事件的数目,则该事件包括的所有情况的数目与所有这些互不相容事件的数目之比,就是该事件的概率。最直观的例子是掷骰子。骰子共有六面,掷一次骰子得到某一点值就有六种可能,而且是互不相容的。因此,全部互不相容事件的数目是6。假如我们要算掷一次得到1点的概率,这个事件只有一种可能,所以其概率为1/6。假如我们要算掷一次得到点数为3的倍数的概率,因为这个事件包含两种情况(3点和6点),所以其概率为2/6=1/3.

 这种基本方法有两个局限:第一,它所计算的事件如果要发生,只能发生一次;第二,它所计算的事件是瞬间决定的,而不是一个连续的过程。但是这两个局限并不难突破。对于多次发生的事件,可以应用独立事件的积的办法计算某一事件的概率。所谓独立事件,是指两件或两件以上事件彼此之间互不干扰,一件事发生与否对另一件事的概率没有影响。如两次彩票的头奖号码,因为抽奖过程是完全独立的,因此第二次彩票的头奖号码有可能和第一次相同,而不会有意避开。显然,在考虑几次事件联合发生的概率时,总的互不相容事件的数目是每一独立事件的互不相容事件数目的乘积。如掷两个骰子,第一个骰子有6种可能,第二个骰子也有6种可能,总可能性就是6×6=36种。因此,总概率也就是每一独立事件发生的概率之积。例如掷两个骰子出现两个6点,每个骰子出现6点的概率是1/6,总概率就是(1/6)×(1/6)=1/36。

 如果事件发生的次数再多,应用简单的四则计算就会感到计算量庞大而难以算出结果。而对于连续性发生的事件,也不能用硬性分割的办法把它简化为瞬间发生的多次独立事件。幸而高等数学已经解决了这个问题。极限概念的引进为解决复杂的概率计算提供了理论基础,微积分就是极限概念的应用。应用微积分来计算概率,也就成为统计学的基础。

三、小概率事件的估计方法

 不同的小概率事件,有不同的各具特色的概率估计方法,概率值的表达形式也不相同,但都体现了上述基本的计算方法。例如,对地震、旱灾、洪水之类自然灾害的概率,我们常常用“××年一遇”这种表达形式。仍以洪洞地区地震为例。自有史料记载以来,1303年9月25日在城关镇-赵城镇(当时为洪洞县和赵城县)发生了大地震,据史籍文献里的烈度推算,震级为里氏8级;1695年5月18日,在洪洞南部的临汾发生八级大地震,强烈波及洪洞地区。如果再算上一些震级较小的破坏性地震,洪洞地区5级以上破坏性地震的概率大约是两三百年一遇。

 需要说明的是,这种通过史籍的记载来进行自然灾害的统计和概率估计的方法是中国特色的,因为只有中国保留下来了如此众多而完备的各种史籍。对于缺乏史籍的国家和地区,对自然灾害的统计和概率估计,只能通过自然调查的方法。

 又如对外星人来访的概率估计。首先是分析事件发生的原因。外星人来访有两个前提条件,一是生命能够存在,二是生命能够进化到智慧生命并且发展到宇航时代。影响这两个前提条件的必备因素是很多的,首先必须要求恒星是稳定的主序星,温度不能过热,而且是单一存在,不是双星或多星系统;其次,行星大小适中,有足够的水和大气,与恒星的距离适中,轨道偏心率不能太大;再次,有足够的时间供生命演变,也即宇宙环境要稳定,在行星系统30光年内的所有恒星都必须保证在这一时间段内不发生灾变。如果对每一个原因都利用现有的天文观测资料进行慎重的估计,文明世界在银河系内发生的可能性只有不到10^(-6),换句话说,银河系的四千亿颗恒星里,可能存在宇航时代文明世界的恒星不到四十万个,即文明世界的平均半径达70光年。这一计算方法首先由SETI工程的先驱者、美国天文学家弗兰克·德雷克(Frank Drake)提出,德雷克因此建立了一个计算概率的公式,称为德雷克公式。德雷克公式清晰地告诉我们,即使按最保守的估计,外星人来访的可能性也不会比你猜中一个随机生成的六位数更大。

 同样,对于社会和日常生活中的小概率事件的统计和概率估计,也有自己独特的方法。但总不外乎原因分析、建模和调查这几种基本方法。统计学发展到今天,已经是一门严谨精密的科学,在自然科学和社会科学的研究中得到了越来越多的应用。例如统计热力学,就是统计学方法和物理学的完美结合。社会科学的研究更离不开统计学,因为社会发展的规律本身就是以统计性为其特征的。因此,掌握统计学的基本原理,已是对从事各种研究的学者的最起码要求。

四、有意义和无意义的小概率事件

 以上对小概率事件及其概率估算方法做了简单的分析。分析结果是需要应用于实践的。对小概率事件估算出来的概率值,可以科学地决定我们的决策。这时我们就需要判定,哪些小概率事件是有意义的,哪些小概率事件是无意义的。因此,判断小概率事件是否有意义,就是判断它对于我们的实践是否有影响。这体现了对小概率事件的意义判断的“实用性”。

 首先,概率本身的大小是一个重要的判定依据。如果一个小概率事件的概率太小,比如,低于10^(-5)量级,那么在绝大多数情况下,它对于实践的影响可以忽略,也就因此是没有意义的。比如月亮从天上掉下来,严格地说,这也是小概率事件,因为既然地球对月亮有吸引力,它从天上掉下来是理论成立的。那么这种事件发生的概率是多少呢?同样先要找原因。月球掉下来的最可能原因不外乎三种:一,有小行星撞过来,改变了它的运行轨道;二,外星人所为;三,地球人自己所为。前两种的概率都不到10^(-7),而第三种,在最近几十年内,概率趋近于零。三种原因合起来考虑,这一事件发生的概率至多是2×10^(-7),尽管不是零,但却足以被认定是无意义的。因此,不会有任何一个国家准备足够的核弹头,以备万一月球下坠时发射、以改变其运行轨迹、使之飞离地球或回到原轨道之用。

 其次,实践的精度也是一个重要的判定依据。如果做一件事不需要太多的考虑,也就是说,不需要太高的精度,那么凡是低于这个精度的不确定性都可以不在考虑之列,也就因此是无意义的。比如计算月球轨道,如果只是为了定农历的初一,那么至多考虑地球引力、太阳引力、岁差等三四项就可以了;如果要精确计算的话,大行星的摄动之类也必须考虑进去。二十世纪初,英国天文学家E.W.布朗(E.W. Brown)在精密的观测和天体力学理论的基础上,建立了新的月球运动理论,并以毕生精力投入到月球轨道计算中去。他所考虑的影响月球轨道的因素,就有几百项之多。这对于尖端的天文学应用(例如后来的人造卫星发射和控制)当然是十分有意义的,但对于编制农历,考虑这么多的因素就无意义了。

 再次,考虑小概率事件的发生时,需要注意到它的发生频率不均性。小概率事件的发生概率只能是在一定范围内平均而言,但分布可以是不均的。例如我们常常说我国是多地震国家,但地震在时间和空间上都分布不均。比如,我们不能要求地震很少的江西省盲目加大抗震基础设施建设,那样是对资金的浪费,自然是无意义的。国家颁布的中国地震烈度区划图就是根据不同地区不同的地震发生频率制订的,有效地避免了抗震措施的盲目采取和资金的浪费。又如,1976年7月28日唐山地震后,围绕如何重建唐山展开了争论。如果按唐山地震的最大烈度XI度设防,则需要的建设资金过高,新唐山难以重建。因此,在地震学者的详细勘察之后,认定五十至一百年内,唐山地区不会再发生5.0级以上地震。于是把唐山地区的烈度区划定为VIII度区。这时候,1976年的唐山地震最大烈度高达XI度这一小概率事件对于今年五十至一百年这个时间区段内的城市抗震建设就是无意义的了。

 划分小概率事件的有意义和无意义,可以使我们科学地对各种可能影响实践的因素进行取舍,从而使我们的决策具有最大的合理性。这也是运筹学的基本思想。

五、小概率事件和不可能事件的分辨

 小概率事件以其概率小,有时是容易和不可能事件混淆的。如何区分小概率事件和不可能事件,不是一件简单的事情。首先,确实得承认某些情况下的区别是一个历史范畴,也就是说,随着科学技术的进步,某些被判定是不可能的事件可能成为小概率事件,而某些被判定是小概率的事件可能成为不可能事件。但是,这种分辨标准的变化只是个别标准的变化,而不是全部标准的变化。科学技术的发展是对宇宙客观规律的不断深入认识,是一个趋近绝对真实的过程,这就好比岩石在海中沉积,不断会有新的岩层生成,而老的岩层并未消失,而是成为新岩层的基础和支撑。承认个别判定标准的变化,决不是为了推而广之,认为整个科学体系的判定标准都有问题。

 比如,惰性气体在发现之后的半个多世纪内,一直认为绝对不能与其他元素化合。但1962年,加拿大化学家巴特列(N. Bartlett)率先合成了第一种惰性气体的化合物——六氟络铂酸氙,开创了惰性气体化学这一崭新的无机化学分支,也使人们不得不把惰性气体改称为“稀有气体”,以图名正言顺。但是,在常温常压的大部分情况下稀有气体是无法和其他物质反应的,氦、氖、氩三种稀有气体至今没有拿到化合物,说明稀有气体的化学反应只是小概率事件。这是不可能事件转变为小概率事件之一例。 又如,1898年,英国物理学家凯尔文(W.T. Kelvin)曾忧心忡忡地认为,随着工业文明的不断发展和人类数目的不断增多,地球上的氧气在500年之内就会耗光,人类就会灭亡。事实上,早在1772年,英国化学家普利斯特里(J. Priestley)就发现了光合作用,以后的科学家陆续发现,光合作用消耗二氧化碳,制造氧气,恰恰和呼吸作用相反。生态学的发展使人们确立了碳循环、氧循环的概念,知道在尊重自然规律的前提下,人类的活动不会造成地球上的碳循环和氧循环失衡,生态环境会一直保持下去,因而,凯尔文的担心只是杞人忧天。这又是小概率事件转变为不可能事件的例子了。

 但是需要指出的是,这种小概率事件和不可能事件的区别,仅仅是哲学层面上的意义。在实践层面上,一旦认定某小概率事件是“无意义”的,那么它和不可能事件也就没有任何区别。这就像是用计算器计算,如果你不停地用2除1,在一直不断地按等号之后,最后肯定会得到一个零。尽管从理论上讲,“一尺之棰,日取其半,万世不竭”,但计算器把若干次操作之后的结果,和真正的零等同起来,也就说明小概率事件和不可能事件的哲学层次区别,不能简单地套用在实践中。

六、小概率事件的另一个层面性

 前面讲到了小概率事件有意义和无意义的一个层面性,即哲学层面和实践层面的区别。小概率事件的另一个层面性,是个体层面和一般层面的区别。事实上这也只不过是事物的种种矛盾中的一般矛盾和特殊矛盾的区别,但因为在我们讨论中的重要性,姑且把它提升到“层面”的高度来讨论。

 我们举一个通俗的例子。日本漫画《机器猫》中曾经有一个故事,野比看到电视上保护朱鹮的新闻报道,忽然意识到自己也是世界上独一无二的一个,于是要机器猫“保护”自己以逃避繁杂的功课享受童年的快乐,结果适得其反。这里面就存在个别和一般层面的区别。野比作为人类,只是一个个体,而人类则是一个一般层面上的概念。个体的野比的“灭绝”和一般的人类的灭绝,显然是不同的。

 同理,小概率事件作为偶然性的一种体现,只能起到补充和完善必然性的作用。如果承认历史唯物主义是正确的,人类社会的发展是客观的,那么社会规律必然是客观的,而作用在整体社会上的小概率事件,如果是起源于社会内部,而不是外部世界强加的不可抗力,就不会扭转人类社会本身发展的大势。但是在个体层面,这种小概率事件却可以扭转个人以至局部社会的命运。

 不错,有时候社会领域里的小概率事件确实给人一种“身不由己”的感觉。但是这种“身不由己”感只在个人层面上有意义,从整个社会的发展来看,它只不过是滚滚洪流中的一瞬间的浪花。在承认历史唯物主义的前提下,过分渲染这种“身不由己”感,如果不是文学式的感喟,就是历史相对主义对人的意识的夸大;而抹煞这种“身不由己”感,又落入了机械历史唯物主义的窠臼。

 所以,能够辩证地看待小概率事件,也是我们认识自然世界和人类社会,并更好地应用统计学和运筹学来解决问题的一个前提。

七、我们是不是该相信小概率事件? 经过上述的分析,下面我们来回答本文题目中的这个问题。

 所谓“相信”某事,最简单的解释是认为某事是真的,不怀疑。如果我们不去考虑现代心理学对相信这一意识行为发起的原因的探析,而仅分析它的表现形式的话,那么“相信”至少有两个层次:其一,仅仅停留在哲学层面上的相信,而不用它指导实践;其二,既是哲学层面上的相信,也是实践层面上的相信,即用这一所相信的理念来指导实践。

 显然,第一种相信对于指导实践是没有意义的,它所满足的,仅是一种内心的需求,一种纯思辩的愉悦。第二种相信则不仅仅达到这一点,而且将所相信的事物,用作自己行动的指南,并将这种指导实践的作用,作为发挥“相信”的能动性的重点。

 对于自然科学研究来说,因为实践是其重点,一切自然科学研究的理论都要符合实践,所以从科学实践的角度来讲,第二种相信才是真正的相信,第一种相信对此而言只能是“伪相信”。比如,有一些科学家信教,但是在科学研究里面,他们并不把那些独属于宗教的教义拿来实施,宗教只是他们科学实践以外的感性生活里的重要成分。因此,对于他们作科学研究这件事来说,宗教的信仰只能是一种伪相信。不过需要特别强调一点,本文中所有“伪相信”中的“伪”,对应英文的pseudo-,只是一个中性的前缀,不具贬义,因此不能说,伪相信就是不合理的。

 同理,上文已经论述,无意义的小概率事件对于实践不具指导作用。相信这种小概率事件只能起到对意识本身的能动作用,而对于实践,只能是一种伪相信。

 反过来,在人文艺术领域,因为不涉及以物质为客体的实践,上述伪相信和真相信的区别,也就没有必要。尽管在科学实践的立场上,人文艺术领域的相信都是“伪相信”,但这样讲显然是对人文艺术不公平的——因为人文艺术并不要求能指导实践。因此我们另换一种说法,称其为“人文式相信”更合适一些。可以说,人文艺术所孜孜追求的也就是人文式相信。但是把这种人文式相信上升到科学实践角度的真相信的层次,也即人文艺术越俎代庖地指导科学实践,就是一种错误的作法了。

八、违反上述作法导致的错误作法举例

 在本文的末尾,我们举两个今年发生的有名事件,以阐明违反上述作法会导致怎样的错误。

 “非典”期间,著名科幻作家王晋康先生写了一组文章,阐述自己的“平衡医学观”,并认为“非典”的爆发正是现代医学违反“平衡医学观”而引发的咎由自取现象。王文见网之后,立刻引发了留美生物学博士方舟子及清华大学教授赵南元、网人桔梗等人的抨击。方舟子以自己掌握的专业知识,论证了王晋康“平衡医学观”的荒谬之处;赵南元则重点批评了王晋康越俎代庖的行为。客观地说,王晋康的“平衡医学观”经过他自己的补充和发挥,是一套很有趣味的思想体系。最初,王晋康只是把这种思想体系应用到科幻小说创作中来,只局限在人文艺术的框架里,自然收到了很好的效果。因为那些不以科普为目的的科幻小说的本质是纯文学或通俗文学,科普以外的审美为第一要求,不用来指导实践,所以王晋康在小说中写这样的观点无可厚非,反而使他的小说因具备思想性而锦上添花。但现在王晋康把他的观点应用到实践层面上,意欲指导科学,从科学实践的角度来说,不管王是不是意识到这一点,都是犯了以伪相信为真相信的错误。

 又如中国科技大学校长朱清时在接受别人访谈时,称自己相信西藏喇嘛可以用内功融化披在身上的冰毯上的冰。这种相信对科学实践来说也只是一种伪相信。因为他所相信的事物,在没有外界不可抗力的作用下,足以被证明是一个不可能事件;即使在有外界不可抗力(如外星人之类)的作用下,也只能是一个小概率事件。如果真是外星人所致,前面已经分析,外星人和地球人打交道的概率不超过10^(-6),而外星人帮助喇嘛融化冰毯,概率只可能更低。这种小概率事件对于指导科学实践已经没有意义。但是朱院士在访谈中侈谈科学和哲学,并且以确凿的语气认为,喇嘛的拙火“就是科学”,这种认识显然也犯了以伪相信为真相信的错误,是伪相信性质的人文式相信在越俎代庖指导科学,所以是应当受批判的言论。公开发表这种言论,更是与朱清时的院士和科技大学校长身份不相匹配的。

 我想那些赞同王晋康或朱清时的人们,也应该慎重地考虑自己对这个
问题的认识是不是太简单。

生命起源进化的高概率事件:统计(生物)化学

摘要:生命的起源和自然进化有他自己的生命动力学--非线性动力学,他是有较高概率或较高条件概率的易发生事件,是信息进化,统计生物化学的结果,它有别于传统进化论的低概事件.

     从生物和非生物事件发生概率的角度看,传统的生物起源和进化观点都认为,生命的出现或创生是与无生命的物理事件雷同的等概率或低概率事件[1],P→0,或P=0,即生命的起源或进化是自然界中无数可能发生的事件(或组合)中极少或根本不可能发生的极低概率事件(或组合),P≈0?但从物理、化学(无机化学、有机化学)生物化学、生物等系统的发生、发展、演化的过程(进程)看,其各系统中特有事件发生的概率是逐渐增高的,并且有极高的专一性、特异性.从最初的经典物理--热力学、分子物理学的等概(均匀、均衡、一种几率、能量均分原理)事件,到量子物理的量子化(间断,分立)的概率分布----高低概率事件的混合;从统计物理学的"全同粒子的不可分辨性原理",到化学、生化、生物系统中实际存在的"非全同粒子的可分辨性(原理)"----"统计化学、统计生物化学、统计生物学",与非线性动力学--混沌学、分形学的间断、不连续、不等概率事件才是生物从无序、无生命的"东西(死物)"进化为有序、有生命的生物,及丰富的自然生物种群的机制!它是达尔文进化论的拓展,也是"信息进化"的新途径和轨迹.

    化学、生化、生物系统及统计(生物)化学是大大有别于物理系统或统计物理的,常有特殊高概率事件(化学反应,化学变化,Pch—×→0,即Pch≠0,Pch→a)发生的非物理、非等概事件的系统.(平庸的)物理变化、物理性反应中的质点或粒子常是(假设)无差别的.各粒子间的相互作用也是等同、无优先次序、无选择性的等概、同级、遍历或各态历经、"无智能"的均匀系统:无特殊事件--各事件都是均等的无差异共性事件(非线性有序物理过程除外).而化学、生化、生物界确到处充满了特殊事件(有差异事件)--个性事件"化学反应".生化、生物系统中的"质点、粒子"是有差别、不等同、有优先次序、有选择、有识别、非等概、多级、多层次、间断、跳跃、"有智能"、"不均匀"的系统或事件元、组的集合.

    1.物理事件的概率说

    物理系统中,系统处于第i种状态的概率(几率)Pi和物理量M取值Mi的几率是一致的.如果N是测量M的总次数--微观状态总数或粒子总数,ni是测量中发现M取Mi的次数或第i种状态下的微观状态数或粒子数,则

    Pi = lim (ni/N)

        N→∞

    对于状态是连续变化的系统,量M从M到M+dM范围中的值的概率是

    dP(M)=ρ(M)dM                                                   

式中ρ(M)是概率密度或概率分布函数。有平均概率Pi和平均状态或平均粒子数ni,及信息(状态)守恒或不灭律.

    在经典统计物理中遵从"能量均分原理",Pi基本与平均概率Pi一致,即Pi=Pi.对量子统计有"准经典的近似"方法,相空间中粒子数的分布函数,及最可几分布问题(函数,概率).多用平均粒子数ni表示.

     2.化学事件的概率:"统计化学"的起源

    对于可逆的化学反应系统:

    A+B←→C+D

两两"粒子"间的碰撞(反应)总数共有N=42=16种.其中,粒子A与A、B与B、C与C、D与D、A与C、B与D间的碰撞(反应)与物理系统类似,不发生化学反应,算无差别、无差异的同一或等同状态,即每一对碰撞的物理状态数Nph=1=NAA=NBB=NAC=...,产生物理碰撞的概率Pph=Nph/N=1/16=0.0625,及Pp=12/16=3/4=0.75,但是,它们发生化学反应的概率是Ppc=Npc/N=0/16=0;而A与B、C与D不同于物理碰撞,可发生化学反应,并且比A-A、B-B、C-C、D-D等间的作用更优先、更强烈,且具有选择性、高亲合力和针对性(特异性).其A+B或C+D的化学碰撞--反应的状态数各为2=NAB=NCD,合并的化学状态数Nch=4,故此系统发生化学反应(碰撞)的概率为

     Pch=Nch/N=4/16=1/4=0.25, PAB=PCD=2/16=1/8=0.125

显然,化学反应的机会较不发生化学反应的机会(物理碰撞-无化学-特殊反应或有差异的变化)大许多,Pch>Pph、PAB=2Pph、Pch>>Ppc=0.显示了化学(信息)是比物理学的进化程度更高的系统(机会、概率增加);化学合成、分解反应是较物理过程为高的概率事件---有偏概率,或有较高的条件概率。

      3.生物化学事件的概率:"统计生物化学"

    在生物化学系统中,生化反应可有:

    ∑Ai=∑Bj,        (i=1,2,...,m;j=1,2,...,n.m=n或m≠n)

若生化、化学反应与物理状态的总微观状态数是N=Nph+Nbio(信息守恒律[2]),生化、化学反应的微观状态数Nbio=∑NAi+∑NBj;显然,物理碰撞发生化学或生化反应或向生命(人工机器人除外)进化的概率为Pphch=0,则发生化学、生化反应状态的概率

    Pbio=Nbio/N=∑Pbioi=∑Nbioi/N

    Pbioi=Nbioi/N,  Pbio+Pph=1

Pbio>>Pphch=0,生化反应过程的概率高于普通物理过程的概率,就象DNA中互补的碱基对腺嘌呤A-胸腺嘧啶T、鸟嘌呤G-胞嘧啶C优先(高概率、概率权重高)结合拷贝复制,碱基对又与相对应的蛋白质-氨基酸优先(高概率、非等概)结合组装蛋白;及其它的生化反应和生化循环等.生物、生化反应的"较高概率事件"或条件概率--信息进化(Pch、Pbio↑;Pbio≠0、Pbio-/→0)、信息统计,才是生命起源和生物进化的关键机制和动因.

     4.生物、生命事件的概率--分形分维

    生物化学是生命,生物学存在的基础.生化反应的历程、轨迹、路程,不是遍历无缝隙、连续的,就象公路、河流、血管(高概率的通道路径,与不完全充满或占有二维平面的部分面积的低概率的通道周边田野的混合。“……走的人多了,就形成了路”);也有她自己最可几的起源、进化,生成、生长的固定路线、程序或概率分布(规律),和她自己固定的自然演化的轨迹、路线和方式,如非线性动力学(方程):DNA的复制:N=2N(N=1,2,3,...m),细胞分裂;生物的繁衍,生物种群分类(分类树,类别:种、属,、门、纲),人口,种群的消长:Xn+1=μXn(1-Xn)--非线性、混沌、分叉、分形、分维等.其(化学、生化、生命起源、进化机制的)非线性动力学的概率分布函数或统计分布函数有

    P(Xi)=F(xi)

    对离散随机生命变量

    P(X1<Xi<Xn)=Fn(x)=∑P(xi).

    对连续随机的生物(生化,信息)变量

                X1

    P(X1<ξ<X2)=∫ρ(x)dx

                X2

ρ(x)是分布密度.总∑P(xi)=1,∑ni=N,信息(状态)守恒不灭定律[2].生命起源进化的非线性动力学轨迹,其填充度是非全满的--不会填满全部的可能性空间,机会(概率Pi)不均等,有高概率事件(有利进化事件)和低概率事件之分.她的分形维数:信息(概率)维数等常有非整数,分数维数,及非等概特征Pi≠Pj.他们趋向演化进化(有序,轨迹线上)的概率高于非演化(无序,平衡态,线外--田野)的概率.生物起源与进化正是在这较高概率(线)条件下的非线性"信息进化"才有可能"自然"形成有序生命,并"战胜,克服"无序熵增倾向,建立了有序,丰富的生物种群和多彩世界.

    生命起源和进化遵从它自己的内在规律性或生命的动力学(非线性),就象物理,化学等自然现象一样有同源性,即"非线性动力学--混沌,分形论"的机制.其生命起源进化的非线性非一维的决定论确定性动力学公式中蕴含着(不均衡)随机性--不确定性,而复杂"不确定""随机性"的生命活动中又潜含着决定论的确定性:奇怪吸引子(吸引点,线,面,体),"无形的手";排斥子.生命有它自己的非线性(非一维,非二维,非三维性)的发展进化路径,轨迹.在这轨迹(线)上的事件发生或保留的概率就高,线外的事件发生或存活的概率就低.

    无生命的物理,化学世界中广泛存在着类似生命进化的有序分形的形态发生,有规律的分形生长、随机行走、全息自相似的复制、凝聚、结晶等.无生命、无智能的煤灰、粉尘也能有"规则"漂亮的分形凝聚,即有一个凝聚中心(种子、元胞、分形元、分形子)点的"粒子-粒子凝聚(PPA,PARTICLE-PARTICLE AGGREGATION)模型",又叫"扩散-限制凝聚(DLA)模型";和多中心点(起点、起源)的"集团-集团凝聚模型(CCA,CLUSTER-CLUSTER AGGREGATION)",又称"动力学集团凝聚模型(KCA)".生命的起源和进化也与上述无生命单组份尘粒的有序单层次的物理凝聚类似,但他们是复杂性更高,组份和层次更多的化学-物理混合,复合型的"点(粒子)-集凝聚(PCA)和分形生长(模型)".从无生命的尘埃粒子可以粘附聚集("吸纳吃饭")、解聚(排泄)、"复制、代谢"成有序(无生命)形态的功能结构和分界--壁、膜的前身;无生命的"生命分子"--点也能PPA1凝聚合成-分解,复制,代谢生成有序有功用的分形"生命前组元(组合,集合)";许多"生命前组元"--集团又非线性的CCA1聚合-分解、复制、代谢长成"生命初体",进而PCA1或CCA2成"生命基本单位(细胞)"和壁或膜(生命分界),直到生命细胞再多层次的PCAn或CCAn生长自造出更高的有序全息的"生命单元",如人.无生命的质点的简单的初始功能单元,如结合-分解,和细胞中功能分化的各种细胞器,如吸收-消化、信息、产能等单元,与人的更高度分工的组织、器官、系统,有着从小到大,从低级到高级的自相似、准全息的对应--分形关系:高概率的对应关系.生命的发生、发展,起源、进化走着一条"上帝(自然原动力的非线性动力学的法则.看不见的妖)"制定的较高概率的发生发展、生长变化的优化、优势的优选途径--生命起源进化的新假说:(高概率的非一维--非线性的)生命动力学起源进化模型.

     参考文献

    1.A.G.CAIRNS-SMITH,SEVEN CLUES TO THE ORIGINE OF LIFE,CAMBRIDGE UNIVERSITY PRESS,1985.

    2.邓宇,邓海,生物-非生物界的信息守恒律与双大循环世界图景.数理医药学杂志,2000,13(1):88-89。

生命与非生命的本质区别

热效率趋向100%的能量利用新途径:I.从无序到有序

热效率趋向100%的能量利用新途径:II.量子化内能的分解

量子论新诠释: I.波粒统一的纯物质的物质波

时间本质随宇宙变化

信息守恒律conserva

现代中医基础理论创新研究

项目概率分析中的抽样技术

在项目管理中,我们经常需要进行不确定性分析,概率分析是通常使用的重要的方法。概率分析的一个重要的问题就是抽样问题。

  抽样用来在一个概率分析模拟中从概率分布函数中生成可能的值,然后用这些可能值的集合去评估对象。因此,抽样是概率分析对于工作对象模拟所做的成百上千次的“如果… 就..”的方案计算的基础。每个样本集合代表了可能发生的输入值的可能组合。选定一种抽样方法既关系到结果质量,也影响到模拟所需要的时间长度。

什么是抽样?

抽样就是从输入概率分布中随机地提取值的过程。在概率分析中概率分布是用概率分布函数表示的,而抽样是由概率分析程序执行的。在一个模拟中抽样反复进行,每次迭代从每个输入概率分布中提取一个样本。通过足够次数的迭代,为一个概率分布抽样的值变成分布性的,众所周知的输入概率分布。抽样分布的统计量(均值,标准偏差和高次动差)接近于对于分布真实的输入统计量,抽样分布图也像一个真实输入分布的图。

  统计学家和实践家为提取随机样本已开发了各种技术。当评价抽样技术时,要考查的重要的因素是通过抽样正确地再现一个输入分布所需要的迭代次数。模拟输出分布的正确结果依赖于输入分布的完整抽样。如果一种抽样方法比另一种方法需要更多的迭代次数和更长的模拟运行时间才能近似于输入分布,它就是效率差的方法。

  在概率分析中可以使用两种抽样方法—— 蒙托卡罗抽样和拉丁海波库比抽样。这两种抽样方法在抽样的值集合近似于输入分布真实分布时所要求的迭代次数是不同的。蒙托卡罗抽样经常要求大量的抽样才能近似于一个输入真实分布,特别是如果输入分布是高度偏斜或具有某些低概率的结果时。拉丁海波库比抽样是在概率分析中使用的新的抽样技术,它集中在更接近于输入真实分布的样本上,使输入分布的抽样统计量上更快逼近于输入真实统计量。

概率累积数分布

当考察不同的采集方法时,首先了解一个概率累积数分布是有帮助的,任何概率分布都可以用累积形式表示。一个累积曲线在y轴上的典型的刻度为0到1,y轴的值代表相应于x轴值的累积分布。在累积曲线上方,0.5累积值是50%累积概率的点(0.5=50%)。一个分布中有百分之五十的值落在这个中值之下,另百分之五十落在其上。0累积值是最小值(0%的值落在这一点之下)。1.0累积值是最大值(100%的值将落在这点之下)

  为什么这个概率累积曲线对于理解抽样是那样重要呢?累积曲线的标尺0到1是在抽样期间产生可能的随机数的范围。在典型的蒙托卡罗抽样中,计算机将生成一个0到1之间任何的一个数都具有同等发生的可能性的随机数。然后,用这个随机数从累积曲线中选出一个值。例如,上例中,如果一个0.5随机数在抽样期间产生出来,分布中取样值会是X1。因为累积曲线的形状是基于输入概率分布的形状的,它的结果是什么样,则采集的样本就是什么样。比较多的结果在累积曲线急剧变化的范围内。

  蒙托卡罗抽样蒙托卡罗抽样指的是从一个概率分布中使用随机数或伪随机数抽样的传统技术。术语蒙托卡罗是在二次世界大战期间研究自动炸弹相关的模拟的代码名字而引入的。如今,蒙托卡罗技术被应用到了有随机发生的情况的各种复杂问题上。现在有很多算法从不同类型的概率分布中产生随机样本。蒙托卡罗抽样技术是完全随机的——即任一个给定的样本可能落入到输入分布范围内的任何地方。当然,更多的样本是提取自具有比较高发生概率的分布区域内。在早些时候所述的累积分布中,每个蒙托卡罗样本使用一个0到1之间的新随机数。经过足够次的迭代,蒙托卡罗抽样技术通过抽样重新生成输入分布。但是,当执行少量的迭代时一个堆聚问题就可能显示出来。如果抽样5次的话,可能5个样本都落入在分布的中部。分布外围的值在样本中没有表示出来,因此,他们对结果的影响也就没有包括在的模拟输出中。

  当一个分布包括对结果会有重要影响的低概率结果时,堆聚就变得特别需要关注。包括这些低概率结果是很重要的。为此,必须为这些结果抽样。但是,如果他们的概率太低的话,少量的蒙托卡罗迭代采不到满足这些结果的数量的样本去正确地代表他们的概率。这个问题导致了开发一种像在概率分析使用的拉丁·海波库比那类的分层抽样技术。

拉丁·海波库比抽样

拉丁·海波库比抽样是最近新开发的抽样技术,它试图同蒙托卡罗相比以较少的迭代次数通过抽样正确地重新生成输入真实分布。拉丁·海波库比抽样的关键是输入概率分布的分层化。分层就是把累积曲线在累积概率标尺(0到1)上划分为相等的间隔。这样,一个样本就随机地取自输入分布的每个间隔或分层。抽样被强制为要代表在每个间隔中的值,因此,也就强制它重新产生输入概率真实分布。

  在上述的例子中,累积曲线被划分为5个间隔。在抽样过程中,从每个间隔中取出一个样本,将它和使用蒙托卡罗方法提取的堆聚的5个样本比较一下,用拉丁·海波库比抽样方法,样本集能更正确地反映输入概率分布中的值的分布。

  在拉丁·海波库比抽样期间使用的技术是“无替换抽样”。累积分布的分层数等于执行的迭代次数。在上述例子中迭代次数为5,因此把累积分布划分为5个层次。从每个层次中取一个样本,并且,一旦一个样本从一个层次中取出来,就不再从这个层次中再取样本——它的值已在抽样的集合中了。

  在一个给定的层中是怎样抽样的呢?实际上,概率分析为抽样先选出一个分层,然后,在选定的分层内随机选出一个值。

当使用拉丁·海波库比从多个变数中抽样时,重要的是维持变数之间的独立性。为一个变数取样的值需要独立于为另一个变数取样的值(当然,除非明确地想让它们相关)。这种独立性是通过随机地选择间隔为每个变数提取一个样本而维护的。在一次给定的迭代中,变数1可能从分层#4抽样,变数2可能从分层#22抽样,等等,这就维持着随机性和独立性,并且避免变数之间的不希望的相关。

拉丁·海波库比和低概率分布抽样结果

  作为一个比较有效的抽样方法,就提高抽样效率和加快运行时间(比较少的迭代)而言,拉丁·海波库比提供了巨大的优越性。这些优越性在一个基于PC的模拟环境中(如概率分析)是特别引人注意的。拉丁·海波库比也帮助分析概率分布中描述有低概率结果的情况,通过强制模拟的抽样去包括远离中心的事件,拉丁海波库比抽样保证在模拟输出中它们正确地描述了输入分布。

  当低概率结果非常重要时,它经常帮助去运行一个模拟低概率事件对输出分布的贡献。在这种情况下,模型模拟低概率结果的发生机会,通过这种方法可以隔离这些输出,并且直接地研究他们生成的结果。

  测试这些技术收敛概念被用来测试一种抽样方法。在收敛点,输出分布是稳定的(附加的迭代并不明显地改变抽样分布的形状和统计量)。抽样均值和实际均值比较是一种典型的收敛测试方法,但是也常用偏斜度、百分位数概率和其他统计量。

  概率分析提供了一个很好的环境测试两个可用的抽样技术在一个输入分布上的收敛速度。当为一个模拟输出选择一个输入分布函数时,每种抽样技术运行一个同等迭代次数数。使用概率分析里内置的收敛监视功能,查看运行多少次迭代使百分位数、均值和标准偏差稳定。这应当证明拉丁海波库比抽样收敛比蒙托卡罗在真分布上收敛更快。

数学文化录入:admin    责任编辑:admin 
  • 上一篇数学文化:

  • 下一篇数学文化:
  • 【字体: 】【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)

    | 设为首页 | 加入收藏 | 广告合作 | 电子邮局 | 联系站长 | 友情链接 | 版权申明 | 管理登录 |