博弈论的起源和发展

  博弈论的起源和发展

  很多学者想追溯博弈论的起源,但是针对这个问题并没有一个公认的答案。如果按照把博弈问题应用到决策问题和对决策问题的研究标准,那么可以说博弈论的历史非常悠久。因为在人们的日常生活和生产中常常都会进行博弈分析。有文献记载的最早具有博弈思想的事例可追溯到两千多年前我国的“齐威王田忌赛马”、一千五百年前巴比伦犹太教法典中的“婚姻合同问题等。如果按照现代经济学和博弈论中经常引述的最早包含博弈思想的文献标准,古某某1838年关于寡头之间通过产量决策进行竞争的模型可以看做博弈论早期研究的开始。

  最早的博弈思想对只有策略依存特点决策问题的研究可上到18初甚至更早2000年前我国古代的“齐威王忌赛马”1500年前巴比伦犹教法“婚姻合问题”1838年古某某头模型,1883年特兰头克争模型。

  博弈论的形成:对于一个理论的真正发展来说,仅有一些零星的研究还是不足以发展出博弈论的理论体系的,更重要的不是谁曾经有过零星的研究,而是谁的工作或者文章发表以后,它的思想或方法就引起了人们的兴趣和重视,并开始有越来越多的追随者。就像哥伦布并不是到达美洲的第一人,但却因为他的发现新大陆没有失落过,所以哥伦布享有发现新大陆发现者的荣誉。同样的道理,冯?诺依曼和摩根斯坦1944年出版的《博弈论和经济行为》,应该被看做博

  博弈论的成长和发展:上世纪40年代末到90年代是博弈论成长、发展到成熟的重要阶段。除了理论发展自身规律的作用以外,全球政治、军事、经济特定环境条件的影响,以及经济学理论发展本身的需要等,都起了重要的作用。40年代末到70年代末博弈理论体系比较乱,概念和分析方法很不统一,在经济学中的作用和影响比较有限,但博弈论研究的繁荣和进展非常显著,是80、90年代博1950年纳什提出“纳什均衡”概念和证明纳什定理,发展非合作博弈的基础理论。1950年MelvinDresherMerrill和Flood在***(美国空军)“囚徒的困境”实验,HowardRaiffa独立进行这个实验;1952-1953年期间L.s.Shapley和DB.Gillies提出“核”作为合作博弈的一般解概念。Shapley提出了合作博弈的“Shapley值”概念等。弈论成熟和对经济学革命的基础。

  第一个研究高潮(本世纪40年代末和50年代初)奥曼(R.j.Aumann):“40年代末50年代初是博弈论历史上令人振奋的时期,原理已经破茧而出,正在试飞它们的双翅,活跃着一批巨人。”

  1950年纳什提出“纳什均衡”概念和证明纳什定理,发展非合作博弈的基础理论。1950年MelvinDresherMerrill和Flood在***(美国空军)“囚徒的困境”实验,HowardRaiffa独立进行这个实验;1952-1953年期间L.s.Shapley和DB.Gillies提出“核”作为合作博弈的一般解概念。Shapley提出了合作博弈的“Shapley值”概念等。

  1960年(Thomas.Schelling)的《冲突的策略》(TheStrategyofConflict)对社会经济军事等各方面。问题的博弈分析,引进了“焦点”(Focalpoint)的概念。博弈论在进化生物学(EvolutionaryBiology)中的公开应用也是在60年代初出现的。

  博弈论发展的青年期(50年代中后期一直到70年代)1954-1955年提出了“微分博弈”(Differentialgames)的概念。奥曼则在1959年提出了“强某某”(Strongequilibrium)的概念。“重复博弈”(Repeatedgames)也是在50年代末开始研究的,这自然引出了关于重复博弈的“民间定理”(Folktheorem) 塞尔腾(Selten)1965提出“子博弈完美纳什均衡”(subgameperfectNashequilibrium)■塞尔腾1975年提出“颤抖手均衡”(Tremblinghandperfectequilibrium)海萨尼(Harsanyi)1967-1968三篇构造不完全信息博弈理论的系列论文,“贝叶斯纳什均衡”(BayesianNashequilibrium。海萨尼1973年提出关于“混合策略”的不完全信息解释,以及“严格纳什均衡”(StrictNashequilibrium)。70年代“进化博弈论”(Evolutionarygametheory)的重要发展,(JohnMaynardSmith)1972年引进“进化稳定策略”(Evolutionarilystablestrategy,ess)等“共同知识”(Commonknowledge)的重要性,因为奥曼1976年的文章引起广泛的重视。

  从1944年至今博弈论在理论和应用方面都有长足发展,日臻完善。理论方面经历了从零和二人博弈发展到非零和n人对策。近10多年来特别在人合作对策方面的研究进展很快。应用方面涉及军事、政治、经济学、社会学、心理学等众多方面。特别是近年来在经济学方面得到了重要应用包括市场竞争、经营决策、企业管理、寡头市场、费用分摊等在军事方面如兵力分配、战前冲突前景分析、空战模型等均涉及博弈论问题在政治方面如竞选、政治谈判、联合、选举等也均与博弈论有关。以博弈论学科体系的一些主要标志和特征为依据我们可以把博弈论发展历史分为以下四个阶段:

  第一阶段萌芽期:20世纪30年代以前人们关于利益冲突方面的研究是分散的、初步的、零星的有很大程度的随意性但博弈论的萌芽就孕育于某某。如我国2000多年前的《孙子兵法》;田忌赛马1500年前的巴比伦犹太法典中的“婚姻合同问题“等19世纪30年代古某某的两寡头垄断竞争研究齐默多与波雷尔的象棋对弈斯坦克尔伯格的不完全竞争研究:1928年冯诺依曼的合作对策研究中的特征函数法等。

  第二阶段成立期:1944年的TheoryofGiamesandEconomicBehavior发表创立了对策论的科学体系被视为博弈论的真正起点。该著作概括了经济主体的典型行为特征引进了对策论的展开型、正规型即策略型、矩阵型表示定义了极小极大解并说明了这种解对所有二人零和对策都存在提出了稳定集解的概念及分析方法。该书在总结以往博弈论研究成果的基础上给出了博弈论研究的一般框架、概念术语和表述方法创立了较系统的博弈理

  第三阶段发展期:该阶段从20世纪40年代末到20世纪70年代末也是博弈论发展极为重要的阶段。尽管该时期理论仍未成熟理论体系还比较乱概念与方法很不统一且在经济学中的作用与影响比较有限但该时期对博弈的研究却是进入了一个崭新、辉煌的时代。我们分为两个时段1.20世纪40年代末一50年代初发展期中的少年时代。主要成就有纳什Nash于1950年提出的非零和博弈、非合作博弈理论的奠基石一纳什均衡、纳什定理;MelvinDresher和MerillFlood(1950)在美国***进行的“因徒困境:L.s..Shapley和D.BGillies于***年提出的“核core)作为合作博弈的一般解L.s..Shapley提出的“shapley值等2.20世纪的50年代中期-70年代末发展期中的青年时代。该时段产生了许多重要成果如微分博弈”、“强某某、“民间定理其中最为重要的有:1965年Selten提出了在局中人选择相机选择”的博弈中不是所有纳什均衡都是合理的因为可能存在“空头威胁问题并提出用子博弈完美纳什均衡对纳什均衡作完美精练的思想以及1975年提出的“颤抖手均衡概念。Harsanyi于1967-1968完成的具有极其重要地位的成为信息经济学奠基石的三篇论文,创建了不完全信息博弈理论是个里程碑式的成果;以及其1973年提出的“混合策略的不完全信息解释和严格纳什均衡。》进化博弈论的发展进化稳定策略”。

  第四阶段成熟期:20世纪80、90年代是博弈论走向成熟的时期。其发展已进入前所未有的辉煌时期博弈论重构经济学大厦的趋势正逐步变为现实。在经济学中的应用领域越来越广泛并正以主流经济学的面貌出现。引进及Auma1976年的“共同知识均为70后代中最重要的事件。

  博弈的概念

  博弈本意是:下棋。引申义是:在一定条件下,遵守一定的规则,一个或几个拥有绝对理性思维的人或团队,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。有时候也用作动词,特指对选择的行为或策略加以实施的过程。

  博弈论(Game Theory),博弈论是指研究多个个体或团队之间在特定条件制约下的对局中利用相关方的策略,而实施对应策略的学科。有时也称为对策论,或者赛局理论,是研究具有斗争或竞争性质现象的理论和方法,它是应用数学的一个分支,既是现代数学的一个新分支,也是运筹学的一个重要学科。目前在生物学、经济学、国际关系学、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。主要研究公式化了的激励结构(游戏或者博弈(Game))间的相互作用.

  博弈论考虑博弈中的个体的预测行为和实际行为,并研究它们的优化策略。

  博弈论的故事与寓意:

  案例一:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。分析:每个博弈方选择自己的策咯时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白;假设囚徒B选择的是坦白,则徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来最大的利益。

  最终结果两博弈方同时选择坦白的策略。

  案例二斗鸡模型;

  有两人狭路相逢,每人有两个行动选择:一是退下来,一是进攻。对每个人来说,最好的结果是,对方退下来,而自己不退。

  案例三:智猪博弈

  猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

  那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

  原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强某某,所以只好亲力亲为了

  名词解释:

  上策均衡:指一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么这个策略组合肯定是所有博弈方都愿意选择的,必然是该博弈比较稳定的结果。

  严格下策反复消去法:在一个博弈中,通过把比较差的策略排除掉,缩小候选策略范围,能更容易筛选较好策略的方法。

  划线法:是指通过在最佳决策得益下划线分析博弈的方法。

  箭头法:指对于每一种战略组合,检查是否有参与人会偏离这个战略组合,直至找出没有参与人会偏离的战略组合的方法。

  纳什均衡:指在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。

原创文章,作者:蜗梵百科,如若转载,请注明出处:https://jxwofan.com/zatan/16812.html