博弈论的书心得体会

2017-03-19

博弈论是一门深奥的学科,对于哲学家来说它是哲学,对于军事家来说它是一本兵书,对于文学家来说它是另一个《浮士德》,这就是博弈论。下面是带来的博弈论书心得体会,欢迎查看。

博弈论的书心得体会一:

近日整理书橱时,我偶然看到了在东北财经大学学习研究生课程时所学的《博弈论》这本书。当时我们很幸运,学院特意选了东北财经大学优秀教师 史永东 教授来讲授这门课。 史 教授是当时东北财经大学最年轻的教授(时年 35 岁, 32 岁时就破格晋升为教授),他把 一门很深的学问给我们讲得惟妙惟肖,非常生动。直至今日随手翻阅时,仍能清楚地记起他讲课时激情洋溢的风采,但如今重新阅读这本书却有了不同的感受,当时是为了掌握其中的理论,现在则可以比较从容地去体会其中的道理了。

博弈论是一门很深的学问,主要研究个体如何在错综复杂的相互影响中得出最合理的策略,其应用的领域也非常广,最通常的应用该是经济学吧。这本书中的理论很深奥,其数学模型的推导更是复杂,然而书中的案例却既浅显又生动,很值得一看。现在拿出一个例子来,和大家一起分析其中的道理、分享其中的趣味。

这个例子是“智猪博弈”的故事,讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的食物数量和踏板与投食口之间的距离。 如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。

改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。

改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。

改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。

这个故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。

书中还有很多例子,并进行了分析,我们都能悟出些道理。所以读的时候会有一个感觉,那就是先有事实,后由理论。也就是我们常说的理论来源于实践。感觉就像是先有这个社会现象,然后才有这个理论去分析,这个理论套在这个社会现象上恰好合适。

博弈论的书心得体会二:

博弈小术语: 收益矩阵、均衡、纳什均衡、零和

博弈论,也称互动的决策论。它的基本假设之一是人是理性的。但现实并非如此,人不可能具有完备的知识也不可能时时理性。尽管如此,人们仍然乐意用博弈论的方法来解释和分析现实社会现象。

每一次的人际交往都可以简化成两个基本选择:合作或背叛。比如在前面的日志里提到的囚徒困境,在人际交往中普遍存在囚徒困境:双方明知合作能带来双赢,却因为理性的自私和信任的缺乏而导致合作难以形成。当一次性博弈出现时,人们往往会选择背叛。这在现实生活中也有很多例子,比如飞机场,为什么食品价格敢定那么高呢?因为它知道候机的乘客不会是它的长期客户。而当博弈的终点不可知时,就又是另一回事了。

在多次博弈中,背叛仍不可避免,但合作的几率会相比一次博弈有提高。至于如何更加有效地减少背叛,一种办法是引入惩罚机制,可以是带剑的法律或温和些的道德约束。现实中的集体活动等候上车问题就是个例子,让那些迟到的人自己负责任就是一种惩罚措施。

当然,如果在开头就有一些“善意”的人出来表明合作态度对提高合作机会也是有帮助的,不管这些“善意”的人是出于何种目的。一旦合作开始,人们就能体验到合作的好处,并乐于坚持一段时间。至于时间的长短,关键是看博弈的终点是否明确。这在上面也提到了,如果终点明确,人们就会倾向于在最后一次背叛。而当大家都知道对方会这样想时,倒数第二次就会成为新的终点,新的背叛。如此反复推演,合作从一开始就很难形成。注意上面的论述是基于没有惩罚机制的基础。

有一个很有意思的实验,是由爱克斯罗德完成的。这是一个计算机模拟竞赛,参赛的62位科学家递交了自己写的关于博弈策略的代码,同时加上爱克斯罗德本人写的一个随即策略代码,共63个。结果表明,“前15名中只有第8名是非善意的程序,最后15名只有一个善意的,夺魁的是“一报还一报策略”。

这个实力不凡的“一报还一报策略”就是对方选择什么我就回应什么,你合作我就合作,你背叛我也背叛。这种策略体现的是“善良、可激怒、宽容、简单”等好品质。虽然该策略在每次对局中分数都不能超过对手,但它的总分却是最高的。它赖以生存的基础很牢固。而那个非善意程序的成功是建立在别人的失败之上。可以想像,如果赋予这些程序以进化的基因,久而久之,非善意程序的存活率将下降。

博弈论的书心得体会三:

上次讲了几种同时行动博弈,其中的一种就是协调博弈。这一次专门讲协调博弈中的一种非常值得关注的情况:大规模协调博弈。在协调博弈中,局中人必须同时采取行动才能实现效用的最大化。而在大规模的协调博弈中存在一种网络的外部性,也就是是指拥有产品的人越多,这种产品的价值就越高。

当一种产品被赋予某种交流与流通的功能的时候,它常常就会具有这种外部性。比如说电话。如果只有你自己有电话,而你认识的人都没有,那电话对于你就只是一个摆设,什么用处都没有。而你周围使用电话的人越多,这部电话所起的作用就越大。我早先使用QQ的时候也是如此。那时候我是周围最早申请QQ号的,可是申请了之后却不知道和谁聊天,只好见到一个在线的就加上。到后来同学都开始用QQ了,QQ才开始成为我一个重要的联络工具。现在做科研的估计都会说微软的东西很难用,不管是操作系统还是office软件,我也很想学Linux,学TeX,但是一想到工作中别人用的都是windows和word,很多软件只有windows版本的,我用个TeX写的东西别人还打开不了,于是只好作罢。网络的外部性使得一个新的用户在选择产品的时候不光要考虑这个产品本身的好坏,还得考虑这个产品被使用的广泛性。

这种网络外部性的存在使得市场的先进入者具有后进入者不可比拟的优势。当一个具有交流功能的产品真正流通起来以后想打倒它是一件很困难的事情,比如你很难想象百度hi会取代腾讯QQ的领先地位。网络的外部性会长期的保护领先者的地位,因此,这类产品,进入市场的时候就应该不惜代价扩大用户群,以获取领先地位。有一种说法说盗版帮助了微软,没有盗版就没有微软如今在中国市场上的垄断地位,而微软一定程度上默许了盗版的泛滥,因为这对建立微软的市场地位是有利的,网络的外部性也终将会弥补微软因为盗版受到的损失。到如今微软在中国已经竖立起了垄断地位,对盗版的打击力度便开始加大,频频对政府施压,要求政府采取措施。

面对网络外部性,市场的后进者也并非是全无办法,但通常的办法都是比较消极的,以求避开外部性壁垒。这其中最常见的一种办法是使自己的产品与先进入者的产品兼容,这样就能够共享网络的外部性。例如AMD所制造的CPU在功能上就几乎和Intel的没什么两样,从而得以抢到Intel的一小块市场。这种方法有很大的局限性,因为后进者并不能完全获得先进入者产品全部的技术参数,这种兼容肯定不是完全的。还有一种办法是瞄准剩余市场。在先入者势力不及的地方开辟敌后根据地,以求将来能够农村包围城市。例如苹果在小学生使用的个人电脑上占有相当大的市场份额。

相比之下,中国移动采取了一种相对主动的办法。它开发出了与手机号码绑定的TM产品Fetion,希望能够利用自身在移动通信上的网络外部性来挑战QQ在传统的TM上的网络外部性。至于效果如何,目前我还不知道,:(

网络的外部性也不是坚不可摧的,至少在计算机领域,计算机产品的快速淘汰会限制网络外部性的好处。如果你的公司开发了一种新的计算机,而且不想使用现有的软件,但是你能够让软件公司相信你的计算机能够一炮走红,他们就会愿意编写新的软件让你的计算机使用。另外,技术的快速进步带来的向后兼容性问题也会对目前的领先者造成挑战。兼容性的要求使得微软和因特尔的产品非常的臃肿,而新的进入者反而没有这些的束缚,因而可以提供更小巧灵活的产品。看起来向后兼容性像是一个幸福的烦恼。

更多相关阅读

最新发布的文章