今天推荐的文章是《中美最优的策略就是符合博弈论,而不是什么学刘备》 在这篇文章之前,西风写了一篇文章,讲的是他去青少年宫接自己的孩子, 因为青少年宫人很多,所以停车就是个麻烦事, 他以往都是先停好车后,然后发短信告诉他儿子具体的位置, 他儿子回复短信后,再过来找他, 但有一次他儿子的电话手表突然没电了(事后才知道), 就无法回复西风的短信。 西风就趁着还没下课,去教室找他儿子, 但他儿子又提前下课出去找西风去了, 两父子完美错过。 所以西风就以“老父亲”的口吻跟他儿子说了基于博弈论, 他最优的策略应该是什么什么……之类的一番话。告诫儿子要养成思考的习惯。 但后来引发了网友的大量讨论, 当然很多讨论不再是基于博弈论,而是基于“情绪”了。 后来,美国关闭了中国的一个领事馆,中国也关闭了美国一个领事馆, 这个博弈论话题又再次提起。 相当于这位网友认为,中国对美国的外交策略应该是学他认为的刘备“不吭声,很记仇”。 看这个描述应该就是指“韬光养晦”和“君子报仇十年不晚”。 相当于就是沿袭老一辈的某些外交战略。 我们并不是一个时事评论栏目,且对这块也不懂,所以还是“莫谈国事”。 但就西风回答的内容来看,他指出的博弈方法论应该是“一报还一报”。 而这个具体的博弈策略是如何来的呢?这是一个漫长的故事: 博弈论于 1928 年由冯·诺依曼提出,最先讨论的都是“合作博弈”理论, 后来通过很多牛人的完善,发展成了一门独立的学科。 我们普罗大众比较熟知的人物有纳什, 他因为提出了“纳什均衡”而获得了诺贝尔奖,同时也开启了“非合作博弈”理论研究。 而电影《美丽心灵》讲的便是他的故事。 后面也有人基于纳什的一些研究,提出了很多博弈论方面的有趣思考。 最有名的莫过于“囚徒困境”。可能有许多不同的版本,但都大同小异, 简要描述就是: 两个犯人被抓, 如果双方都招供,证据确凿,则两人各判3年; 如果一方招供一方不招,那么招供的一方将功赎罪立马释放,不招的一方判5年; 如果双方都打死不招,则证据不足,各判1年。根据上面的三个条件,作为有“上帝视角”的你, 当然知道双方都不招供,对于这两个人来说,会是最优解。 但我们也知道现实情境中,会变得很复杂, 例如,如果是一对彼此恩爱的“雌雄大盗”,他们彼此情比金坚,那大概率是彼此都不会招供; 如果是两人认识不久,关系不咋样,那“彼此出卖”几乎会是确定性事件; 这里面如果把罪犯人数由 2 人变成 100 人,那问题就更加复杂了。 但就是有人问题越复杂,他越喜欢研究。 有个叫罗伯特·阿克塞尔罗德的哥们, 他是著名的行为分析与博弈论专家,也是美国科学院院士。 特别擅长运用计算机模型来分析社会和科学问题。 他就把“囚徒困境”用数学建模的方式做成了一个游戏, 为了方便计算,他把模型用分数表示,并简化为: 如果两个人相互合作,各得3分; 如果一方合作一方背叛,那么合作者得0分,背叛者得5分。 如果两个人相互背叛,各得1分;可以看出,暗算别人的好处最大, 但是如果两个人都要暗算对方,那么双方都无利可图。 每个人都根据自己的利益计算来选择是合作还是背叛。 用计算机模拟囚徒困境,而且是多次重复博弈。这引起了很多人的兴趣。 阿克塞尔罗德自己原本就是这方面的专家, 依托强大的人脉关系,他精心挑选了14个精通博弈论的专家, 邀请他们将自己的博弈策略编写成计算机程序提交。 这些专家来自于数学、心理学、经济学、政治学、社会学等多个学科领域, 且都是其中的佼佼者。 坊间传闻,其中还包括美国前国务卿基辛格。 专家们提交的博弈策略五花八门,但总的来说可以分为三类: 好人策略,它们更愿意合作,从不首先背叛对方; 坏人策略,处心积虑,时不时背叛一把,江湖上称之为“背后捅刀子”,来捞取更大好处。 随机策略,它在每个回合中都随机选择是合作还是背叛。 后来,结果出来了,是好人策略中的一个方案最终获胜。 这让或多或少接受过“丛林法则”教育的人都有一点不敢相信。 于是,在第一次实验的基础上, 他让专家们回去改进博弈策略,再玩,博弈的次数已达百万次,结果又一样,还是那个好人策略获胜了。 而这个获胜的好人策略,就是“一报还一报”策略,简单说,它有这么几个点: 合作,绝不首先背叛他人; 别人作恶一定报复;(有没有想起孔子和学生的一次讨论:以德报怨?,何以报德?所以应为“以直报怨,以德报德”) 别人浪子回头,会选择宽容,继续合作 行为模式清晰、简单。(给人以确定性,靠谱)阿克塞尔罗德最后把这个“游戏”写成了一本书——《合作的进化》,成为了博弈论方面的必读书目。 《自私的基因》作者理查德·道金斯认为:
阿克塞尔罗德自己是这样评价“一报还一报”博弈策略的:
所以,再来看中国的策略,目前执行的也是“一报还一报”的方式。 而刘备的“信义著于四海”, 其实就是“一报还一报”中的第 4 点“行为模式清晰、简单”, 从而给人以确定性,用现在的话来讲,他就是一做事靠谱的人。 书中作者对于和他人合作,还给出了几条建议: 不要嫉妒;我的理解就是,你与对方不是零和博弈,是长期合作,所以要见得别人好,不斤斤计较才能双赢。 不要首先背叛;坏人作恶,用中国民间的话讲就是“不是不报,时候未到”,所以也可称为不作恶原则。 赏罚分明;比好人更善,比坏人更狠,用王阳明的话来讲,就是干事情得“菩萨心肠,雷霆手段”。 不耍小聪明;不禁想起被罗胖引用而大火的那句台词:没有什么道路能通往真诚,真诚本身就是道路。 以上,你也可以看出,一报还一报策略的基石,其实是: 博弈双方有长久的利益关系,会多次合作,不是一锤子买卖。 当然,这个游戏中也有 BUG ,如, 不管是什么策略,它都不会被淘汰。 这就有点像我们小时候用小霸王游戏机玩超级玛丽一样, 把它调为无限续命,这样不管怎么样,你都能通关。 不管什么策略,它都是明牌的,也就是只有阳谋,没有阴谋。且游戏中的“好人”与“坏人”取决于是否先背叛别人。 现实生活中显然不是这样的, 搞不好,那个最终获胜的“一报还一报”策略,会像清宫剧里刚刚得宠的傻白甜妃子一样,活不过前三集。 因为“皇后”弄死你时,你都以为她在帮你。 但对于现代社会而言,随着法律制度的一步步完善,人们道德水准的缓慢提升,好人有好报,也许不再是童话。 但我们可以在“好人有好报”之前,先将就用下“一报还一报”吧! —- 编译者/作者:张三九 玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。 |
【三九读西风】好人有好报之前先一报还一报吧!
2020-08-02 张三九 来源:区块链网络
LOADING...
相关阅读:
- CCR炒币机器人如何量化比特币什么样的策略类型适合大波动行情?2020-08-04
- 币生贸富:8.4早间策略精准实现晚间复盘整体大饼获利150+点2020-08-04
- 8.4BTC晚评2020-08-04
- 8月4号ETH及大饼下午操作策略2020-08-04
- 币圈策略师:8.4比特币行情分析上午11350空单思路已验证150+2020-08-04