也谈博弈
序
最近六度世界的第三大热话题就是博弈。(编者按:第一大热门话题是一位叫田闲率先引领的灌水,第二大是一个叫老田带头的晒美食)本文作者看到现在一片混乱,觉得拨乱反正的时候到了,于是草草写了本文,但是内容充实,举例贴切,思想深邃,为六度网友的思考指明方向,值得大家认真阅读。此文将分为十段,预计在三个月全部发出,请各位网友多多关注学习,写好读后感交给班长打分。
第一章 胜平博弈为哪般
冯胜平先生多次在节目中讲到了博弈,其中反复强调的是T for T (一报还一报)。在某次节目中,冯先生谈及T for T的来源是源于道金斯的一本书,虽未明说,但笔者想应该就是那本久负盛名的《自私的基因》。
T for T是一个经过验证的博弈方法,经过反复验证的确是一种看似简单但极为有效的博弈策略。胜平先生认为这种博弈策略是可以运用于人类社会的,并且会得到应有的善果。
我们先放下一切胜负心,来看看《自私的基因》是如何引述这种策略的。在这本书的第12章好人有好报里,道金斯详细讲述了这套策略。我读此书得到的理解就是,这套策略是来解释为什么在基因利己的策略中,会形成生物的利他行为。展开来说就是,虽然每段基因都为了自身的复制,但最终走向了互相帮助这种利他。这就是经过了大量博弈以及淘汰后的结果。于是,可以说明我们的基因内是刻着利他的行为冲动的。道金斯在这本书里举了一个德国和英国阵地上互相配合开炮的事例,来说明这种博弈策略是可以在人类中使用的,甚至是在凶残的战争中。这一章全在描写这种博弈的情形,如果感兴趣的可以找来看看。为了不再水楼,我就不详细引述了。
但是,可以使用不代表可以成功使用,也不代表这是博弈的唯一方法。在这章里,道金斯还讲诉了一些背叛行为,以及与人为善是如何对抗背叛的。这至少说明,胜利者不是只有采用T for T的群体,还是要看到谁可以拿到那个决胜点。但无论怎么说,最终还是利他行为的基因获得最终胜利的比较多,这是由于利他行为是由数不清的基因结合,经过上亿年的进化选择最终形成的。这和T for T 策略是要在多次重复中才能彰显威力是符合的。但这种博弈策略是否可以应用于人类呢?如果可以,适合于什么样的条件呢?
敬请期待第二章 人类困境如何破
第二章 人类困境如何破
这系列文章一下子搞成命题作文,的确也是难为作者了。好在第一章发表之后得到了广泛的好评,短短几天就收获了若干点赞以及好几十回贴。回贴中充满了对作者的赞赏,也有个别人对作者的授课提出了一些问题。本文作者最喜欢这种爱听课的同学了,但请大家淡定,毕竟十集呢,饭要一口口吃,学要一天天上。废话不说,进入正题。
上回书说到,T for T策略是需要多次重复才能彰显威力的。也就是说,这种策略最终获胜的概率很高。但是概率高不等于必然,只是万千可能中的一种。如果说,人类还会有上亿年的历史,到一亿年后来看,存活的遵循的很可能会是采用T for T策略的MEME(这个未来讲,笔记本上先记下)。但不要忘了,我们是天生拥有自私品质的人类。人类本来就是短视的,没有几个人会去考虑几百年以后的发展,毕竟那和他并不相关。而如果放眼一亿年,那太远了,根本连想都懒得想。
现实中,如果你采用一报还一报的做法,你的实力需要超过对手,否则你将被对手玩弄于股掌中。这种策略本来就不是大众可以玩得起的,所以很多科学家建议的是各国政要多采用这种策略,减少纷争。在我看来,科学家是纯洁的。我更相信司马迁的天下熙熙攘攘的判断。既然如此,人类逐利的本性以及仅有百年的寿命,怎么能够理性的采取科学态度进行生存和发展呢?
敬请期待,第二章的第二部分,一周内更新。
前一阵子在国内的爱奇艺平台上火了两个人,作品的名字是少爷和我,其中除了刘波刘海留疤之外,还有一句台词是,用真心。如果真的问到我,对人类的短视和自私如何破局才能够理性的存在一亿年,那我的答案也是,用真心。
人类的确有着种种不堪,但是也是有着其他物种没有的优点。正是这些优点,让人类成功的存活到了现在。
耐性,人类是一种可以忍耐的动物,虽然短视其视野已经算是所有物种中相对长久的了。人类懂得如何用今天的辛苦去收获明天的幸福,也正是这一点,使得人类文明得以发展。如果人类真的是只顾今天,那我们就不会有农业,现在的我们还将是制作工具去追逐猎物的原始状态。所以当有人说某些民族喜欢及时行乐,或者说某类人开始躺平,我是不会赞同的。如此的个体会有,但如此的群体是不存在的。我们每个人都懂得,今天要努力,明天才有收获。这已经是形成在人类文明中的共识(MEME),这种信息的不断传递,我们叫做传承或者叫做文化基因。
适应性,人类原来居住于非洲大陆,经过漫长的种群迁徙,选择了不同的栖息地,形成了不同种族以及不同的生存方式。但您看到这一点,我相信您就理解我在说什么了。极热如赤道,极寒如阿拉斯加西伯利亚,极湿润如热带雨林,极干燥如中东地区。地球上几乎所有地区都遍布了人类,这是其他物种不具备的。
否定的思维方式,这点是用真心解决问题的最关键一点。人类是所有生物中真正懂得思考的。而且回顾历史,我们会发现,人类永远在修正自己,使得自己更加适应环境。人类群体的世界观,方法论,人生观,美学,等等等等这些高大上的人文思想,都是在变化的。如果你能有机会和一个一千年以前的人去谈论以上问题,你会发现,你们很难找到共同话题。
所以,现在我们应该如何去用真心解决人类的困局呢?我的建议如下
第一,坦然的接受自己的死亡。昨天有人问AI一个问题,就是人的永生何时能实现。以我的观点来看,人是无法用生的。这点没必要去杠,我只想让你自己想想,什么才是真正的你,这套基因编码写出来的你,还是这段记忆中的你,亦或者这种思维方式的你。当你想着想着,你就会发现,你的用生是不可能的。但你不要觉得悲哀,一代人的死亡,正是人类极大的幸运。如上面说到的否定的思维方式,真正自我否定的人类寥寥无几,只有一代又一代的人类才能在信息上更新出更有价值的东西,也只有传承与抛弃,才能让人类前进。
第二,过好自己的人生。我们是幸运的一代,无论大时代是开启,还是关闭,我们都是这个划时代的见证者。当今的世界是个知识爆炸的时代,准确的说是个信息爆炸的时代。人类已经有超过一半的人口不需要担心挨饿,如果你愿意,追求一个准确的信息成本是低廉的。而抛弃那些过分的虚荣将会让你生活的无比快乐。
第三,衷心的接受他人的信息。信息之间的传递,将是下一个复制时代的开启,基因将不再成为世界的霸主,脑洞大起来,MEME将是未来世界的统治力量。所以在坚决杜绝恶意信息之外,要接受各种信息的传播,无论是什么样的信息和思考,只要不是为了目的制造的虚假信息,就会成为有意义的信息,也可能成为有价值的信息。(这段话先放在这里,具体的解释将在第七章中完成)。
人类先设置一个小目标,活上一亿年。这个小目标的达成概率并不高,但人类别无选择。如果说如何达成这个目标,我的建议就是,用真心。
开帖为了博弈,总要再讲回博弈,敬请期待第三章,博弈竞争必胜课。这将是我的经验分享,未必有价值,但一定是有真心。
第三章 博弈竞争必胜课
前文乱七八糟的讲了讲博弈的事,其实就是想说,T for T其实作为一种策略,只是自然选择后的胜出者,并不代表运用这种策略的最终都胜了。而如果将此策略运用于人类社会,有以下三点假设是不符合的。
第一,博弈方的策略是会随时调整的。与大自然其他生物不同,人类是会主动改变自己的策略的。其他生物更像单片机,输入指令后,程序基本是不变的,会有少量的错误产生,但概率极低。而人类不同,是优于自我学习的AI的,输入指令后,会随多种变量的不同去调整程序,给出难以预测的输出。所以如果认为博弈游戏可以胜出,这种博弈的策略最优,是没有说服力的
第二,每轮博弈的优胜奖励与失败惩罚不同。大自然的博弈奖励就是基因的复制延续,惩罚就是基因的消失或无用化。但人类社会是不同的,你可以以一个背叛获得其他人一万个一报还一报的收益时,你会选择什么策略?
第三,博弈的范围不同。人类社会再大,到现在也就有几百亿人口曾经活过,而基因的博弈,我想数量级应该是要在加上至少五个零吧。一报还一报的获胜概率大的前提条件就是博弈次数要足够多,如果博弈仅限制在人类范围中,而次数又不够,很难说何种策略更占有。
以上为博弈策略在人类群体中的尴尬,而现实中,对于个体,此博弈策略更是难以获胜。以下为此文十章中,作者认为可以贡献给六度网友的最大干货,那就是,对于个人博弈竞争是否有必胜之法呢?
第三章 博弈必胜课
这个标题很不要脸,有点指明博弈发展方向的意思,但是为了配合下一章肯得基,此章怎么能不叫必胜课呢?尤其是当这种标题很符合我的人设时。
人设,这就是我经常提到的,各位同学要拿小本本记下来的重点,我大概在下次更新时会详细提到。
博弈之道,在之前的文章中我讲到的都是一些大数据下的必胜法则。这时需要有前提条件的,博弈的个体足够多,博弈的时间足够长。生物界的确如此,经过了40亿年,十的十多次方的数量级个体,最终看起来,似乎是遵循了博弈之道。但对于个体来说,甚至是人类这个群里来说,这些博弈之道很可能并不能解决你的问题,而更可能将你在博弈游戏的最开始就推到被淘汰的序列里。所以,当我们谈论博弈之道时,更有现实意义的,并不是博弈论中的那个博弈,而是一种方法,能够在互相之间有体面的拉扯,并在拉扯中可以获得自身可以接受的结果(注意,是可以接受而非有利,这点很重要)。
这些方法有很多,甚至还有很多所谓的成功学大师总结讲课,去赚失败者的钱,使得大师们也能成功。但是这都是靠运气的成功,按照这些市面上的方法去行事,没有几个人能够成功,否则现在至少还要有几百万个马家军了。那我们可以总结出来一些基本规律吗?这正是我尝试忽悠大家学习的内容。
每个成功学大师,告诉你的第一个方法肯定是做好自己,也就是要努力,不停的努力。我的第一条也是做好自己,但不要求你去努力,因为要求你去努力的都是骗子,因为失败了就可以说你没有努力。我的建议是找到自己的位置,这样你失败了,我可以告诉你,你的位置找错了。
做好自己很简单,就是以你最舒服的方式去做好自己,做一个积极乐观的人。当你以自己舒服的方式去做你自己的时候,你也很容易成为一个积极乐观的人。但找到自己的位置就不是那么简单了。
每个人都是有差异的。如果也想去北欧弄个杠精博士玩玩,你就要有那份杠遍天下的自信,还要有那么点聪明。否则就只能是本土杠精了,而本土杠精又很多,不容易被重视,所以要想想做北欧杠精的定位对不对。我举这个例子,是希望我们都能想一想,自己给自己的定位是不是准确,而按照这个位置,你是否舒服呢?我们这个时代,能上网的基本已经解决了温饱,所以看到本文的各位,并没有什么影响生存,而必须去完成的任务。你的焦虑只是来自你的定位。物质是无限的,想追求更好的物质将永无止境。而精神生活成本要低得多,两天的午饭应该就够你买个会员看一个月了(包括那种会员)。如果我们可以更看重精神的追求,就会给自己找到一个更合适的定位,而这个定位将是你未来博弈获胜的重中之重。
说到这里,提个题外话。何老板前两天的点点说有人打赏三万,这也激起了我的兴趣。百忙之中听了节目,发现有人觉得是我干的,澄清一下,不是。但是三万的打赏的确是可以刺激到我们的神经的,哪怕我这种完美的精神追求者。所以说摆脱对物质的向往,往往是句空话,尽量做到不受控制就好。
博弈的第二点,就是找好你的博弈对手。要开始博弈,对手很重要。为什么这么说呢?如果你下象棋,对手非要连成五颗棋子,然后宣布自己获胜,你还会下吗?如果你打算用棋局去赌上自己的半生积蓄,而对手是个特级大师,你还会漂洋过海的去赌吗?我说这些,是指如果你想取得博弈必胜的法则,不要去找不讲体面的对手去博弈,也不要去和比你强很多的对手博弈,这些做法都是自取其辱。但不代表你不能和这些人去博弈,如果选择和他们博弈,要调整好心态,这是付费内容了,本文不会涉及。
以上两点是基础,也是废话,下面进入第三点,我们应该采取何种策略。
策略部分有四点,第一,底线思维,确定可接受结果。第二,人设设定,设定自身的行事方法。第三,备选路径,备选突发方案。第四,随时调整,调整个人心态