• 精选
  • 会员

纯粹的随机策略

2019年5月27日  来源:博弈论的诡计:日常生活中的博弈策略 作者:王春永 提供人:我不存在吗

《清稗类钞》中记载,清代文学家龚自珍最喜与人押宝,自称能以数学预测骰子点数。其蚊帐的顶部写满一二三四等数字。无事就卧于床,仰观帐顶,以研究其消长规律。他逢人便自夸赌学之精,闻声揣色,十猜八九。但是龚自珍每下赌场,却又必输无疑。友人取笑他,问他何以屡博屡负。龚自珍面带戚然地回答:“有人才抱班马,学通孔周,人场不中,乃魁星不照应也。如我之精于博,其如财神不照应何?”

这种带有宿命论的解释不过是一种无奈的敷衍。心理学家已经发现,人们往往会忘记这样一个事实,即投掷硬币翻出正面之后再投掷一次,这时翻出正面与翻出反面的可能性相等。这么一来,他们连续猜测的时候就会不停地从正面跳到反面,或从反面换为正面,很少出现连续把宝押在正面或反面的情况。

概率里有一个重要的概念是事件的独立性概念。很多情况下,人们因为前面已经有了大量的未中奖人群,而去买彩票或参与到累计回报的游戏,殊不知,每个人的“运气”都独立于他人的“运气”,并不会因为前人没有中奖你就多了中奖的机会。

假如我们抛10次硬币,没有一次抛出了正面,下一次抛出正面的可能性就大于上次吗?抛硬币出现正反的决定性因素很多,包括硬币的质地和你的手劲,第11次投掷翻出正面的机会还是跟翻出反面的机会相等,根本没有“反面已经翻得太多了”这回事。

拉斯维加斯的很多赌场,老虎机上都顶着跑车,下面写着告示,告诉赌客已经有多少人玩了游戏,车还没有送出,只要连得三个大奖,就能赢得跑车云云。但得大奖的规则并无变化,每人能否得到跑车和前面的“铺路石”毫无关系。同样,在六合彩中,上周的号码在本周再次成为得奖号码的机会,跟其他任何号码相等。

有很多东西对于人们的智力来说根本是不可预测的,与其让主观猜测干扰我们的决策,不如采取纯粹的随机方式。居住在加拿大东北部布拉多半岛的印第安人,早就意识到了这一点。

这些靠狩猎为生的人们,每天都要面对一个问题:朝哪个方向进发去寻找猎物?他们寻找问题答案的方式在文明人看来十分可笑。这种方法类似于中国古代的烧龟甲占卜:把一块鹿骨放在火上炙烤,直到骨头出现裂痕,然后请部落的专家来破解这些裂痕中包含的信息,找出他们当天寻找猎物应去的方向。令人惊异的是,这种完全是巫术的决策方法,竟然使他们经常能找到猎物,所以这个习俗在部落中一直沿袭下来。

在这样的决策活动中,印第安人无意中将波特所说的“长期战略”运用于其中。按通常的做法,如果头一天满载而归,那么第二天就应该再到那个地方去狩猎。在一定时间内,他们的生产可能出现快速增长。但正如管理学家说的,有许多快速增长常常是在缺乏系统思考、掠夺性利用资源的情况下取得的,其增长的曲线明显呈抛物线状,在迅速到达顶点后将迅速地下滑。如果这些印第安人过分看重他们以往取得成果的经验,就会陷入因过度猎取猎物资源而使之耗竭的危险之中。

可以说,正是由于测不准原理的影响,如果我们选择随机,反而有可能超越真实与谎言的对立。我们虽然没有鹿骨可以使用,但是仍然可以选择某种固定的规则,来使自己的策略无法被预测。

但这种规则必须是绝对秘密而且足够复杂,使对手很难破解。

举个例子:看看本书的句子的长度。假如一个句子包含奇数个汉字,把它当做硬币的正面;假如一个句子包含偶数个汉字,把它当做反面。这就变成一个很好的随机数字发生器。回过头来计算看过的10个句子,我们就会得到一组正反序列。

假如本书不够轻便,没有关系,其实我们随时随地都带着一些随机序列。

比如朋友和亲属的出生日期的序列,若出生日期是偶数,当做正面;若是奇数,当做反面。也可以看你的手表的秒针。只要你的手表走得不准,别人便没办法知道现在秒针究竟处于什么位置。

对于必须使自己的混合策略比例维持在50:50的棒球投手,我们的建议是:每投一个球,先瞅一眼自己的手表。假如秒针指向一个偶数,投一个快球;假如指向奇数,投一个下坠球。实际上,这种方法可以帮助你获得任何混合策略方案。比如,现在你要用40%的时间投快球而用另外60%的时间投下坠球,那么,请选择在秒针落在24之间的时候投快球,落在25~60之间的时候投下坠球。

糟糕策略的背后

唐朝末年,安禄山起兵造反,派遣叛将令狐潮率重兵包围了雍丘(今河南杞县)。雍丘守将张巡留1000人守城,自己带领1000精兵,打开城门冲出。张巡身先士卒,冲进敌阵猛砍,兵士个个奋勇。叛军做梦也没想到张巡敢冲出城,措手不及,被杀得人仰马翻。第二天,令狐潮指挥士兵架起云梯登城作战。张巡率领士兵把用油浸过的草捆点着后抛下城去,登城的叛军被烧得焦头烂额,非死即伤。此后60多天里,只要一有机会,张巡就突然出兵攻击,还用计夺取了叛军的大批粮食和盐。

粮盐虽足,但城中箭矢已消耗得差不多了。张巡让兵士扎了许多草人,给它们穿上黑衣。当夜月色朦胧,张巡命令兵士用绳子把草人陆陆续续地缒下城去。城外叛军见这么多人缒城而下,纷纷射箭,一时间箭如飞蝗。射了半天,叛军发觉不对劲,因为他们始终没听到一声喊叫声,而且又发现这一批刚拉上城去,那一批又坠下来,始觉中计。派人前去探查以后,他们方知所射的都是草人。这一夜,张巡竟得箭10万支。

第二天深夜,张巡又把外罩黑衣、内穿甲胄的草人从城上放下去。叛军发现,乱射了一阵,发现又是草人。以后每天夜里,张巡都是如此,城外叛军渐渐知道是计,也不再拿箭去射。这时,张巡决定发起总攻。这一日,张巡把500名勇士趁夜色缒下城去,勇士们奋勇突进敌营。叛军一点准备也没有,立时大乱。接着,叛军的营房四处起火,混乱中也不知来了多少官军。最后,张巡率军直追杀出10余里,大获全胜。

令狐潮的叛军开始发现城头缒下草人,用箭去射是对的。后来发现上当受骗,就不再用箭射,那就不是很好的策略选择。无论缒下的是草人还是真人,在一时无法辨别的时候,他们的最佳策略就是用箭去射。因为这样损失的只是一些箭矢,这种损失与被张巡偷袭相比,显然是微不足道的。

这个故事给我们的启示在于:假如真能发现博弈对手打算采取一种行动,而这种行动方针并非随机混合策略,那你就可以利用这一点占他的便宜。

博弈的特点就是相互猜测,你对对手的策略进行猜测,对手也在对你的策略进行猜测。取胜的基本思路是要考虑对手的思路,所以博弈中还必须考虑到对手也在猜测你,无时不在寻找你的行动规律,以便有的放矢地战胜你。

稳健是博弈的要务,想赢别人一定要先把赢的每一个环节都考虑周到,不能让对手发现任何真实的规律,否则,想赢别人的时候往往也正是你的弱点暴露得最明显的时候。如果没有真正了解对手的策略就仓促出手,对手就可能乘机抓住你的弱点,你可能反倒要被别人赢掉了。

还是用网球比赛的例子来说,当发球者采取自己的均衡策略,按照40:60的比例选择攻击对方正手方和反手方时,接球者的成功率为48%。如果发球者采取其他比例,接球者的成功率就会上升。假如发球者很傻,决定把所有的球都发向对方较弱的反手方,接球者由于早有预料,其成功率将会增至60%。一般来说,假如接球者认识发球者,确切了解他有什么癖好,他就能相应采取有针对性的对策。

不过,这么做永远存在一种危险,即发球者可能是一个更出色的策略家,懂得在无关紧要的时候装出只会采用糟糕策略的傻样,引诱对方上当,然后在关键时刻使出自己的杀手锏。这种策略往往会使接球者自以为看穿了对方的惯用手法,而放弃自己的均衡混合策略。这样,发球者就用乍看起来很傻的混合策略布置了一个圈套,让一心要占对方便宜的接球者就会上当。只有采取自己的均衡混合策略才能避免这一危险。

这也就是说,如果在博弈开始后算不清对方的行动规律并不可怕;但是如果对方的规律出乎意料地明显,那么你就要小心了,因为对方可能正在引诱你走向一个危险的陷阱。

警察 / 小偷 / 博弈

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000