网球比赛策略与马奇诺防线

体育是和平时代的战争,在体育中运用的策略,同样可以改造运用到战争中,因为“竞争”的逻辑,永远是相通的。前些天看到鲁速君写的《这个法国人修了一条没有发挥作用的最强防线》,给了我一些启发,我希望在这篇文章中,用一个网球比赛的策略,侧面说明一下马奇诺防线本该发挥的作用,以及最终为什么没能发挥作用。

我们就先从网球开始。

假设,甲乙两人为彼此非常熟悉的网球选手(两人均为右手持拍),各自对对方的正手和反手能力了如指掌。现在乙正准备将球回击到甲方半场。甲必须对乙的回球方位有一个预判——是要攻击自己的正手还是反手——他需要根据预判的方向提前移动身体重心,以便更好地接球。同样的,乙也会提前有一个攻击甲的正手还是反手的想法,以便更大程度让对方接不到球,至少是比较困难的接球。

我必须再强调一遍,双方对彼此了如指掌,各自不但清楚自己的优缺点,也熟知对方的优缺点,而且也知道,对方知道自己的优缺点。于是,两人大脑中出现了一个相同的收益矩阵。

甲移反手

甲移正手

概率

乙打反手

50,50

80,20

P

乙打正手

90,0

20,80

-P

概率

Q

-Q

(“,”前为乙收益,后面为甲收益)

矩阵中的数字表示如下含义:当乙将球回击到甲的反手,甲也预判正确,将身体重心提前移向反手方向,双方得分概率各为50%;若甲预判错误,移向了正手位,乙得分概率80%,甲得分概率20%(得分概率是8:2,而不是0:0,是因为乙有可能出现非受迫性失误,或者甲鬼使神差地接到了球)。当乙把球打向甲的正手,甲向错误的反手方向移动,乙得分概率高达90%,甲得分概率仅为0%;若甲预判正确,乙得分概率20%,甲得分概率80%。矩阵中的得分概率,是根据双方长期比赛表现出的技术水平得出的平均值,比如,攻击甲反手时,即使甲预判正确,乙的失分概率也仅为50%,远高于攻击对方正手时对方预判正确的失分概率80%——说明甲的反手能力比较弱。

在这个博弈中,并没有一个纯策略对任意一方来说是最好的或最差的。如果甲总是向反手提前移动,乙只要打甲正手就有很大概率得分(90>50);但是乙若总打甲的正手,甲只向正手位移动的收益就最大(80>0);甲只会提前移向正手位,乙最好就每次都打甲的反手(80>20);乙每次都打甲的反手,甲必然也就每次都会提前移向反手位(50>20)……如此循环往复。

类似这种没有最佳或者最差纯策略的博弈,我们要用到混合策略。就像剪子包袱锤,想要在这个游戏中获得最高收益,必须赋予三个策略(剪子、包袱或锤)一个使用概率,在这个游戏中,最佳的概率是/3。采用任何一个策略的概率不等于/3,都只会降低自己的胜率。玩儿剪子包袱锤时,只有每一个策略使用概率等于/3,才能获得最高收益。这种将几个策略混合起来,以一定概率随机使用的策略,叫做混合策略。博弈中的双方都有一个混合策略的最佳概率,当双方均以最佳概率混合自己的策略时,皆可获得最高收益,这时候,任何人都不愿改变自己的策略——无论是增加或减少使用某一纯策略的概率,都会降低自己的收益,增加对手的收益。

在上面的网球博弈中,甲和乙分别为两种策略赋予一个什么样的使用概率,才是最佳的呢?答案是,当甲(乙)不愿意更多向正手移动(打正手),也不愿意更多向反手移动(打反手)时,这样的概率就是最佳概率——因为收益已经相等了。

我们设乙打甲反手的最佳概率为P(打甲正手概率为-P),甲移向反手位的最佳概率为Q(移向正手概率为-Q)。

乙打反手的收益是甲移向反手时的收益加上移向正手时的收益,为50Q+80(-Q);乙打正手时的收益是甲移向反手时的收益加上移向正手时的收益,为90Q+20(-Q)。因为最佳收益意味着打反手和打正手的收益相等,所以50Q+80(-Q)=90Q+20(-Q),这个方程只有一个未知数,我们运用一点初中的代数知识就能求得Q=6/0,。我们知道了,6/0的概率移向反手位,4/0的概率移向正手位,是甲的最佳混合策略。

我们用相同的方法求一下P的值——50P+0(-P)=20P+80(-P)。求得P=7/0。乙打甲反手位的最佳概率为7/0,打甲正手位的最佳概率为3/0。

如果甲发现乙打他的反手位太多了,超过了7/0,甲就会多向反手位移动,甲的收益就提高了,乙的收益就降低了;如果乙发现甲向正手位提前移动的太多了,超过了4/0,乙就会多打甲的反手位,甲的收益就降低了。只有保持在这个比例上,双方才都不想改变策略。任何偏离这个比例的混合策略,都会让对手利用。

某一天,甲花大价钱专门制定了一套“反手训练计划”,并按照计划严格训练了很长时间——甲反手能力大幅度增强了。经过几次比赛,乙对甲目前的反手能力又有了充分的认识,甲也知道乙了解他目前的反手能力。于是,在两人脑中的收益矩阵变成了这样:

甲移反手

甲移正手

概率

乙打反手

30,70

80,20

P

乙打正手

90,0

20,80

-P

概率

Q

-Q

(“,”前为乙收益,后面为甲收益)

甲接反手球的得分几率比之前增加了20%。这时候,甲向反手位移动的最佳概率是增加了,还是降低了?

甲的反手能力提高了,提高反手击球的比率似乎能够获得更多收益,所以提前移向反手位的最佳概率应该提高了。是这样么?这样想的人,没有考虑乙的选择。乙知道甲的反手能力提高了,他多打甲的反手位,自己的收益就降低了,所以乙打甲正手位的概率就提高了。那甲还会更多地向反手位提前移动么?肯定不会了,肯定会更多地向正手位提前移动。

我们可以验证一下。30Q+80(-Q)=90Q+20(-Q),求得Q=5/0。原来的Q值是6/0,5/0<6/0——比原来下降了!甲确实应该比原来多移向正手位,而不是移向反手位!至于原因,我们刚才已经推断过了,是因为乙打甲的反手位的概率下降了。我们再来验证一下乙:70P+0(-P)=20P+80(-P),求得P=7/2——比原来的7/0降低了!乙打甲反手位的概率的确降低了!

甲的反手能力虽然加强了,但造成的结果却是要更多的运用正手,而不是更多运用反手。因为对手不是傻子,他不可能明知反手能力提高了,还要多打甲的反手。他会降低攻击甲反手的概率,提高攻击甲正手的概率。作为甲,就不得不提高向正手方向移动的概率,降低向反手方向移动的概率。

甲刻花大价钱提高了反手能力,没有用么?我们只需要算一算就能知道。反手能力没有提高的时候,甲的收益为50P+0(-P)或20P+80(-P),带入P=7/0,求得收益38。反手能力提高后,甲的收益为70P+0(-P)或20P+80(-P),带入P=7/2,求得收益45。45>38,甲的收益增加了!各位读者朋友,并不是没用上一种能力,就说明修炼这种能力是没用的;一项能力的提高,虽然可能在直接的影响上没发挥作用,但是,能够给博弈带来间接的影响,也称作战略影响;能够增加收益的,往往不是直接的影响,而是战略影响。

接下来,我们来说马奇诺防线。

为了防御德国的进攻,法国人从年开始修筑法德边境的马奇诺防线。这条防线一直施工到年,全长公里,耗资50亿法郎。由于造价过于高昂,因此法国没有将北部与低地国家(荷兰、比利时和卢森堡)的边境纳入马奇诺的防御体系。法国的防线被分成了东部拥有马奇诺的部分和北部没有马奇诺的部分。后来的故事大家都很熟悉,年,德国人迅速占领了低地国家,并从北部进入法国。法国及其盟友对这次突袭似乎准备不足,举措失当。那条看上去固若金汤的天价防线,也完全没发挥作用。

但是,这并不能说明修建马奇诺防线时没用的!由马奇诺防线保护的法国东部,相当于网球运动员甲的反手;没有马奇诺防线保护的法国北部,相当于甲的正手。我们前面已经分析过了,当甲的反手能力大幅度提高时,乙会更多的攻击甲的正手,而不是甲的反手。所以甲要把更多的注意力,用在正手上,而不是变强了的反手上!

法国人明明知道,你的这条防线(至少看上去)很厉害,是人尽皆知的事情,你就应该想到德国人从马奇诺防线强攻的概率降低了——他肯定会更想从没有马奇诺的路线进攻。法国人要做的就是从马奇诺防线中抽调兵力出来,用在没有马奇诺防线的地方,而不是依旧把马奇诺防线作为防御的重点。任何向马奇诺防线增加兵力的举动,都是浪费的,都是会降低收益的(马奇诺防线的博弈模型与网球博弈的模型非常类似,这里就不再建模论述了)。

马奇诺防线的作用,虽然表面上看,是为了防御德国从法法国东部发起进攻,但实际上,其更重要的作用是为法国在法、德边境节约兵力。这条防线越强,德国进攻这条防线的概率越小,能够为法国节约的兵力就越多。这些节约下来的兵力,完全可以用在别的地方。不肯将马奇诺防线上的兵力抽调出来,才是法国的败笔,而不是修建了这条防线。并不是说德国人最终没有攻击马奇诺防线,就说明马奇诺防线没有用。恰恰相反,德国人最终没有攻击马奇诺防线,正说明这条防线非常有用,只不过法国人并没有真正领会到这条防线的作用罢了。

作者:第五大洋;历史百家争鸣特约作者

赞赏

人赞赏









































中科医院专家微信
治疗白癜风哪家医院好



转载请注明:http://www.gypdtj.com/gaishu/7941.html


当前时间: