• 精选
  • 会员

改变权重,涌现能力的核心

2024年12月25日  来源:涌现 作者:约翰·霍兰德 提供人:It8933......

“领先棋子数”这个特征,对该值为1的所有棋局都是等同的,这一原则同样适用于其他特征。上述学习过程显然具有积极的作用,它可以使博弈参与者在不同情况下反复遇到同样的特征,相应地不断积累应战经验。然而,它同时也具有负面的影响。即便在具备较大特征值的所有不同情况下,为某个特征赋予的权重最多也只能反映出该特征“平均水平”下的重要程度。

领先一两枚棋子,通常是会处于有利地位的。因此,“领先棋子数”这一特征的权重可能是比较大的正值。然而在某些情况下,领先一枚棋子也可能是通向陷阱的开始,开局弃子法便是一例。这种情况下,其他特征必须取绝对值较大的负值,以抵消先前领先棋子数具有较大正值所造成的影响。简言之,其他用来刻画陷阱的特征必须存在。只有这样,机器棋手才能避免跌入陷阱。在第12章,我们会讨论默认的层次,届时你将了解这种在特殊情况下忽略一般特征的技巧。

之所以需要谨慎行事,还有一个原因。我们会在其他关于涌现的例子中反复遇到这种情况。预测值V充其量只是估计而已,说到底,程序在做出这些预测时,使用的“博弈可能性”的样本数量有限,博弈双方的情况都是如此。为了弥补这一不足,塞缪尔通过改变权重,使先前的预测Vs)和后来的预测Vs')略微接近一些,以此来改进预测的准确性。在这个规定的约束下,没有什么单独的情况能够引起权重的巨大改变。相反,细小的变化不断积累,逐渐产生一个权重,这个值是所有相关状态的平均值。如果变化趋势一直如此,这个权重将会不断积累成一个较大的值;否则,它的值将保持在接近零的状态。

通过这个办法,可以使权重“忽略”那些做出失败预测的偶然情况。偶尔落入“陷阱”,并不会使领先棋子数的权重与经其他多数情况验证后得到的数值有太大的出入。

缺乏和高手博弈的经验,也将大大增加预测难度。如果机器棋手总是和水平不高的对手博弈,评估函数V将不能产生有效的策略。人类棋手也会受到同样的限制。唯一的补救办法,就是让机器棋手和众多高手博弈。为了在一定程度上弥补这个局限,塞缪尔想出了一个策略,设计了一个自举程序,允许机器棋手和自己交战,以此积累博弈经验。在下一节中,我们将详细讨论这个技术。

尽管面对重重困难,而且也缺乏确凿的证据表明,按塞缪尔的方式改变后的权重可以产生强有力的策略,但这个技术在实践中确实有效。总体来说,这确实是一个了不起的成就。奇怪的是,至今仍很少有人研究为什么这种方法能够奏效,因为改变权重正是塞缪尔的国际跳棋程序中涌现能力的核心所在。

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000