关于神经网络模型涌现问题的主要观点
关于神经网络还有很多可以讨论的内容,但是对涌现问题的研究而言,我们已经讨论了足够多的要点。
1.通过一种内部可以相互连接的带有大量回路的网络,我们发现了以神经元的子集为单位集中做出反射的可能性。这种行为可以提供无限期记忆,并且它还可以使神经元组织成为一种互相协作的集合,这种集合将成为有序行为的构件(Hebb, 1949)。
2.下面这三种简单的机理大大推动了人们对神经元网络所产生的行为的研究:
· 可变的激发阈值。当一个神经元的脉冲发射逐步增强时,它的激发阈值就会逐渐降低。如果这个神经元在一段很长的时间内保持静止状态,它的这种激发阈值的降低导致它对到达的脉冲越来越敏感。这种可变的激发阈值使神经元充当起了频率调节器,神经元的发射频率是对到达它表面的脉冲强度的反应。
· 疲劳。长时间以高频率发射的神经元的激发阈值将持续增加,实际上整个可变激发阈值曲线会转而上升。反之,长时间以低频率发射的神经元的激发阈值会持续减小。疲劳最终将迫使神经元的发射频率回到正常水平或设定值:任何神经元都不可能持续以高于或低于设定值的频率发射脉冲。
· 赫布定律。如果神经元X在t时刻发射,而神经元Y在t+1时刻发射,那么,X的轴突与Y连接部分,也就是突触,都会增强。相反,如果Y没有在t+1时刻发射,那么那些突触会减弱。赫布定律对于那些和这两个神经元无关的发射不起作用。使用塞缪尔的信用赋值理论,赫布定律不需要了解任何系统活动,就可以对信用(突触的权重)赋值;它不需要任何仲裁者和执行者就可以起作用。
疲劳和赫布定律促成了神经元反射集的形成。通过适当调整外部刺激的顺序,这个集合也会形成序列。在有追踪对比反射和眼睛的快速扫描的情况下,外部刺激的序列会自动生成。疲劳和赫布定律还导致了在互相排斥的对象——例如三角形的三个顶点的刺激下,集合间的相互抑制。这种相互抑制的发展,会使得不活跃的集合按非正常的顺序以低频率发射。结果,这些集合会获得低得反常的疲劳程度,它们会变得比其他集合更急于反射。这时预测就产生了:还没有发生的刺激序列可以通过相应的过度敏感的神经元集合进行预测。
3.健全的反射神经元集合序列会通过正规的方式刺激其他神经元。赫布定律创造了新的神经元集合,从整体上对这个序列做出反应。例如,对于一个三角形,通过快速扫视和追踪对比反射,可以产生三个相互抑制的反射集合序列。这个序列逐步发展起来时,会产生另一个集合,从整体上对这个序列做出反应,也就是对三角形的三个角做出反应。从这里我们又引出了层次的讨论,层次是从外部刺激的规则中产生的。
4.先前没有遇到的形式虽然是新事物,但它们还是会按新的方式排列、拼接构件,从而形成成熟构件的集合。这些集合成为新形式下的构件。这个过程是很常见但非凡的人类能力,即“分解”能力的初级阶段。人能够毫不费力地将不熟悉的场景分解成一个个熟悉的对象,就算最精密的计算机程序至今也无法做到这一点。
带回路的神经元网络所有这些可能产生的行为,正是那些单调平凡的机制相互作用后形成的精妙结果。回路产生了反馈,这使人们具备了无限期记忆的能力,即在无限长的时间内对过去的事物保存记忆的能力。计数、算术、通用计算和需要对环境进行模拟探测的智力模型,都必须具有无限期记忆能力。同样,疲劳会减弱性能的观点也不会影响它在预测中的重要作用。
状态与策略
神经网络的构造给了我们第二个具体例子,说明“复杂源自简单”。当塞缪尔的国际跳棋程序持续战胜它自己的时候,国际跳棋程序具备的专业知识已经明显超出了塞缪尔提供给它的那些。同样,当一个神经网络形成了与刺激相关的反射集时,它所获得的行为和组织结构也无法在最初的随意联结模型中找到了。在这两个例子中,我们都可以看到简单的机制会产生连设计者都无法解释的复杂行为。
从一些简单机制的相互作用中导出的复杂性,与通过一些规则定义的游戏的复杂性一样难以理解。在游戏中,各种可能性都是由游戏开始时遵循的规则决定的。然而,我们要花费很多时间学习,才能了解所有这些可能性。当我们了解了这些可能性后,就会发现很多不可预测的规律性和对称性。几个世纪以来,人们通过对象棋的研究得到了一些有助于获胜的模式:通路联兵、开局弃子法、增强移动性的方法等。当我们研究基于相互作用机制的模型时,也会产生类似的规则和模型。尽管自从牛顿方程提出来时,我们就已经开始研究它了,但它所包含的规律,至今仍能揭示很多新的规则和可能性。
如果回到在讨论那些游戏时使用过的具体技术,即回到基于状态和决策的描述,我们就会对这些共性有更深的理解。我们来回顾一下:国际象棋的规则确定了一个竞技场、一种环境,棋手必须在这个环境中采取行动。任何时候,棋盘上棋子的摆放都决定了这个时刻的环境状态。国际象棋程序通过一系列特征探测器来了解环境状态,并且通过特征探测结果的加权和做出决策。根据这个决策所做出的行动又会改变游戏的环境状态。
我们怎样才能用同样的方法描述神经网络呢?我们首先将中央处理器与棋手对应起来。那么,在我们前面给出的例子中,中央处理器的环境指的是给出的图形,而且从中央处理器的角度来说,环境状态是指正在被观察的图形的一个特殊部分。在各个神经元集合上的反应的发出和消除,则决定了图形焦点的变化,所以这些集合也决定了中央处理器的决策。和塞缪尔的国际跳棋程序一样,这个决策决定了环境状态的改变。
这种对比并不仅仅是术语的比较。状态和决策的概念是汇集了相当多学科知识的、完善的技术概念,而且它们应用广泛。特别要指出的是,这些概念帮助我们区分了系统中的特殊细节和一般规律。这一点是确定涌现现象通用的思想和方法的基本步骤。
确定模型的规则选取
无论是在游戏中还是在自然科学中,涌现的重点都在于选取那些用于构建模型的规则。在这里,我们可以从一个不同的角度提出中心问题:人类是如何运用他们描绘复杂性的有限能力,从复杂事物中提取出重要的规则和机理的?科学家是如何从世界上很多无法预料的现象中,总结出有效揭示它们的规律的?
当我们开始注意世界上的一些复杂模式——战争中军队的调动或者夜空中的“漫游者”(行星)的运行模式时,构建基于规则的模型的过程就开始了。刚开始时,我们对候选的规则不甚了解。我们在选择规则之前,需要尝试推导出这些规则产生的结果,但是这样做需要花费很多时间。真正选择规则的过程则是完全不同的。推导和演绎的作用是有限的,在做选择时,我们也只能粗略地猜想可能出现的情况。还有一些其他的处理步骤也需要用来协调感兴趣的模式和希望模拟这个模式的规则之间的转换。
根据定义,选择的过程应该是一个归纳的过程——从详细的说明到精减的、抽象的描述。在这里,我们又一次看到了精减细节的重要性。了解什么内容可以忽视并不是通过推导和演绎所能解决的,而是要通过体验和训练来解决,在艺术性、创造性的工作中更是如此。当这一过程完成之后,得到的描述揭示了很多原理、规则和机制,这些就是我们要获得的内容。
以国际跳棋程序和神经网络的例子作为开端,我们把涌现置于一个更大的框架中。然后,我们就可以把实例的特征和与涌现相关的必要元素区别开来。这个大框架可以帮助我们将建模的处理和其他一些用于理解涌现的活动联系起来,例如创建隐喻、创作故事和诗歌。