具身认知

2020年6月26日　　来源：工匠哲学　作者：马修·克劳福德　提供人：xiezi96......

试想我在后院看到了一棵繁花盛开的紫薇树，它是怎样呈现自己的呢？事实上我只看到了树的一个侧面，而它是一棵三维的树。虽然我已经看过它很多次了，但每次都只能看到它的一边，无论走到树的哪一侧，我都无法感知树的背面是什么样的。但是我捕捉到了树最直观的特征，把它看作一个三维整体。这不像是回忆，也不像是在思考某种假设是否具有未来可能性。我一眼就“看见”了整棵树。不必担心由于我看不见树的背面所以它不完整。²

如果我们仅仅把感知当作大脑对刺激的反应，那么这些生活实例会令我们感到困惑。基于这种观点，我们必须设定某种机制，借此大脑把一个个独立的感知侧面组合成一棵完整的树。这一定存在某种“加工”的过程，才形成了树在人脑中的“表征”。³形成这个标准视图，基本的假设就是，凭借一张静止的照片，就可以通过类推想象整个场景。就像使用了动画工作室里的软件一样，通过大脑动态三维建模，我们才对世界有了更全面的感知。

这种方法的另一种解释源自另一组事实：大脑与眼睛相连，眼睛能在眼眶范围内自由移动，脖子连接着头，而眼睛就在头上，头从属于某个身体，就跟典型的二足动物一样，身体可以借助于双脚在地上行走。根据过去15年来蓬勃发展的一些思想学派，可以确定的是，我们的思想和身体的运动，不仅仅是感知的副产品，还是感知的构成要素。一名研究员曾说，感知是一种行为方式。感知不是发生在身上或我们体内的事，而是我们正在做的事。⁴

在詹姆斯·吉布森（James J. Gibson）的职业生涯早期，他曾作为心理学家评估第二次世界大战时期飞行员候选人的天资。经过几十年的视觉感知研究，他开始反击“感觉输入通过大脑运作转化为感知”的基本假定。在1979年出版的《生态学的视觉论》（The Ecological Approach to Visual Perception）一书中，他提出了一个精准而重要的视觉新定义：视觉不单纯是对感觉输入的脑力加工，而是一种我们利用身体在刺激变换中提取不变量的活动。换言之，人必须从多角度探索某一场景，以感知在视角变换下始终不变的东西，也就是它的本质和结构，而运动是这一过程中必不可少的一部分。⁵

进一步来说，有证据表明，只有自发的运动才能实现这一点。如果人只是被动地传输周边事物，视觉系统是不会发展的。在早期一项后来被称为体验认知的实验中，研究人员选取了10对小猫在黑暗中被养育长大。它们每天只有3小时的活动时间，让其中一只小猫在传送装置上自由移动，人为使另一只小猫被动跟随第一只的足迹移动。第一只主动移动的小猫可能会上蹿下跳，在传送带上跑来跑去，也可能绕着传送带半径转圈。两只小猫互相并不能看见彼此，周边环境是人为创造的，所以在行走过程中二者接收到的视觉刺激是一样的。唯一的区别就在于一只是主动移动，而另一只是被动移动。主动小猫组正常成长；而被动小猫组则不能通过视觉引导来确定爪子的落点，避免视觉悬崖，敏捷应对快速逼近的物体，或者视觉捕捉运动中的物体。

静止照片的例子并不适合用来解释视觉感知。原因很简单，世界不是静止的，我们与世界的关系也不是静止的。⁶这会产生深远的影响，因为一些认知心理学的基本概念是建立在将眼睛与相机类比的基础上的，认为眼睛是孤立地存在于身体其他部分之外的。这是两个学术阵营之间的对立，我们真正要探讨的争议焦点在于我们究竟是如何与头脑之外的世界相连的。

在视觉感知领域，认知心理学旨在厘清一系列困惑：三维物体种类无穷无尽，却可以通过观察者的视网膜呈现某些相同的二维形状。如果静态的视觉信息都可以获得，由于这些信息不能全面描述物体表面的形状，那么大脑就需要对这些信息进行补充，也就是对于外界结构进行设想。这引发了我们的思考，我们认为感知涉及人脑的推理过程，而这种推理是通过计算进行的。认知运用一定的规则操纵符号象征，得出三维物体呈现在眼前需要的额外信息。这是劳伦斯·夏皮罗（Lawrence Shapiro）在《具身认知》（Embodied Cognition）一书中，对具身认知文献资料的精彩综述。⁷

吉布森认为，虽然单一的视网膜成像显然不足以对外界做出具体说明，但是观察者在运动中获得的视觉刺激是足够的。他认为，形成感知的全部动力与推理过程有关，但计算并不起作用。这是革命性的观点。⁸大脑并不一定要建构外界的表征。我们认识世界因为我们居于其中，在此工作和生活，并积累经验。

令人惊讶的是，在机器人学领域出现了一些令人信服的证据，证明以推理、计算和再现的方式应对物理环境是极其低效的。罗德尼·布鲁克斯（Rodney Brooks）于1991年在《人工智能》（Artificial Intelligence）杂志上发表的经典文章《离开了表征的智能》（Intelligence Without Representation）写道，世界是它自己最好的模板。机器人专家现在受到的教训，是进化论早在很久以前就经历过的了。他们应该知道，问题解决并不只依靠大脑来完成，可以分配给大脑、身体和外界。

想想怎样才能抓住一个飞在空中的球。依照标准观点，我们可能会认为视觉系统中输入了目前球所在的位置，一个单独的处理器（大脑）预测它接下来运行的轨迹。由于我们中的大部分人不会有意识地用纸笔来计算这条轨迹，所以我们怎么做到这一点似乎有些不可思议。根据吉布森的方法，无论是在有意识还是潜意识的情况下，我们都不需要用纸笔计算。事实上，我们所做的是把球的图像看作在视觉背景下做匀速直线运动的，并以此为依据去跑。⁹如果你跑的方向是正确的，那就可以在视觉流（optic flow）中获得这个不变的方向和速度，利用它们正好会让你处在正确的位置来抓球。狗在接飞盘时采取的也是同样的策略，即便是在有风的情况下。你不一定要遵循伪抛物线轨迹的内在模型，尽管在棒球运动中会采用这种模型，会根据高度等因素的不同对空气阻力进行修正。当然，这也是个不错的选择。

有一派心理学家认为我们通过身体进行思考。这一心理学派研究的根本贡献在于，在经历了几个世纪的头脑封锁以后，人的思考方式终于被放回到它所属的世界中去。我们不能根据头骨的外部表面来清楚地划定认知过程的界限，同样也不能根据我们的身体来划定。从某种意义上说，认知过程分散于我们行动的世界各处。

为了更好地理解这种概念的转换，我们可以将依据老式人工智能原则设计的人型机器人和反映最新生态思维的机器人进行对比。安迪·克拉克在他富有启发性的《思想超大化》（Supersizing the Mind）一书中，就做了这种对比。

我们可以通过对比步态来理解这个问题。阿西莫（Asimo）是本田汽车公司研制的二足机器人，依靠发动机、伺服器以及其他机械作动器来精准控制关节角度，使其能够完成上台阶等任务。将同一重量的物体移动同一距离，阿西莫所需要的能量是人体所需的16倍。就研制机器人的一般方法，一名机器人专家评论称，研发出的这种样本并不令人满意，它处于一种僵尸状态。

但是通过另一种不同的巧妙设计，机器人就可能超越人体的效率。该设计依赖于自身的被动动力，机器人只以自身重力为动力。2001年发明了一个配有腿、膝和摆动臂的机器人，只需要带一点角度的斜坡它就能行走，并且行走时步态平稳，与人类惊人相似。它没有控制系统，它的运动不是通过运动设计实现的，而是利用了它自身的形态，即四肢的长度、重量、节点的减震率和弹簧刚度，就像人体连接四肢的肌肉和韧带一样。一个有动力装置的机器人也能利用与之相同的设计原理。

这个例子解释了“生态控制”或“形态计算”的区别。正如克拉克所言，目标的实现不是通过微观管理行为或反应的每一个细节，而是通过充分利用控制者的身体环境或控制者所处的外界环境中的相关秩序，这种秩序不仅强大而且可靠。我们所说的“加工处理”是通过动力来实现的，这种动力是机器人与环境相互作用时所固有的。

儿童开始学步时，会开发自己身体的被动动力。一开始，他的身体感受就像初学者手握曲棍球球棍的感受一样，有点强人所难又令人沮丧。孩子通过探索神经中枢的某种命令会带来某种身体效果进行学习。有了足够练习后，他有足够的能力在无意识的情况下发出命令。¹⁰到那时，孩子就可以自如控制他的身体了，就如同盲人探索路况时一样自如。除非发生故障，否则走路不再是注意力的目标。用波兰尼的话说，孩子正在通过自己的身体关注外面的世界，他感到自己学得越来越好。

弗里德里希·尼采（Friedrich Nietzsche）说，人的喜悦就是感受到自己的能力在不断提升。我们不要将这句话解读为一个贪得无厌的暴君的座右铭，它其实道出了技能在美好生活中所起的重要作用。当我们能够胜任某种技能行为时，原本外界中挫败感的源头会成为自我不断拓展的一部分，就像学步的孩子拓展自己的身体并且和自己的身体融为一体。这感觉很棒。

具身认知 / 工匠

如涉及版权，请著作权人与本网站联系，删除或支付费用事宜。