• 精选
  • 会员

整合信息理论

2020年8月18日  来源:意识与脑:一个还原论者的浪漫自白 作者:(美)科赫 提供人:naike39......

通常的看法是,任何意识状态都含有极大的信息量。事实上,每个感受是如此独特,以至于你绝不可能再次体验完全相同的感受——永远不会!不仅如此,任何一个意识状态还会排除不计其数的其他体验。当你在一个漆黑的房间中睁开眼睛,你什么也看不见。纯粹的黑暗似乎是你曾经有过的最简单的视觉体验。事实上,你可能认为它几乎没有传述任何信息。然而,漆黑的知觉印象意味着你看不到安静明亮的客厅,约塞米蒂国家公园半穹顶上花岗岩石的表面,过去或未来曾拍摄的任何一帧电影画面。你的主观体验隐含地排除了你原本看见的、想象的、听到的、闻到的所有其他事物。这种对不确定性的减少(也被称为熵)就是信息理论之父、电气工程师克劳德·香农(Claude Shannon)对信息的定义。也就是说每个有意识体验都极具信息量,并且极度分化。

有意识状态还有一个共同属性:它们是高度整合的。任何意识状态都是一个单子,一个单位,它无法被分割为能被独立体验的组分。无论你多么努力,你都无法看见一个既黑且白的世界;(如果不闭上一只眼睛或不做一些这样的恶作剧的话)你也无法只看见你视域的左(右)半部分。当我写下这些行文字时,我正在听神秘的极简抽象派艺术家阿沃·帕特的《悼念本杰明·布里顿》(Cantus in Benjamin Britten)的哀叹。我觉知到整个音响范围。我无法不听这个管钟,或者我也无法最后不陷入沉寂。这是一个单一的领悟。

我意识到无论任何信息都会整体地、完整地呈现于我的心智中。我的脑相关部分之间的多重因果交互作用是意识统一性的物质基础。如果脑的不同区域是片段的和分离的,正如脑在麻醉状态所表现的那样,那么意识就消逝了。相反,当许多脑区被同步激活时(脑电图(EEG)信号显示出齐升或齐下,正如在深睡中),尽管脑的整合程度很高,但是很少传递具体信息。

朱利奥的整合信息理论是从这两个作为前提的公理推断出来的:任何有意识系统必定是一个单一的、整合性存在物,它具有大量高度分化的状态。这就是他的处方——整合和分化。这构成他的单子。不多,也不少。

我光滑的苹果笔记本上的电脑硬盘的存储容量是我记忆容量的许多倍。可是磁盘上的信息不是整合的,我苹果机上存储的家庭照片彼此之间也没有什么关联。当她从一个可爱的小女孩成长为一个苗条少女,再成为一位优雅的成年人时,笔记本电脑不会知道那些照片中的女孩是我的女儿,或者笔记本电脑也不会知道我在日程表中写下的“加比”是指与那些图片中的那个人的见面。对计算机而言,所有这些数据都是相同的,即由0和1编织的一张巨大的、随机的图案。我从这些图片中衍生出意义,因为我的记忆是有根据的,并且与成千上万的其他事实和记忆交叉连接。它们越交互连接,它们就越有意义。

朱利奥将这些公理形式化地表达为其整合信息理论的两个支柱。他设想有意识体验(该体验由处于一种特定状态的任何物理系统产生)的数量等同于整合信息(该信息由处于那种状态的该系统产生)的数量,这个数量要多于由系统的部分所产生的信息。这个系统必须在大量的状态(分化)之间进行分辨,并且它必须把这些状态分辨作为统一整体的一部分,这个统一整体不能被分解为一组因果上独立的部分(整合)。

考虑一个进入特定状态的神经系统,在这个系统中一些神经元正在发放,而其他的则沉默。以体验红色的这个脑状态为例,脑之所以能如此,是因为它能跨越在广泛分布的神经元之间整合信息,这些信息不可能通过将脑分解为更小的、独立的成分来产生。如前所述,当连接脑左右半球的胼胝体被完全切断,两个脑半球就不再能进行信息整合。从信息上讲,整个脑的熵现在等于左右半球两个独立熵的总和,而整合信息变为零。作为整体的脑不再有有意识体验。相反,尽管每个半球整合的信息比整个脑整合的信息少,但是每个半球都单独整合信息。裂脑患者的头颅中存在两个分离的脑和两个有意识的心智,每个心智都有另一个半球不知情的信息。这提出了一个自我连续性的问题,这是一个既令人着迷又撩人的问题。自我感、个体感被传到两个半球吗,抑或它仅仅与占优势地位的语言半球相连?这类问题还没有被恰当地考虑过。

在非常罕见的场合下,当连颅双胞胎出生时,会出现相反的情形。在最近的一个连体婴儿的例子中,两个女孩的丘脑是连接在一起,这为上述问题提供了可信的证据。每一个似乎都能获得另一个看到的东西。如果属实,这将是脑与心智的非凡混合,这远远超过对瓦格纳同名歌剧中特里斯坦(Tristan)与伊索尔德(Isolde)的身份融合的狂喜庆祝。

整合信息理论引入了一种精确理解意识程度的方法,称为Φ或phi(发音为fi)。Φ用比特表示,它是在系统进入一种特定状态时对系统中出现的不确定性减少的量化表达,该值要大于系统各部分独立产生的信息。(记住信息就是不确定性的减少。)系统的部分(即模块)解释了尽可能多的非整合的、独立的信息。因此,如果脑的所有单独加以考虑的部分已经解释了多数信息,那么进一步的整合几乎不会出现。Φ测量该网络当前状态中协同的程度,在这个程度上系统要大于其部分之和。因此,Φ可以被视为对网络整体性的一种测量。

整合信息理论做出了许多预测,其中一个较为反直觉的、强有力的预测是整合信息产生于系统内部的因果交互作用。当那些交互作用不再发生时,即使系统的实际状态保持不变,Φ也会减少。

或许与你一样,我也惊叹于迪拜的哈利法塔(Burj Khalifa),它在沙漠的蔚蓝天空下巍然耸立,其高度约有1千米。当我在我的计算机屏幕上看到这座摩天大楼时,我的视觉皮层中表征其形状的神经元被激活了,而我们的听觉皮层几乎是沉寂的。假定我听觉脑(皮层)中的所有神经元因短效的巴比妥盐酸而沉默,而我的形状神经元继续对这个像阴茎一样的结构产生反应,我将不会听到任何声音。如果直觉上最初没有声音,那么也不应该有多大差别。可是整合信息理论预测:即使在两种情况下我的脑活动相同(是视觉形状中心的活动,听觉区没有任何活动),Φ以及知觉体验也会不同。神经元能够发放但却没有发放这个事实是有意义的,并且这个事实也完全不同于这种情形:神经元不能发放,因为它们被人为地使之沉默了。

有关夏洛克·福尔摩斯(Sherlock Holmes)的著名短篇故事中有一篇是《银色马》(Silver Blaze)。它的情节基于“狗在夜晚奇怪的发病率”,其中这位侦探向无能的警察探员指出狗没有叫这个事实。如果狗没有叫是因为它被捂住了嘴,这本没有什么值得注意的。但是它的嘴没有被捂住而且也没有叫,这是因为它认识谋杀者。在脑内也是如此,不管是演奏的乐器,还是没有演奏的乐器,皮层-丘脑管弦乐队的所有乐器都至关重要。尽管这个例子中感受质的实际差别是微小的,但灵敏的心理物理学技术应当能够识别它。

朱利奥整合信息理论的这个整体方面与如下想法并不抵触,这个想法是:对特定种类的感受质而言,脑的某些部分比其他一些部分更重要。关闭皮层中的视觉形式中心将几乎消除摩天大楼的知觉印象,同时却几乎不会影响世界产生声响的方式。相反,关掉听觉皮层几乎不会影响对这个世界最高建筑的视觉,但却会使我耳聋。因此,对颜色、声音和自主性的神经相关物的探索仍然有意义。

计算Φ相当苛刻,因为必须考虑分割系统的所有可能方式,包括将这个网络分为两部分的每个方式,将其分为三部分的所有方式等,直到人们到达原子层次的分割,在这个层次上组成网络的所有单元都被认为是孤立的。在组合数学中,所有这些分割的数量是贝尔数(Bell’s number),它是巨大的。对于构成秀丽隐杆线虫神经系统的302个神经元,这个网络能被划分为部分的方式的数量是一个超天文的数字——10后面跟着467个零。因此,计算任何神经系统的Φ是极其困难的,因此需要启发法、快键法和近似法。

小网络的计算机模拟表明获得高Φ值很困难。通常,这类回路仅拥有几个比特的整合信息。高Φ网络既需要专门化又需要整合,这是皮层-丘脑复合体中神经回路的标志。Φ表示有意识状态的数量,这些有意识状态是与其自身的部分进行因果交互作用的任何网络相关的。系统越整合和分化,它就越有意识。

神经元之间动作电位的同步发放是另一种整合手段。注意,如果所有脑神经元同步发放,正如在癫痫大发作中,整合将是最大的,而分化将是最小的。最大的Φ是要在这两个相反趋势之间找到最佳位置。

根据神经元的连接,大脑皮层中椎体神经元的显性性状就是它们大量兴奋的局部连接,辅以与远处神经元的少量连接。由这类组分组成的网络在数学上称为小世界图(small-world graphs)。在这类网络中任何两个单元,任何两个皮层神经元仅仅相距几个突触。这个属性往往会使Φ最大化。

相反,Φ对于由许多小的、准独立的模块组成的网络来说是低的。这可能解释了为什么尽管小脑神经元数量庞大但是对于意识没有太多贡献:它的突触组织像晶状体一般,以至于它的模块活动彼此独立,远距模块之间几乎没有交互作用。

演化为什么必然喜欢Φ值高的系统,这一点目前还不清楚。Φ值高的系统有什么行为上的优势吗?

Φ值高的系统的优势在于,它能够组合来自不同感应器的数据从而深思熟虑和对未来的行动过程进行计划。具有高Φ值的通用神经网络,诸如皮层-丘脑复合体,应当能够比专门的网络更好地处理预料之外的和异常的情况,诸如黑天鹅事件。与那些具有相同神经元数量但整合较低的脑的生物相比,Φ值高的脑的生物应当能更好地适应这个在各种不同时间尺度中有许多独立行动者运行的世界。

重要的一点是要确立:Φ值高的脑以某种方式优于整合尺度较低的脑,即它们更能适应复杂的自然环境。它会证明意识有益于生存,因为Φ值高的生物会更适合生存下来。如果缺乏这样一个证据,那么尽管整合信息理论不会被取消,它仍会使体验成为副现象。

整合信息理论的另一个值得注意的挑战是解释无意识。整合信息理论的假定意味着无意识构成比意识构成更少依赖整合,可是传统上许多被归于无意识的特性似乎相当复杂。根据算法进行恰当的分析是否表明与依赖有意识心智的任务相比,它们的协同性更小而劳动更密集吗?你在第6章读过的感官-运动僵尸行动者当然符合要求。它们的行为是高度适应的,但也是刻板的,这些行为依赖专门化的信息。我们需要在脑清醒时追踪主要复合体的记录技术。清醒时的脑是高度整合的,而且它与脑中活跃但整合度较低的那些部分不同,那些部分调节无意识。

整合信息理论不仅具体说明了与系统每个状态相关的意识的总量,Φ。它也捕捉住了那个体验的独一无二的品质。整合信息理论实现这一点是通过考虑底层物理系统具有的所有信息关系的集合,即产生整合信息的方式不仅决定了一个系统拥有多少意识,也决定了它拥有的意识的种类。朱利奥的理论是通过引入感受质空间的想法(其维度等同于系统能够占据的不同状态的数目)完成这一点的。对于一个具有n个二进制交换元素的简单网络,感受质空间有2n 个维度,每个维度对应于一个可能的状态。每个轴表示这个系统处于那个状态的概率。

物理系统的任何状态都可以被映射到这种想象的多维感受质空间中的一个形状上,它的表面是多面状的。这个形状的技术术语有多种,但我更喜欢这个更诗意的词语“晶状体”。处于任何一种特定状态的神经系统在感受质空间中都有一个相关联的形状,它产生于信息关系。如果这个网络转换为一种不同的状态,这个晶状体就会改变,它反映了网络部分之间的信息关系。每个有意识体验可以由相关的晶状体给出完整的描述,并且每种状态感受不同是因为每个晶状体完全是独一无二的。“看见红色”晶状体的独一无二的几何方式不同于“看见绿色”晶状体的几何方式。而“颜色体验”的拓扑结构也不同于“看见运动”或“闻到鱼”的拓扑结构。

这个晶状体不同于机械的、因果交互作用的底层网络,因为前者是现象性体验而后者是一个物质事物。该理论假定宇宙中有两种不能彼此还原的属性——心智的和物理的。它们通过一个简单却复杂精致的规律——整合信息的数学相关联。

晶状体是从内被观察到的系统。它是头脑中的声音、头颅中的光亮,是你关于世界所知的一切。它是你唯一的实在,是体验的实质。由于上万亿维度空间中独特各异的晶状体,忘却往事者的梦、禅修僧人的正念和癌症患者的极大痛苦都有各自不同的感受,这确实是一个让人欢欣的景象。整合信息的代数学转换为体验的几何学,这证实了毕达哥拉斯的信念,即数学是终极实在:

数是形式和观念的标尺,是产生神灵和恶魔的原因。

莱布尼茨可能会对整合信息很满意。

这个理论能被用于建立一个意识仪(consciousness-meter)。这个小装置能用彼此进行交互作用的组分所构成的任何系统——无论是湿的生物回路系统还是蚀刻在硅上的系统——的布线图来评估那个系统所具有的意识状态的大小。这个意识仪扫描网络的物理电路,通过读出它的活动水平来计算Φ值和该网络当下正在体验的感受质的晶状体的形状。整合信息理论还需要发展几何微积分,以便决定这个晶状态体的形状代表的是脚趾的疼痛还是满月下玫瑰的芳香。

意识

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000