• 精选
  • 会员

35 孟德尔图书馆,只有极少数的A、C、G和T组合才是有意义的

2021年9月26日  来源:直觉泵和其他思考工具 作者:[美] 丹尼尔·丹尼特 提供人:zhaotou97......

人类基因组测序的工作已由克雷格·文特尔(Craig Venter)(64)等人完成,但这到底意味着什么呢?不是说每个人的DNA都不相同吗?是的,非常不同。事实上,单凭留在犯罪现场的一小段DNA,我们就有超过99%的把握确定凶手。然而,人类DNA也非常相似,只要给出其他物种DNA的片段,科学家就能将其与人类DNA区分开来。这怎么可能?我们每个人的DNA怎么会如此不同,却又如此相似呢?

理解这一惊人事实的一个好方法是将书本中的文字与DNA做一番对比,阿根廷作家豪尔赫·路易斯·博尔赫斯(Jorge Luis Borges)提出了一个小巧的寓言“巴别图书馆”(The Library of Babel, 1962),形象地说明了这种差异性和相似性的共存之道。博尔赫斯讲述了一群人进行着孤独的探索和猜测:他们发觉自己置身于一个巨大无比的图书馆之中,它的结构很像蜂巢,由成千上万甚至上亿个六边形通风井组成,这些通风井四周布满露台,露台上排放着一排排书架。站在露台的栏杆边上向下探视,没人能看到尽头,也从来没有人发现哪个通风井不被其他六个通风井包围着。于是人们怀疑,图书馆会不会是无限的?最终,他们认为它不是无限的,但也可能是,因为书架上似乎杂乱无章地躺着所有可能的书籍。唉!

假设每本书有500页,每一页包含40行,每一行有50个字符,那么每页就有2 000个字符。每个位置要么是空的,要么被印刷字符所占据,这些字符是从100个字符中选出的,包括英文以及其他欧洲语言的大小写字母,外加空格和标点符号。(65)巴别图书馆某处的一本书可能全部由空白页组成,而另外某处的一本书的内容则可能全是问号,但绝大多数的书的内容都是由乱码构成的,没有拼写规则,没有语法,也毫无意义。每本书有500乘以2 000,即100万个字符位,所以,如果我们用这些字符的排列去填满一本书,那么,巴别图书馆将有1001 000 000本不同的书。然而,据估计(66),我们目前能观察到的宇宙区域中只有10040个左右的粒子(质子、中子和电子),所以,巴别图书馆是一个物理上绝对不可能的对象,但由于博尔赫斯在他的想象中建构了严格的规则,我们倒可以清楚地想一想这件事。

这会是所有可能书籍的真正集合吗?显然不是,因为它们被严格地限制“仅仅”用100个不同的字符印制而成,可以设想该字符集并不包括希腊语、俄语、阿拉伯语以及中文字符。因此,这个图书馆中肯定缺失了许多极为重要的真实书籍。当然,巴别图书馆藏有这些书的英文、法文、德文、意大利文等语言的精良译本,同样还有不计其数的低劣译本。那些超过500页的书会分册印制:从一册到另外一册,中间没有任何间断。

一想到在巴别图书馆中必定有某些书让人觉得很好玩,比如一本整整500页关于你的翔实传记,记录了从你诞生之日起,直到你逝去的那一刻之间所有的事情。然而,想要在图书馆中找到它几乎不可能,因为这里边还存有大量关于你的其他传记,准确记录着直到你10岁、20岁、30岁、40岁生日为止的所有事情,而这些书的后续部分则以相当不同、相当有趣的方式,彻头彻尾完全错误地记录了你的余生。即便如此,在这座庞然大馆中找出一本可读的书也还是希望渺茫。

我们需要一些术语来称呼这里涉及的数量。巴别图书馆并不是无限的,所以在其中找到任何有意思的东西的机会也并不是真的微乎其微。(67)这些话都是耳熟能详的夸夸其谈,但我们应该避免这种谈论方式。不幸的是,所有流行的有关数量的隐喻,九牛一毛啊、大海捞针啊、沧海一粟啊,都远远不够。甚至任何实际的天文数字,如宇宙中基本粒子的数量、宇宙大爆炸以来以纳秒为单位所记录的时间长度,在这些庞大但却有限的数字背景中都会湮没不见。如果在巴别图书馆中找出一本可读的书就像在大海中随便找出一滴水那般容易,那我们倒不妨一试!随意来到图书馆一隅,找到一本哪怕只包含一句合乎语法规则的句子的书的机会也是相当微渺,我们应该好好领会“微渺”(vanishingly small)这个词,同时,我们给它配了一个对偶词“浩瀚”(vastly),作为“远远超乎天文数字”(very-much-more-than-astronomically)这一意思的简称。(68)

这里还有另一种方式来理解巴别图书馆是如何大得离谱。正如刚才所述,在这些书籍当中,只有其“微渺”的子集是由英语单词组成的。该子集本身仍然异常“浩瀚”,只有“微渺”子集中的单词是按照语法规则排列的,而数量“浩瀚”的书籍中充满了这样的字符串:“好是因为巴黎帮助容易来自民主的脱衣老虎”。在那些合乎语法的书籍当中,存在某个“浩瀚”但却“微渺”的子集,它由有意义的句子构成,其余书籍由合乎语法规则的句子构成,但这些句子随机选自那些合乎语法的书籍;在那些有意义的书籍当中,又存在某个“浩瀚”但却“微渺”的子集,是关于某个名叫约翰的人的书籍集合;而在这个子集当中,又有某个“浩瀚”但却“微渺”的子集,是关于约翰·肯尼迪遇刺的;这其中又只有某个“浩瀚”但却“微渺”的子集讲的是肯尼迪的真人真事;在这些真实的书籍当中,还有某个“浩瀚”但却“微渺”的子集完全由打油诗组成!没错,这些可能存在的关于肯尼迪之死的戏谑之作,比美国国会图书馆中的卷宗还要多!不过,这里边任何一本书基本上都未曾出版过,这倒也是一件好事。

巴别图书馆中藏有《白鲸》(Moby-dick),而且还收藏着与正版《白鲸》相差一个印刷错误的变异版《白鲸》,为数100 000 000部。这并不算一个特别“浩瀚”的数字,但一旦我们加入相差1个、10个甚或1 000个变异字符的变种,变异版《白鲸》的总数就会迅速升高。即使一本书里有1 000个变异字符,相当于平均每页两个变异字符,我们还是可以明白无误地将其识别为《白鲸》,而这些书的数量将是非常“浩瀚”的。不过,你读到的是哪一本根本无关紧要,你甚至可能一本都找不到!几乎所有的《白鲸》都同样精彩,并且都讲述了同一个故事,除了可以忽略不计的、几乎无法识别的差异。然而,它们也并非都差不多。有时候,一个关键位置的变异字符很可能是致命的。另一位颇具哲学趣好的作家彼得·德弗里斯(Peter De Vries)曾有部小说(69)这样开头:

“给我打电话,以实玛利。”(Call me, Ishmael.)(70)

哇,看一个逗号多有用!当然,句子也可能会变异为:“把我团成球以实玛利。”(Ball me Ishmael.)

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000