按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
同的那佛乔语(Navajo)的话,我们就不必引入太多的新语法概念。而对那佛乔语来说,其语法规则应该更长些。类似地,一本写给说那佛乔语的人看的荷兰语语法书大抵要比写给说英语者看的荷兰语语法书更厚些。
即便存在着这些因素,将语言的语法复杂性与描述该语法的教科书的厚度联系在一起,也仍然是合理的。但是,如果有可能看到一个说母语的人的脑子(不断前进的科学技术也许会在某天使之成为可能),并看到语法在那里怎样被译成密码的话,那将更有意思一些。用那种内部语法所表示的图式的长度,可以作为衡量语法复杂性的尺度,这种衡量尺度具有较小的随意性。(自然,这种情况下长度的定义比较微妙,要依赖于语法信息在实际上被译成密码的方式。它们是储存在局部的神经元和神经突触上,还是以某种方式分布在整个神经网络中呢?)
我们将一个系统相对于正在对它进行观察的复杂适应系统的有效复杂性,定义为用来描述其规律性的图式的长度。当图式以某种方式支配被讨论的系统(比如储存于脑中的语法规范着言辞),而不仅仅是被外部观察者,如一本语法教科书的作者使用时,我们就可以使用“内部有效复杂性”(internal effective … plexity)这一术语。从随机性中分离规律性有效复杂性这一概念的作用,尤其当它不是内部有效复杂性时,与进行观察的复杂适应系统能否很好地识辨与压缩规律并抛弃偶然性的东西有关。如果不能,那么,特定观察者的缺点对被观察系统的有效复杂性的影响,比被观察系统本身的性质对它的影响更大。结果,观察者常常是相当有效的,但是有效性的概念却由此引起了深远的问题。我们已经知道,最理想的压缩思想可能会陷入不可计算性的困境之中。除压缩之外,实际的规律识辨又怎么样呢?从数据流中识辨规律性真是一个定义明确的问题吗?
如果从某种意义上说数据流无限地长,比如,在语言或教科书情形中,它如此地广博,以至于构成了一个包括用给定语言所能说出的每个可能的句子在内的典型样本,那么,识辨规律的任务会更容易一些。这里,即便是一条罕见的语法规则,也会在相似的条件下反复地显示出来,从而使人们能将它同纯偶然的不规则变化中得出的错误规则区分开来。(例如,在一篇短的英语文章中,过去完成时态可能不会出现,从而给人造成英语中不存在过去完成时态的错觉。而在一篇很长的文章中,这样的情况就不大可能发生。)识辨某些类型的规律性
许多理论物理学家,如加利福尼亚大学伯克利分校和圣菲研究所的吉姆·克鲁奇菲尔德(Jim Crutchfield),在了解如何从一个无限长比特串的随机性中识辨出规律性方面,取得了很大的进展。他们定义了许多种规律性,并证明了在理论上如何应用计算机来识辨上述范围内的规律性。但是,即使他们的方法也不能提供一个挑出每种规律性的算法,这样的算法根本就不存在。但他们证明了,计算机在比特串中发现属于某类规律性后,能够推断出新的、属于一种更基本类型的规律性的存在,并知道如何识别它们。这被称为“分级学习”(hierarchical learning)。通常,一类规律对应于一组关于如何产生一个数据流的数学模型。假设数据流是一个由随机(至少是部分随机)过程——不妨假设为掷硬币的过程所产生的一个比特串。这种模型一个很简单的例子,是一个有偏抛币序列(a sequence of biased cointosses),其中出现正面(对应于比特串中的1)的概率是0 和1 之间的某个固定值,而出现反面(对应于比特串中的0)的概率是1 减去出现正面的概率。
如果正面出现的概率是二分之一,那么这样一个序列中的任何表面的规律只能是偶然的结果。随着数据流变得越来越长,被这种偶然规律欺骗的可能性就越来越小,而认识到那一序列源自与无偏( unbiased cointosses)抛币相似过程的可能性越来越大。考虑2 比特数串这样一个极端情形。在无偏抛币情形中,2 个比特均为1(一种完美的规则情形)的概率是四分之一。但这样一个序列同样有可能产生于抛掷两面均为人头像(正面)的硬币的过程。因而,产生于无偏抛币过程的一个短比特串常常会被错误地当作一个有严重偏向性的序列。一般来说,一个无限长数据流的好处在于,它大大地增加了分辨各种模型的可能性,这里每个模型对应于一类特殊的规律性。
比有偏抛币序列稍稍复杂一点的另外一种模型,可能有这么个附加规定,即连续出现两个正面的序列应该抛弃。由此导致的规律性,即比特串决不会连续出现两个1,在一个长比特串中可以很容易地辨认出来。一个更复杂的模型可能包含这样一些有偏抛币序列,其中任何一个连续出现偶数次正面的序列将被丢掉。
当一个复杂适应系统接收到一个任意长的数据流时,这里不妨设它具有比特串的形式,它能够系统地搜寻某给定类型的规律性;但是,没有可用于寻找所有各类型规律性的方法。任何被识别出来的规律性都可以进而被整合到一个用于描述数据流(或者产生该数据流的系统)的图式之中。将数据流划分成若干部分——交互信息
在识别一个输入的数据流之中的规律性时,复杂适应系统通常将该数据流划分成具有某种可比性的许多部分,并研究它们之间的共同特征。许多部分所共有的信息称为“交互信息”(mu…tual information),它是规律性的特征。在用某种给定语言写出的一个文本流(a stream of text)情形中,句子可以作为待比较的各部分。各句的共同语法信息显示出语法规则。
然而,交互信息只用于识别规律性,它的量并不是有效复杂性的直接量度。在辨别出规律性并给出一个有关它们的概要描述时,那个描述的长度才是衡量有效复杂性的尺度。大的有效复杂性与中等AIC
假定所描述的系统根本没有规律性(比如那只著名的猴子所打出来的一段文字,通常就是——但并非都是——这种情形),一个正常运作的复杂适应系统也就不能发现什么图式,因为图式是对规律性的概述,而这里没有任何规律可言。换句话说,它的图式的长度是零,复杂适应系统将认为它所研究的系统是一堆乱七八糟的废物,其有效复杂性是零。这是完全正确的;胡言乱语的语法图式其长度应该是零。虽然在具有给定长度的比特串中,随机比特串的AIC 最大,但是其有效复杂性却为零。AIC 标度的另一个极端情形是,当它几乎等于零时,比特串完全规则,比如全由1 组成。有效复杂性——用于描述这样一个比特串的规律性的图式的长度——应该非常接近于零,因为“全部为1”的消息是如此之短。因而,要想具有很大的有效复杂性,AIC 既不能太高,也不能太低。换句话说,系统既不能太有序,也不能太无序。
图5—1 大致反映了系统(相对于作为观察者的正常运作的复杂适应系统)可能的最大有效复杂性随AIC 变化的情况。从图上可以看出,它只能在极端有序与极端无序之间的中间区域达到最大值。在讨论简单性、复杂性和复杂适应系统的过程中所出现的许多重要量,都具有这样一个共同性质,即它们只可能在那个中间区域取得很大的值。
当一个复杂适应系统观察另一个系统,并且识别出它的一些规律性时,从被观察系统得到的数据流的AIC 可以表示为如下两项的和:表观规则信息量与表观随机信息量。图式的长度——被观察系统的有效复杂性——实质上与表观规则信息量相等。对于一个被普遍认为是随机的数据流来说,其有效复杂性是零,整个AIC 被认为是偶然性的结果。而一个被认为是完全规则的数据流(比如一个全部由1 组成的长比特串)来说,整个AIC都是规则信息量(没有随机信息量),但它的值非常地小。有趣的是,在这样两个极端情形之间,AIC 很大但不是最大(对于具有同一长度的数据流来说),并且等于两部分之和,即表观规则的部分(有效复杂性)与表观随机的部分之和。通过基因或大脑学习
虽然我们对复杂适应系统的研究是从儿童学习的例子开始的,但是,说明这一概念并非必须借助如此高级的事物。用我们的同类猩猩——