我的财讯iPhone客户端 | 财经股票网址大全 | 添加到收藏夹

梅拉妮·米歇尔的复杂性研究巡礼

18-08-10 13:34    作者:一只花蛤    相关股票:

原创: 姚斌  一只花蛤的价值投资  今天
2018年7月30日  文/姚斌

梅拉妮·米歇尔的《复杂》这部大作源自于她在圣塔菲乌拉姆纪念讲座上的演讲。这本书的书名很容易与米歇尔·沃尔德罗普的《复杂:诞生于秩序与混沌边缘的科学》混淆在一起。实际上,当时梅拉妮举办的这个讲座,其对象是普通听众,其标题是“复杂性科学的过去和未来”。正如作者所指出的,这本书“就像一本复杂性科学的核心思想的观光指南”,因此称这本书为《复杂》,不如称《复杂性研究巡礼》更适合。

所谓的复杂系统试图解释的是,在不存在中央控制的情况下,大量简单个体如何自行组织成能够产生模式、处理信息甚至能够进化和学习的整体。复杂一词源自拉丁词根plectere,意为编织、缠绕。在复杂系统中,大量简单成分相互缠绕纠结,而复杂性研究本身也是由许多研究领域交织而成。自然界中的各种复杂系统,比如昆虫群落、免疫系统、大脑,都具有许多相似的共性。经济也是复杂系统,在其中的人或公司组成的简单、微观的个体购买和出售商品,而整个市场的行为则复杂而且无法预测。在微观层面上,个人、公司和市场都试图通过研究其他任何公司的行为来增加自己的收益。如果有人受益,就肯定会有人受损,市场能达到均衡态就认为市场是有效的。亚当·斯密将市场的这种自组织行为称为“看不见的手”:它产生自无数买卖双方的微观行为。经济学家感兴趣的是,市场怎样才会变得有效,以及反过来,为何在现实世界中市场会失效。研究复杂系统的经济学家则以复杂系统的术语来解释市场的行为。

复杂系统的共性表现为:1、复杂的集体行为。所有系统都是由个体组分(蚂蚁、B细胞、神经元、股票交易者)组成的大规模网络,个体一般都遵循相对简单的规则,不存在中央控制或领导。大量个体的集体行为产生出复杂、不断变化而且难于预测的行为模式。2、信号和信息处理。所有这些系统都利用来自内部和外部的环境中的信息和信号,同时也产生信息和信号。3、适应性。所有这些系统都通过学习和进化过程进行适应,即改变自身行为以增加生存或成功的机会。如果系统有组织的行为不存在内部和外部的控制者或领导者,则称为自组织。由于简单规则以难以预测的方式产生出复杂行为,这种系统的宏观行为有时也称为涌现。这样就有了复杂系统的另一个定义,具有涌现和自组织行为的系统。复杂性科学研究的核心问题是,涌现和自组织行为是如何产生的。

米歇尔在书中开头叙述了还原论的历史。以亚里士多德为代表的还原论者喜欢线性。如果是线性,那么整体就等于部分之和。但是这个世界却充满了非线性系统。对于非线性系统,整体则不等于部分之和。到了20世纪70年代,混沌理论出现了。混沌一词意指随机和不可预测。混沌思想的发现,使得科学的许多核心原则被重新考虑:1、看似混沌的行为有可能来自确定性系统,无需外部的随机源;2、一些简单的确定性系统的长期变化,由于对初始条件的敏感依赖性,即使在原则上也无法预测;3、虽然混沌系统的具体变化无法预测,在大量混沌系统的普适共性中却有一些“混沌中的秩序”。但是混沌理论依然无法解释复杂性系统。

之后,复杂性科学就诞生了。熵、信息量、交互信息、信息动力学等信息论中的思想在对复杂性概念的定义和对各种类型复杂系统的刻画中扮演的重要而富有争议的角色。而进化论则在其中起到主导的作用。因为生命系统是异常复杂的,它们处于有序和无序之间的某个地方。我们可以看到,在漫长的历史中,生命系统变得越来越精巧复杂。达尔文的伟大贡献在于“自然选择”,但是他无法解释遗传是如何发生的。达尔文的主要思想表述为:1、存在进化,所有物种都来自共同的祖先,生命的历史就是物种呈树状分化;2、一旦生物的数量超出了资源的承载能力,生物个体就会为资源竞争,从而导致自然选择;3、生物性状会遗传变异,变异在某种意义上是随机的,变异并不必然会增加适应性。能够适应当前环境的变异更有可能被选择;4、进化是通过细微的有利变异不断累积逐渐形成的。

复杂性的定义从来就没有统一过,也没有明确的定义。实际上,在科学史上核心概念缺乏公认的定义是很普遍的。牛顿对“力”的概念就没有很好的定义;生物学中对于如何在分子层面上定义“基因”的概念也没有达成一致。目前有九种度量复杂性的概念,但只有默里·盖尔曼的“有效复杂性”的相关度量符合圣塔菲对复杂性的直观认识。盖尔曼认为任何事物都是规则性和随机性的组合。有些事物有非常简单的规则性,其模式不断重复;有些事物则没有规则性,因为它是随机发生的。有规则性的事物,其结构可预测性大,有效复杂性就越低。没有规则性的事物,因为是随机的,其有效复杂性为零。最有序和最随机的事物,其有效性很低。有效复杂性是很有吸引力的思想,但其定义中的主观性有待解决。

为什么复杂性理论热衷引入计算机科学?这个问题来自冯·诺依曼,他是量子力学、计算机、经济学等多个领域的先驱。他很早就认识到计算与生物之间有着密切的联系。他又是人工生命科学的真正先驱。他设计的“自复制自动机”从原则上证明了自我复制的机器的确是有可能的,并且提供了自我复制的逻辑,后来证明其与生物的自我复制机制惊人的相似。在对“机器能否复制自身”的问题给予肯定的回答后,诺依曼很自然想让计算机复制自己和产生变异,并在某种环境中为生存竞争资源。可惜他还没有研究进化问题就去世了。这个问题在他的后继者约翰·霍兰得到了解决。

霍兰的主要兴趣在于适应现象,即生物如何进化以应对其他生物和环境变化,计算机系统是不是也可以用类似的规则产生适应性,于是他提出了遗传算法的构想。遗传算法其实就是图灵所说的“明确程序”。其步骤如下:1、生成候选方案的初始群体,生成初始群体最简单的办法就是随机生成大量个体,在这里个体是程序;2、计算当前群体中的各个个体的适应度;3、选择一定数量适应度最高的个体作为下一代的父母;4、将选出的父母进行配对,用父母进行重组产生出后代,伴有一定的随机突变概率,后代加入形成新一代群体。霍兰的遗传算法很有用,如今已被用于解决科学和工程领域的许多难题,甚至应用于金融、艺术、建筑和音乐。比如,在电影《指环王》中就被用于生成逼真的动画马匹。

蚂蚁群体的行为等同于“计算机算法”:每只蚂蚁都执行简单的程序,使得整个种群作为一个整体执行复杂的计算,比如在决定何时将巢穴搬往何地的问题上形成一致。因此像蚂蚁、蜜蜂这样的生物就成为圣塔菲研究的对象。蚂蚁群体中并没有领导者,蚂蚁群体“计算机”由数百万只自主的蚂蚁组成,每只蚂蚁都只是根据一小部分蚂蚁的交互来进行决策和行动。同蚂蚁一样,大脑的计算方式也是如此,数以亿计的神经元并行工作,而其中却无须中央控制。元胞自动机也是依据这些原理发明的。元胞自动机由元胞组成网络,每个元胞都根据邻域的状态来选择开或关。元胞自动机也是由大量个体(元胞)组成,不存在中央控制,每个个体只与少量其他个体交互,能够表现出非常复杂的行为,并且其行为很难甚至不可能通过其更新规则来预测。因此,元胞自动机被称为“生命游戏”,与图灵机相似。元胞自动机的奇妙在于,简单的规则能够涌现出复杂性,这简直就是神迹。有位科学家评论道,这是“我在科学中所遇到的最让人惊异的事物……”

因此,圣塔菲的科学们致力研究自然系统、免疫系统、蚂蚁群体和细胞代谢,其中的信息处理就扮演了关键角色。以蚂蚁为例,蚂蚁群体与大脑相似,都可以看作由相对简单的个体(神经元、蚂蚁)组成的网络,并且涌现出宏观尺度上的信息处理行为。蚂蚁的典型行为表现在,一是以最佳和适应性的方法搜寻事物,一是适应性地根据蚁群整体需要分配蚂蚁执行各种工作。蚂蚁分工明确,执行各种任务的工蚁数量能随着环境变化。如果蚁穴被稍微搅乱,维护蚁穴的工蚁数量就会增加。如果附近的食物源很多,质量很好,搜寻食物的工蚁数量就会增加。单只蚂蚁可以根据蚁穴环境的变化做出适应性响应,决定采取哪种工作,无需另外的蚂蚁来指挥,每只蚂蚁也仅以其他少数蚂蚁交互,而这其中并无一个中央指挥系统。不过,蚂蚁搜寻食物活动具有随机成分,对信息侦测也有随机成分,改变工种也以随机方式,但是最终蚂蚁会建立通往食物源路径的详细地图。然而,随机性必须以确定性达成平衡:复杂适应系统的自我调节不断调整各种事务的概率——个体应该向哪里移动,它们应该采取什么行动,以及如何探测庞大空间中的具体路径。这些问题构成了生命系统的意识或自我意识,也是复杂系统研究和整个科学最深的谜团。

侯世达是米歇尔的老师,他著有《哥德尔、艾舍尔、巴赫——集异璧之大成》一书。这本书的内容是思维和意识是如何从大量简单神经元的分散行为中涌现出来的,这类似于细胞、蚁群和免疫系统系统的涌现行为。侯世达认为,要想成为一个具有智能的模仿者,你首先必须理解你所模仿的对象、事件或情景。但有两种相反的策略是不合理的:有些可能性先天就被绝对排除;所有可能性都是平等的,处理的难度也是一样的,因此可以穷尽搜索所有可能的概念和关系。所有可能性都有可能存在,但问题的关键是他们的可能性不是对等的,不符合直觉的可能性确实有可能,但必须有明确的原因才会被加以考虑。蚁群的解决方案是让大部分蚂蚁采取两种策略的组合:不断随机搜索与简单地跟随信息素轨迹并沿途留下更多的信息素的反馈机制相结合。

物理、化学、数学、生物学这些以数学为导向的学科关注的往往是易于用数据处理的简单而理想化的系统,而复杂系统是很难单独用数学进行处理的,不过现在的计算机速度越来越快,已经有可能构造复杂系统的计算机模型进行试验。在科学中,模型是对某种实在现象的简化表示。科学家们做的大部分事情都是在对自然进行建模,并对所建立的模型进行研究。但是复杂系统研究的一个主要方向就是研究理想模型:通过相对简单的模型来理解一般性的概念,而不是对具体系统进行详细的预测。理想的模型比如:麦克斯韦妖、图灵机、元胞自动机、遗传算法、模仿者。其用途在于:研究一些复杂现象背后的一般机制;证明解释某种现象的机制是不是合理;研究简单模型在变化后的效率等等。

许多科学家都用理想模型来研究为什么在由自私个体组成的群体中会进化出合作。从底层看,在进化历程的一定阶段时刻,单细胞生物会互相合作以形成更复杂的多细胞生物。接着,又进化出蚁群这样的社会性生物,大部分蚂蚁为了蚁群的整体利益工作,甚至放弃了繁衍的能力,只让蚁后来繁衍后代。后来,灵长类动物群体中又涌现了更复杂的社会,社会团结,一致对外,复杂的贸易,最终出现了人类国家、政府、法律和国际条约。密歇根大学政治学家阿克塞尔罗德以计算机模型模拟囚徒困境得出了一般性结论:所有成绩好的策略都有友善的特点,他们从不先背叛对方。友善的策略中得分最低的是“绝不宽恕”策略,他们开始是合作,但一旦对方背叛,它以后就会一直背叛。虽然大多数成功的策略,既友善也能宽恕对手,但它们也具有报复性,它们会在背叛发生后很快进行惩罚,这就是针锋相对策略。针锋相对策略不仅友善、宽恕和进行报复,它还有一个很重要的特征:行为明确,具有可预见性。对手很容易就知道针锋相对采取的策略,因此也就能预知它会如何对对手的行为作出反应。有趣的是,遗传算法演化出的策略,竟然与针锋相对策略一致。这就是应用复杂系统模型研究的一个案例。

复杂系统的研究者最喜欢研究网络。许多自然、技术和文化现象经常被描述为网络,航线图就是一个明显的例子。大脑是神经元通过突触连接起来的巨大网络;细胞中的遗传活动是受基因通过调节蛋白质连接起来的复杂网络控制;社会则是由各种各样的关系连接起来的人或组织组成的网络。网络既包含数学和复杂系统动力学,又与现实世界相关,因此成为理想的研究对象。网络的特征表现为高度的集群性、不均衡的度分布以及中心节点结构。网络思维意味着关注的不是事物本身,而是事物之间的关系。一些生物学家提出生物的复杂性主要来自基因之间的交互作用的复杂性。圣塔菲的科学家们特别关注,像电网和万维网这样大规模的复杂网络为什么有时候非常稳健,有时候又突现大范围崩溃,什么样的事件会让本来很稳定的生态群落瞬间崩溃?于是,网络思想为描述自然界复杂系统的共性提供了新的思路,也使得从不同领域得到的知识能相互启发,比如,如何让网络上的搜索变得高效,如何控制流行病,如何管理大型组织,如何保护生态系统,如何应对威胁身体中的复杂系统的疾病,等等。

有人将网络生长机制叫做“偏好附连”,用以解释网络的无尺度特性。其中的思想是,网络在增长时,连接度高的节点比连接度低的节点更有可能得到新连接。这就好像朋友越多,就越有可能认识新朋友。网页的入度越高,就越容易找到,因此也更有可能得到新的入连接,换句话说就是富者越富。一篇论文如果被另一篇论文引用,就得到一条入连接。论文被引用的次数越多,连接度就越高。人们一般认为被引用次数越多,论文就越重要。这个偏好附连机制就是作家格拉威尔德所说的“引爆点”,论文引用、时尚流行等过程通过正反馈循环开始剧烈增长的点。当然,引爆点也可以指系统中的某处失效引发系统全面加速溃败。有一种很普遍的网络传播现象叫做“连锁失效”:小事件触发加速正反馈,结果小问题导致严重后果。比如,长期资本管理公司(LTCM)得到数家大型金融公司担保从事风险投资,结果将公司的权益价值几乎赔光。美联储担心它的亏损会导致全球金融市场崩溃,因为为了偿债,LTCM会不得不卖掉大部分资产,导致股票等有价证券的价格下跌,从而迫使其它公司也抛售资产,导致价格进一步下跌,甚至崩溃。为了防止这种局面,美联储召集了其主要债权银行对LTCM进行援助。连锁失效对计算机网络、导弹防御系统、电子银行、证券市场的威胁很大,其威胁来自复杂本身。

网络思想还引发了一个新的难题:生物大小变化时其他属性会如何变化。体重与代谢的关系对于理解生命的运作极为重要。于是,又有了布朗等人的“代谢比例理论”。这个理论认为,代谢率应该主要是由细胞输送原料的效率决定,而输送原料是生物循环系统的工作。对循环系统来说,其中决定作用的不仅是它的质量或长度,更重要的是它的网络结构。比如,大多数动物循环系统的毛细血管都是一样大。只是越大的动物毛细管越多,这是因为细胞的大小不受身体大小影响:老鼠和河马的细胞都差不多大,只是河马的细胞更多,因此也需要更多的毛细血管向它们提供养分。进化将我们的循环系统塑造成了接近于四维的分形网络,从而使我们的新陈代谢更加高效。这个理论可以解释其他四分幂比例律,例如心率、生命期、妊娠期以及睡眠时间等。有人认为这个理论“有统一整个生物学的潜力”,“对生物学的重要性就好比牛顿发现对于物理学的重要性”。这其中涉及到的幂律,在城市规模、收入、地震、心率变化、森林火灾和股市波动等现象中都得到发现。,科学家们一般都假定大部分自然现象都服从钟形曲线或者说正态分布,然而幂律却在很多现象中都有被发现。以至于有些科学家说它比正态还要正态。曼德布罗特是发现分形而闻名的学者,感兴趣的人可以了解一下分形理论。

在过去几十年中没有什么技术影响比得上所谓的分子革命对于遗传学的影响。对DNA进行快速复制、测序、合成,实施DNA工程,对分子层面的结构进行成像,同时观察数以千计不同的基因的表型,这些都是圣塔菲科学家们最感兴趣的主题。因为基因序列本质上被视为细胞的“计算机程序”,通过RNA、核糖体等物质的译码和执行,合成出相应的蛋白质。DNA在复制过程中会有小的随机变化,对有利变化的长期累积最终会导致生物的适应性变化,并产生新的物种。在这其中,斯图亚特·考夫曼发明了“随机布林网络”模型。他认为,个体发育过程中的美丽秩序部分是自发的,是极度复杂的调控网络所包含的惊人自组织的自然表达。秩序无处不在,而且有生命力的秩序是自然发生的。复杂生物的进化部分是由于自组织,部分由于自然选择,而且可能自组织才是起主导作用,对选择的可能性施加了严格的限制。考夫曼的研究意味着对选择在进化论中的地位进行根本性的重新解读。

生命系统的复杂性是如何进化出来的?这个进化生物学中最重要的问题目前仍未得到解决。实际上,对生物复杂度的完全理解才刚刚开始。现代复杂科系统科学仍然没有统一成一个整体,还是松散的大杂烩,其中有一些相互重叠的概念。对于复杂系统,我们甚至不知道它的基本要素是什么,除非我们已经知道了统一理论的概念组成和基本要素,否则谈统一理论没有什么意义。虽然复杂系统理论中有很多一般性原理不是很有用,但其中的共性发现可以是复杂性研究反馈环的一部分,具体的细节与共性相互启发、约束和丰富对方。复杂性科学的主题和结果已经触及几乎所有科学领域,而且像生物学和社会学这样的研究领域已经被这些思想深深地改变。因此有人认为,复杂性科学的一些形式正在改变整个科学思想。


 
声明:本文内容由原作者博客的RSS输出至本站,文中观点和内容版权均归原作者所有,与本站无关。点此查看原文...

我要评论

(200字以内)