笔记摘要-涌现：从混乱到秩序

本文最后更新于 2025年8月30日晚上

笔记摘要-涌现：从混乱到秩序

这是从John. R. Holland 编著的《涌现：从混乱到秩序》（Emergence From Chaos to Order）的读书笔记摘要。

https://book.douban.com/subject/35813178/

复杂系统和构建块

复杂系统是有许多构件和组合这些构件的程序所构成的事物。机制可以被看做是对复杂系统的一种描述。构件是复杂系统的基本元素。机制的定义需要精确地描述复杂系统的基本元素，规则，和这些基本元素之间的相互作用。在更高层次上，这些机制之间可以相互作用，并且这样的相互作用并不受中枢模块的控制。另一方面，随着机制之间的相互作用的适应性不断提高，涌现现象出现的可能性也迅速增加。
在机制相互影响、相互作用的过程中，定义一个可观察到的、持续存在的模式作为Building Blocks（构建块），用来构成更复杂级别的持续存在模式。从这个表述中可以看出，涌现是具有层次性的。在每一个可观察到的层级上，上一层级持续存在的模式组合制约着下一层级的涌现模式，这种连锁的层次关系在诸多科学领域中存在。

构建块

涌现是从基本构件按照自发的一定规则构成描述复杂系统的机制的集合的过程。在发生涌现的系统中，系统的整体行为往往要比各个部分行为的总和更复杂。
作者对这种总体大于部分之和现象的解释是涌现过程是一种非线性的过程（第六章）。

抽象和忽略

日积月累的经验基于了人类理解一个复杂系统时应该抛弃哪些细节，通过删除细节得到构建块，并且遵循限制条件将构建块进行组合是获得描述复杂系统的普适框架过程（即建模过程）的关键因素。
现实中的系统往往具有混沌性：也就是具有相当复杂和稠密的内部关联关系，但是研究这样的系统并非不可能：只要研究的目标是基于合理的细节程度（换言之在对真实的复杂系统往往进行了一定程度的细节上的忽略，即进行了适度的抽象），仍然可以将目标系统作为复杂系统而非混沌系统来进行研究。因此，研究的关键在于确定机制及其描述的细节程度。

权重和博弈

塞缪尔的自动跳棋程序中包含了自动根据反馈调整特征对应的权重的机制，调整权重意味着整个关联关系发掘过程中对特征注意力的调整。作者认为，当预测失败的时候，具有较大权重的特征由于具有较大的贡献，因此需要承担更大的预测失败的责任。权重调整机制带来的影响包括：

子目标
子目标是通往最终目标的关键节点：当适应过程陷入停滞时，有一些看起来不那么好，但是权重不为零的特征（怪异的特征）开始逐渐影响是适应过程，这一步使得适应过程可以继续进行，在继续进行之后，这些怪异特征和那些真的好的特征相比因为优势不足而权重渐渐趋近于0，适应过程向着更好的目标前进。（这一过程侧面论证了GP和GEP中的“在进化逐渐停滞时中性的Building Blocks比其负面的Building Blockks会更占优势”的观点。）
预测对手
塞缪尔的自动跳棋程序中设置了一个最大最小策略：对手希望对你造成的最大破坏最小化。自动跳棋程序表现不理想的可能性有两种，要么是对手太强要么是自己太弱，无论哪一种情况上述奖励策略都会引导程序向着自我修正的方向前进。因此，作者认为跳棋程序的重点应该在于避免不利的结果上，而非直接寻求理想的结果，换言之，“避害”比“趋利”更重要。
展望
在了解博弈规则的前提下，程序可以利用对手行为的模型预测来预测几步以后的情况，并根据这个预测结果改变权重。

…
跳棋程序带来的启示是：

系统的有组织的复杂性可以通过少数简单的规则和程序得出。
基于这样的学习过程得到的预测使得持续的改进成为可能，即使是在缺乏仲裁者来区分对错与否的情况下。这个机制体现为两点：
1. 失败的预测也可以和明显的反馈那样作为改进的基础。大多数情况下需要在足够长的交手过程中才能逐渐地判定哪些步骤是非常关键的，单步交手所得到的信息非常有限。单步的信息并不能明确指出交手过程中哪些步骤才是关键的选择，仅仅根据单步反馈/即是反馈作出的调整会丢失博弈序列路径上获得的许多信息。（全局性和局部性，类比于全局的进化过程和梯度下降）
2. 即便如此，这些临时的信息也可以被利用提高跳棋程序的表现。只要后来的发生的事件或者是在展望过程中表明某个特征的预测过于乐观，这个特征的权重便会被自动修正。
在复杂环境中的学习需要提前定义流程来识别那些能够促进后续博弈优势的走法。
换言之即为适应过程中自动产生的子目标可以引导后续的博弈。在缺乏明显的行动方向时，跳棋程序将会寻找由这些特征确定的子目标，这些特征的权重必须有利（fitness>avg，即是高的不多）。
在Multi-agent的环境下，预测其他agent行动的过程中常常会产生涌现现象。

受限生成过程

普适理论框架

涌现过程逐渐地对复杂系统建模的框架应该包括如下的元素：

状态
对系统状态的定义应当包括将会影响这个系统将来的行为的、过往的完备历史。换言之，系统应当符合马尔科夫过程或者可以被马尔科夫链所描述。
转换函数
以一个函数来描述状态的转换过程。设输入为\(I\)，一个机制的状态为\(S\)，那么转换函数将被定义为\(f: I\times S\rightarrow S\)。
规则或者生成器
源语。本书的研究领域在如何用较小的一部分规则来描述庞大的复杂系统的行为。
主体/agent
主体的行为由一系列的规则进行描述（定义），主体的任务则是有规则定义的行为之下产生对输入信息的输出，并且主体之间可以以某种介质进行信息的传递。

受限生成过程用于描述一大类模型，由于生成的模型是动态的，所以称之为“过程”；支撑这个模型的机制则生成了动态的行为，而实现规定好的机制之间的相互作用“约束”或者“限制”了这种可能性。因此这种研究对象称之为受限生成过程(Constrained Generative Procedures)。对受限生成过程的理解可以包含如下四个部分：

规则即机制，机制用于定义系统中的元素，换言之即源语，它是描述系统的基本构件。机制根据一系列信息或者是行为作出反映，对输入进行处理，并产生最终的输出行为或者是信息。在这个过程中，机制的状态是可以被追踪的。机制状态的改变是通过转换函数\(f: I\times S\rightarrow S\)得到的，并且机制在下一时刻的状态取决于这一时刻的状态：\(S(t+1)=f(I,S(t))\)，GP中的函数相当于是规则.
将多种机制连接起来形成网络的过程即受限生成过程。在受限生成过程中，机制之间的相互作用产生了有组织的复杂行为。机制的种类不能太多，要易于描述，刻意删减许多细节（想想GP中经常用的四则运算符）。机制之间相互作用的影响不会因为删除了许多细节而完全避免（换言之，最基本的机制之间可能需要尽量避免相互作用的影响？）事实上，当所使用的基本机制的数量大大增加时，整个系统的复杂性会迅速增大。这种连接的过程始于一个最基本的初始机制集合，\(F\)，称为源语集合Primitive Set。当一个机制的状态序列与另一个机制的状态序列决定了另一个机制的某一输入变量的序列值时，称这两个机制相互连接。
所有的相互作用且带有某些约束条件的机制产生了构成了所有可能性的集合（EA中的搜索空间的研究）。总的受限生成过程的状态是由这个过程中组件机制的状态决定的。令受限生成过程的全局状态为与受限生成过程有关的将来的所有可能性，并将其看做一个实体。（它建议我们把“当前状态下系统所有可能的未来变化”看作一个整体性存在的实体，即系统的“潜力”或“可能性空间”。在EA中，这就像说：当前种群状态决定了下一代的所有可能演化路径（通过交叉、变异等）。如果我们把所有这些“未来可能路径”打包成一个整体，也可以说我们把系统的未来潜力看成了一个“整体实体”或“涌现实体”。）
使用基本机制建立起更复杂的机制的过程需要定义描述子集合的层次，这种过程与表现出涌现现象的系统层次性是一致的。比如计算机程序中的子程序是由基本指令组成的，这些指令是计算机程序的基本元素。通过这样定义受限生成过程的部分，我们获得了系统的层次性，这种层次性是系统表现出涌现的主要特征。

稳定模式

康威设计了一个元胞自动机（又被称为生命游戏）：这个游戏的规则如下：

每个细胞有两种状态 - 存活或死亡，每个细胞与以自身为中心的周围八格细胞产生互动（如图，黑色为存活，白色为死亡）
当前细胞为存活状态时，当周围的存活细胞低于2个时（不包含2个），该细胞变成死亡状态。（模拟生命数量稀少）
当前细胞为存活状态时，当周围有2个或3个存活细胞时，该细胞保持原样。
当前细胞为存活状态时，当周围有超过3个存活细胞时，该细胞变成死亡状态。（模拟生命数量过多）
当前细胞为死亡状态时，当周围有3个存活细胞时，该细胞变成存活状态。（模拟繁殖）

在游戏的进行中，杂乱无序的细胞会逐渐演化出各种精致、有形的结构；这些结构往往有很好的对称性，而且每一代都在变化形状。一些形状已经锁定，不会逐代变化。有时，一些已经成形的结构会因为一些无序细胞的“入侵”而被破坏。但是形状和秩序经常能从杂乱中产生出来。
比如，这个过程中，人们发现“滑翔机”这种图案模式可以让细胞稳定的存活：

“滑翔机”并不是一种一直不变的图案，事实上，是在不断地创建和删除基本单元的过程中产生了滑翔机，尽管图案中的基本单元是保持不变的，但是图案本身保留了非常好的稳定性。
但是生命游戏中也有一些图案在持续了相当相当长的时间后消散，为了说明滑翔机并不是这样的图案，还需要证明持久性是“滑翔机”这种图案的一种属性，这种证明需要更深层的理解康威自动机的规则。
一旦确认了“滑翔机”的持久性，就可以把它看作是更大的更为复杂的模式的一种组成部分。比如下图展示了一种持续不断地产生“滑翔机”的方法。从另一个角度来看，下图的整个图示也是一种稳定的模式，而“滑翔机”是这个稳定的图案中的一部分：

关系强度

在Mitchel等人提出的认知模型Copycat中使用了一种称之为滑动网络的方法来确定概念之间的关系：滑动网络中的节点表示copycat中的基本概念，节点之间的连接则表示概念之间的联系。虽然滑动网络看上去是固定的，但是每个连接都有一个称为长度的数值，用来表示联系的强度。长度反应了当前问题中相关概念的关联程度。Copycat中的主体是代码片段。其内部创立了大量的不同字符串组作为源和目标之间的桥梁。主体的活动由滑动网络中被选取的节点所指引，每次主体成功执行一项操作时，指引它的节点就会收到一个“激励”。这个“激励”将扩散到滑动网络中的相邻节点，能扩散到多少个节点取决于节点之间的连接长度。而新收到“激励”的节点将引入新的主体加入互动，同时扩散的激励也会让一些长度数值发生变化（水波纹）。

可变结构受限生成过程

在受限生成过程模型的基础上在进一步进行改进，现在受限生成过程可以自行决定建立和删除内部的连接。一个系统（如大脑、生态系统、市场或演化过程）由一组规则/模块组成，这些模块在一定约束条件下相互作用，生成新的结构和行为，而这些结构又可以修改和重组这些模块本身（结构是可变的），从而形成一个自我塑造的动态系统。
为此，需要对受限生成过程引入标准化的描述。

整体对于一个机制的标准表述包含下面三个部分：

标识（tags）是一种局部识别机制，它们是用于“匹配、连接和调度机制之间相互作用”的简单符号系统。标识构建了一种局部识别机制，允许“局部机制”通过标签匹配自然地结合。系统运行过程中，连接关系可以根据标签而变化。
输入集合，每个输入包括输入的字母序列和输入条件
转换函数，以各种输入和一组内部状态作为自变量（类比于函数的语义行为）

那么一个对机制的标准描述可以被定义为：
标识-转换函数索引-【输入条件1-输入条件2-…】

将给定任意时刻在模型中出现的所有机制放在一个称为“当前组件表”中的表格中，表中出现的每个描述都可能被执行。这样修改添加机制对应的是修改和添加当前组件在组件表中的描述。

机制的状态（输出）就可以表示为：
标识-转换函数索引-【输入条件1-输入条件2-…】-内部状态
更宏观的来看，每一条状态都可以表示为：
当前状态条目 = 描述模板（机制原型）+ 当前绑定的输入/状态/上下文
通过这样的标准化处理，机制的输出和输入具有相同的结构，因此可以被其他机制再次作为输入使用。输出结构能直接作为输入，这使机制可以构建层级结构或反馈结构。所以，系统就可以不断地自身改造自身。
如果将受限生成过程中所有机制的状态都放在一张称为“当前状态表”的表格中，机制之间所有的相互作用都以这张表作为媒介，当采用与处理当前组件表相同的方法处理当前状态表。表中的每一项都由初始集合中的某一条描述作为前缀，因此可以看做一个机制，它的动作由对应的转换函数索引确定，从而实现层级性。并且所有机制的结果是生成下一时刻的当前状态表，从而实现自我衍生和自我递归。

对于不同的\(f∈F\),如果对其单个的状态空间进行标准化，让所有的可变结构受限生成过程的自变量（输入和局部状态）均来自于同一集合，那么每个转换函数都是用的是同一个描述状态的集合。

要确定一个可变结构受限生成过程的行动（持续地追踪一个个体的变化），需要执行以下步骤：

确定输入：将当前状态表中每个机制的输入条件与表中的其他条目进行核对：
1. 如果表中只有一个条目，其标识满足输入条件，那么将条目作为该受限生成过程的输入。
2. 如果表中有多个条目，并且有多个标识满足输入条件，那么随机选择一个条目作为该受限生成过程的输入。
3. 如果没有条目满足输入条件，则意味着输入来自于外部。另一种方法是此时的输入设为空值使得转换函数可以处理这个过程。
确定输入之后，便寻找对应的转换函数，将输入值赋给转换函数，从而确定这个过程的下一个状态。
由各个转换函数\(f\)的计算结果被添加进当前状态表中。
1. 如果表中没有标识与之相同的描述串，则将新的描述串加入到这个状态表中，并且保留原来的描述串条目。
2. 如果表中已经有标识与其相同的描述串，则用新的描述串替换原来的描述串条目。为了提高这个过程的效率，有时不是直接替换，而是允许输出串删除与之标识匹配的描述串。
3. 如果表中有多个与其标识相同的描述串，那么则随机选择一个进行替换。

涌现的进一步理解

描述的层次

对于涌现现象的理解的难易程度取决于在什么层次/语境上来解释涌现现象：在某种语境中容易理解的涌现在另一种语境中可能会变得晦涩难懂。一个层次中的规律可能完全约束另一个层次的规律，但在后一层中的规律可以直接引导我们得到问题的答案；反之如果从第一个层次的原理而理解问题，其过程会变得十分冗长甚至无法实现。
换言之，如果要理解一个宏观现象，使用限制这种宏观现象的微观定律来理解它可能是非常困难的，在描述和理解一个现象之前需要首先确定理解的层次。
作者在此处举了欧几里得几何学第五公理的例子，试图说明第五公理，或者是其他更多的新的公理是建立在前四条基本公理的推导之上，那么有：
如果【提出新公理】，则【新公理为基于现有公理的定理推导】。
如此新提出的公理的描述层次建立在已经提出的公理之上，构成描述的层次关系。同时这些新推导出来的公理还可以为更高层级的公理的推导提供支持。

还原论思想

人们在观察一个系统的规律性的时候，常常会将描述提高一个层次，从而替换那些从初始原理中实现起来可能比较困难或者是根本无法实现的计算。这些规律仍然满足微观基本规律对其的约束，但是往往附带有额外的条件（假设），比如“通常情况下”，或者是“自然条件下”，当这些额外的条件无法被满足时，人们往往便会从对系统的宏观规律的探索转移到使用微观定律对其进行解释，以根据需要对问题进行更加细化的考虑。上述的从宏观描述转移到使用微观定律的描述的过程便是还原的本质。如果微观的基本规律无法解释这些反常的行为，那么人们对这些宏观现象便会缺乏理解，束手无策。

隐喻

我们现在来更深层次的理解一种语言学现象——“隐喻”。隐喻将被隐喻的对象的某些特质作为相关暗示迁移到目标对象上。因此，隐喻的源对象和目标对象往往具有某些共同特征。
更进一步的理解是，隐喻的源对象和目标对象具有同一种广义模式时，隐喻才会成功。另外一方面是，隐喻是一个语言学的概念，那么必然包括了语言信号的发出者和接收者。接收者可以成功理解发出者的隐喻的前提是接收者和发出者必须建立起相同的对“源-目标”的映射关系。那么换一个角度来看，能够听懂发出者的某个隐喻的接收者构成了某种集合，在这个集合内，所有人（不管是发出者还是接收者）对于隐喻的源和目标的核心理解是相同的。
以书中的例子为例，有一个经典的隐喻是：“男人是狼”，在这个隐喻中，“男人”和“狼”显然构成某种微观规律层面上的相似性，而且这种相似的特征构成了理解这个隐喻的基础。（按照模式定理的理解是“男人”和“狼”都是这个基本相似的模式的一个实例化对象）但是，此处需要补充一点的是“一千个读者中有一千个哈姆雷特”，接收者自身的语境在这个模式的非确定部分产生了歧义和模糊，而这种模糊正是隐喻的不确定性。

快速扫视

书中提到了人类对一个对象的快速理解基于“快速的扫视”，在快速扫视的过程中，基于预期的显著特征和次序具有很大的优越性，这种高效的对系统的快速理解建立在对某些特定的模式/特征的识别上。比如具有经验的棋手只需要关注几个特定的模式的组合，并不需要关注决策树上大量的垃圾决策。
当面对更复杂的情况时，我们的目标通常是做的更好。无论是模型还是隐喻，这种更好可能是从未出现过的、也有可能是对类似事物的一种完善：尽管人类没有遍历对局决策树上每一种对局的可能性，但是几个世纪以来，国际象棋的博弈水平一直在不断的提高。

总结

在本书的最后，作者给出了本书的八个要点，在此抄录如下：

涌现现象出现在生成系统中。
在这样的生成系统中，整体大于各部分之和。
生成系统中一种典型的涌现现象是，组成部分不断改变的稳定模式。只有这样稳定的模式才会对生成的系统将来的结构产生直接、持续、可追踪的影响。
一个稳定模式所在的环境决定了它的功能。（同一个值在数学表达式的不同的地方具有不同的表现。）
稳定模式之间的相互作用带来了约束和校验，随着这样的模式数量的增加，系统的“能力”也会增强。
稳定模式通常符合宏观规律。
“存在差别的稳定性”是那些产生了涌现现象的规律的典型作用结果。
更高层次的生成过程可以由强化的稳定性而产生。

研究 > 进化计算 > 遗传算法

笔记摘要-涌现：从混乱到秩序

https://l61012345.top/2025/06/03/论文/进化计算/遗传算法/涌现_从混乱到秩序/

作者

Oreki Kigiha

发布于

2025年6月3日

更新于

2025年8月30日

许可协议

01. 存储结构:数列和链表上一篇

12. 进化成分分析下一篇