第29章-复杂性中的思维物质-万书网

        在前面的章节中，我们已经研究了物理学、化学、生物学、地质学和天文学的复杂系统中有序模式的形成。整体有序是在其中有大量局部相互作用元素的复杂系统中形成的。在液体或晶体中有相互作用着的原子或分子，在进化的恒星系统中有相互作用着的子系统，在如同大脑这样的复杂神经系统中有相互作用着的神经元和突触。我们还向读者提示了贝纳德涡旋（“滚动柱”），它们是在液体的热涨落中出现的。

        整体的有序是如何由局部的相互作用来安排的？例如，分子之间的相互作用力在液体中发生着非常短距离的相互作用，而由分子相互作用引起的涡旋运动的模式却可以是大尺度上的有序。这种有序在物理学、化学和生物学进化中出现的原理，对于大脑极其重要，其中相邻细胞元素之间的局部相互作用，创造出来整体有序的状态，导致有机体中的相干行为。此种有序模式是由复杂系统中的元素之间的作用力和起始条件、边界条件所安排的。在贝纳德涡旋的例子中，作用力是流体相互作用、热传导、膨胀和引力。例如，边界条件是液体的温度。在大脑中，联结的模式是由细胞单元相互作用的若干种规则安排的。因为神经元往往是由非常长的轴突联结起来的，两个神经元的局部的相互作用并不意味着它们在脑解剖学上的空间接近，而是它们由轴突的紧密联结。

        尽管这种一般结构对于所有类型的神经元和突触都是普遍的，但是也有许多质的和量的差异。例如，无脊椎动物的神经系统是确定论的，个体神经元的特定部位具有高度编码的信息。而哺乳动物的新皮层中的联想系统，对于特定输入模式的特定反应，却是由促进着对于外部信息进行反馈的学习规则实现的。

        复杂系统模型对于真实的神经网络适合程度如何呢？从方法论的观点看，我们必须清醒地意识到，模型不可能朴素地与实在的每一功能和元素相一致。模型是为了特定目的进行的抽象，它能或多或少地解释和模拟中枢神经系统的某一部分，而对其他部分则没有涉及。有时，模型网络受到批评，说它们如同黑箱，仅仅在一定程度上正确地实现了输入－输出功能。但是，关于生物神经网络是怎样实现其功能的，却什么也没有揭示出来。隐含单元如同量子物理学中的隐变量仅仅是理论概念，被假定是系统实现所观察、可测量的输入和输出值之间关系的一种内在因素。除了可能的多层网络的构造之外，动力学和学习程序是模拟中的根本性问题。

        模型网络的参数调节程序减少到最小误差的现实性怎样？许多模型网络的学习规则，对于一组权重收敛到正确地进行分类，需要难以接受的过多的时间。尽管有时也会得到一个成功的权重调节，但是这决不意味着它的优化。1960年，瓦丘和霍夫提出了一种简单而优秀的学习规则，它受到技术优化推理的启发，而不是从生物观点来看待大脑。瓦丘－霍夫规则及其种种翻版，近年来在技术网络中已经得到了广泛的运用（参见第5章）。

        该规则假定，对于一种输入模式，可由适应性神经元对于输入模式的输出进行分类，它们的取值为a＋1或a－1。因此，这里假定了“教师”，他知道对于该输入的答案是什么。适应性神经元计算出输入活性的加权和乘以突触权重。在假定的输出与计算出来的和之间，系统可能给出错误的信号。根据它们之间的差，突触的权重进行了调整，重新计算出和，使得错误的信号变成零。

        瓦丘和霍夫策略的目标在于，把错误信号的平方减少到其最小可能值。所有输入权重系数的可能的值，导致某个误差值。在图4．16中，这种情况由权重空间的误差面表示出来。

        误差面的最小值并不被人精确地知道，因为不可能见到整个误差面。但是，局部的拓扑图是可以测量的。因此，绝大多数减少误差的调整方向是可以计算的。所谓的梯度下降方法，在微分几何学和物理学中是大家熟悉的，对于权重的调节总是改变权重使得系统沿误差面的最陡下降方向运动。

        在图4．16中，对误差面的梯度进行了计算，以找到最陡下降方向。权重按增量值△W沿着这一方向变化。重复该程序，直到权重达到W理想，这相应于最小的误差。对于非线性的网络，误差面可能有许多个极小值。一般地说，梯度下降的问题涉及落入局部极小值。然后，凹底也就不代表全局的最小误差。

        瓦丘和霍夫证明，存在着一个简单的二次误差面，其中只有一个全局最小值。数学上，计算出某一点的梯度意味着计算出误差平方对于权重的偏导数。瓦丘和霍夫证明了，这种导数正比于误差信号。因此，对于误差信号的测量就提供了运动的方向，以能矫正误差。技术上，具有完整知识的“教师”的存在可以为特定的目标进行调整。但是，假设自然界中的学习过程是有指导的学习程序却是不妥当的。

        在网络模型中，所谓的后向传播是人们最为熟悉的有指导算法。它是简单的瓦丘和霍夫规则的推广。总之，后向传播是神经网络中一种调节权重的学习算法。每一单元的误差是预期值减去实际输出值，可以在网络的输出端进行计算，并反复地返向网络中。这种方法使得系统可以决定如何改变网络中的权重，以改进其总体表现。图4．17示意了通过整个多层网络的后向传播方法。

        尽管后向传播的模型可以像生物学网络一样发挥作用，但它并没有假定真实的大脑也是由后向传播组织起来的。真实网络中的许多参量值往往都是通过解剖学、生理学和药理学中的测量和实验获得的。例如，细胞类型和细胞的数目可以大致估计出来。拓扑和构造可以得到描述，特定的突触究竟是激活的还是抑制的也可以得到确定，如此等等。但是，特定的权重却是未知的。当它们数以千计时，大脑网络的全局最小值和模型网络精确一致、权重相等的几率，却是相当低的。

        因此，模型网络的误差极小化策略一般说来可能只是一种假设，但是它们对于处理可能有数千参量的复杂性问题却是必要的。如果模型网络与大脑网络的拓扑、构造和突触动力学的相似度相当高，它们就允许人们预见大脑网络的某些局域或全局的性质。神经生理学中的后向传播可以正当地作为一种寻找局域极小值的研究工具，但不是作为对于神经生理学分析的一种替代，神经生理学分析可以揭示神经网络的真实的学习程序。

        误差极小化策略在自然进化中有悠久的传统，而不是在脑的学习程序中首次出现的。例如，生态群体的自然选择就可以作为一种模型，此过程将误差梯度逐渐减小到代表了某种环境生存生境的误差极小值。但是，参数调节程序可能仅仅找到了某个局域极小值，而不必是全局最小值。据我们所知，进化一般并不能找到最好的可能解，而仅仅能找到某种对于生存是充分好的满意解。在整个进化过程中，只有局部极小值才是可以从经验上对其进化生存价值进行评价的。这种评价取决于所选择的模型的观察和测量约束。

        因此，从方法论的观点看，那样一种总是全局地、完整地优化自然的观念不过是一种形而上学的虚构。思辨性的叫做“自然”或“进化”的神性观念，产生于乐观主义的文艺复兴时代，它不过是为了取代带着创世计划的基督教上帝。康德已经批判地指出，总体自优化的自然只不过是一种人的虚构，在任何意义上都不可能从经验上得到证实。不可能存在具有独立的中心处理单元，能够将进化策略进行整体、长期优化的超级计算机，在真实的进化过程中，存在的只是局域性的有一定满意度的解，它甚至带有许多缺陷，是不完善的。它们的复杂性与拉普拉斯的简化的完备世界模型是相抵触的。

        4．3大脑和意识的形成

        如何用复杂的脑模型中神经相互作用来解释认知特征呢？莱布尼茨已经提出了一个问题：如果把大脑解释为只不过是一台机器，意识、思维和感情是不可能在大脑的元素中找到的。康德强调，要使得一个物理系统具有生气，组织力是必要的。直到这个世纪，一些物理学家、生物学家和哲学家仍然相信某种非物质的组织生命因素：“生命力”（柏格森）或“隐德来希”（杜里舒）。从复杂系统的观点看，科勒的格式塔心理学是一种有趣的探索方式，涉及到这样一种物理系统，其中复杂的心灵结构自发地从系统自己固有的动力学中产生出来。通俗地说，被感知客体的宏观的“格式塔”（形式），大于其原子组件的加和，不能归结到微观尺度上。

        科勒有这样一种思想，视觉现象的产生不可能在热力学模型的框架中得到解释。但是在那时，他指的是波耳兹曼的平衡态线性热力学。他提出：“静态视觉场下的物体过程是稳恒平衡分布的，从光学系统自身固有的动力学中发展起来”。科勒甚至认识到，有机体并不是封闭系统，并力图把有序态的形成解释成一种直觉理解的协同作用。在这方面，科勒已经正确地将一个协同系统中的基本相互作用的微观水平和形成有序态的宏观水平清楚地区分开来了。