万书网 > 心理哲学 > 智慧大脑:高水平思考的大脑认知训练 > 第7章 永不消逝的记忆

第7章 永不消逝的记忆

    一般记忆与模式

    本章我们将探讨一般记忆,或者说“模式记忆”。环境中每出现一次相同或相似的事物,或者说,以语言或其他方式每传达一次相同或相似的信息,都会给支撑记忆形成的反射回路注入新的活力,增加将记忆转变成长期记忆的机会。用我们的广告牌来类比,假设你在回家的路上默诵着一个几分钟前看到的有用的电话号码,如果你在路上再见到一块写着相同号码的广告牌,那么你到家时记住它的可能性就会大大增加。

    这是一个有点达尔文主义的过程,因为不同的记忆需要相互竞争才能在有限的长期记忆系统里占据一席之地。频繁被使用的信息通常是赢家,而不常被使用的信息可能会被遗忘,被扔进记忆的垃圾箱。你会认为记忆能否进入长期系统应该由它们的重要性决定,但我们知道并没有小人坐在大脑里指挥神经运作。即使有,他也很难预测从长远来看哪条信息重要,哪条信息不重要,因为“重要性”主要是一个预期概念。由于特别相关的信息可能会被更加频繁地调用,而经常被需要的信息会被定义为重要信息,使用频率也就成了重要性的一个替代“统计”标签。

    然而,重要性也可以更直接地对记忆的形成施加影响。如果按照先前的经验或基因决定理论来说,大脑会立即判定某些信息“非常重要”,随即一个叫作杏仁体的脑组织会变成记忆形成反射回路的一部分。这极大地促进和加快了牢固记忆的形成,使其在记忆竞争中遥遥领先。过去几十年,神经学家越来越清晰地看到包括大脑机制在内的很多生物进程的达尔文主义属性,这体现在杰拉尔德·埃德尔曼“神经达尔文主义”的著名理论中。记忆的形成似乎也不例外。

    不同的经验会激活不同的神经元网络,但没有哪两个神经元网络是完全一样的。不过,经验越接近、越相似,神经网络之间的重叠部分就会越多。相似但不完全相同的感觉会唤起神经元网络中间的通用核心,对该核心的频繁激活是迅速进入长期记忆系统的最好机会。

    对心理学家来说,这种快速学习相似但不相同情境的共有属性的倾向,反映了学习过程的一个著名的基本特征:过度概括现象。在早期学习阶段,人类和动物都倾向于将相似但不相同的情境理解为完全一样,他们对情境共性的学习要比对情境特性的学习快得多。

    共享网络,即特定网络的重叠部分,不是一个事物或事件的单一心理表征,而是一类相似事物或事件的整体心理表征。我们刚刚追溯的是一般记忆的形成!这种一般记忆是模式记忆。模式越普通,重叠部分显现的经验集越大,模式记忆就越牢固,越不容易受脑损伤的影响。这意味着抽象表征通常比对应独特事物的具体表征更能抵挡大脑衰退的影响。

    图8 网络的重叠

    特定网络——巧克力色拉布拉多犬史努比;黑色杜宾犬菲多;浅黄褐色牛头獒布里特。一般网络——一只狗。

    典型的模式拥有一个非常有趣的特性。它不仅包含你已经遇到的事物的信息,而且包含你将来可能遇到的事物的信息。这是因为模式既记录了一类事物或事件的共有属性,也记录了其中每一个成员的特性——番茄、椅子、暴风雪、政治危机、某一类微分方程、股市崩盘。因此,模式会帮助你处理将来可能遇到的个例,方法是立刻告知你这一类事物或事件的所有基本属性。“一般记忆或模式”的概念适用于任何一种实体的共有属性,无论它们是实物、社会事件,还是口头表达。

    现在我们弄懂了为什么在所有的记忆中,一般记忆或模式最稳定、最不容易受脑神经疾病影响的原因。若是仔细研究逆行性遗忘的影响,你就会特别清楚地看到这一点。如果逆行性遗忘对不同记忆的影响不同,那么由于使用频率的可变性和联想的丰富性,你可以假设这些记忆的牢固程度也各不相同。长期以来,逆行性遗忘影响哪些记忆、放过哪些记忆,一直是神经心理学家和神经学家探究和争论的主题。这种探究过程得出了一些最重要的认知神经科学观点。

    第一个观点涉及程序性记忆和陈述性记忆之间的区分。最先提出这种区分的是拉里·斯奎尔(Larry Squire)和他的同事,强调“怎么样”和“是什么”之间的不同。程序性记忆是关于技能的记忆,骑自行车、打网球以及知道如何打领带都属于程序性记忆。相比之下,陈述性记忆是关于信息的记忆。“一周七天”、“巴黎是法国的首都”或者“1945年‘二战’结束”等知识都属于陈述性记忆。和神经心理学里的很多区分一样,程序性记忆和陈述性记忆之间的区分并不是一刀切。例如,你如何划分下棋或移动棋子的知识?它是真正的知识,还是严格意义上的技能?撇去灰色地带不谈,这种区分对大脑研究具有重要的启发价值。通常来说也有例外,逆行性遗忘一般会影响陈述性记忆而放过程序性记忆。

    由恩德尔·图尔文(Endel Tulving)首先提出的情景记忆和语义记忆的区分同样影响深远。我们将会看到,这种区分将陈述性记忆进一步划分成两种更加精确的类别。情景记忆同时存储记忆和产生记忆的环境,可能是重要事件或信息,也可能是最不起眼的小事。多数人在记住约翰·F.肯尼迪在达拉斯被暗杀或者“9·11”背后的含义这类知识的同时,也会记住这些事件发生时个人所处的环境。简单来说,大多数经历过这些事件的人,都清楚地记得他们得知消息时在哪里以及在做什么。同样的道理也适用于更为平凡的生活事件,比如你第一次买车或第一次参加求职面试,你不仅可能记住汽车的车型和未来雇主的名字,还会记住当时的实际场景。

    相反,语义记忆的存储独立于产生记忆的环境。大部分人都知道“意大利的首都是罗马”,“爱因斯坦是伟大的科学家”,“一周有七天”,或者“金属物体不能浮于水面”,但他们不记得自己是在何时以及何种情况下掌握这些信息的。

    和程序性-陈述性记忆的区分相同,语义-情景记忆的区分也有灰色地带。一个人的语义记忆可能成为另一个人的情景记忆,反之亦然。对本书的大多数读者来说,“9·11”事件是情景记忆,但对于在事件很久之后才出生以及从教科书或电影中了解它的人来说,它将是语义记忆中的一个条目。相反,对大部分人来说,浩瀚的水域下面可能会有危险的暗潮,这属于语义记忆知识,但对我来说,它在很大程度上却是情景记忆。这是因为有两次我差点淹死在地中海:两次都发生在很多年前,都是因为我的年轻鲁莽,也都曾使我濒临死亡,但我还是游上了岸,这样我才能来到这里讲述这个故事。

    情景-语义记忆的区分对认知神经科学同样具有最深远的意义,已被用于界定逆行性遗忘的范围。人们普遍认为,逆行性遗忘会损害情景记忆,不会损害语义记忆。但事实证明,无论是程序性记忆和陈述性记忆的区分,还是情景记忆和语义记忆的区分,都无法真正决定脑疾病下不同记忆的最终命运。在生物学研究中,已经确立的理论和观点遇上它们无法解释的特殊临床案例并最终被推翻的情况并不罕见。很多年前,我和同事就碰到过这样一个案例,它改变了我们对逆行性遗忘的严重程度及其范围的理解。接下来我们将研究一名摔下马的骑手的记忆问题。

    丧失记忆、恢复记忆、幸好没丢掉的记忆

    史蒂夫(化名)是一起落马事故的受害者,严重的脑外伤使他失忆了,他当时在我工作的医院住院治疗。他同时表现出严重的顺行性遗忘和逆行性遗忘症状。我密切参与了治疗过程,同一天之内会无数次见到史蒂夫,但他对我毫无印象——不管是我的名字,还是我们15分钟到30分钟之前的会面。这是一种严重的顺行性遗忘迹象。

    史蒂夫的逆行性遗忘同样严重。他当时30多岁,是一位非常成功的企业家,也是一位充满爱心的丈夫和父亲。但事故后的史蒂夫却什么都不记得了。他的记忆停留在17岁。他把父母的住址当成了自己的住处(他17岁时确实和父母住在一起)。他否认自己曾上过大学、结过婚以及有了孩子。他可以清楚地叙述直至17岁的所有生活,也可以磕磕巴巴地叙述随后两年的生活。但从19岁到36岁,他的记忆完全是一片空白。

    如果用里克特级数来衡量遗忘,0代表记忆清晰,10代表完全失忆,史蒂夫的失忆程度至少达到8。但类似严重程度的案例已经有过,因而我们期待史蒂夫会按照神经学教科书描述的过程康复:逆行性遗忘迅速大量地恢复,顺行性遗忘相对较慢、较少地恢复。根据常见的情况,史蒂夫会很快恢复过去的记忆,但仍然不能在下午回想起上午从《纽约时报》读到的主要新闻。这应该是记忆恢复的完整路径。

    但随着史蒂夫记忆的恢复,我们目睹了一幅完全不同的图景,起初感到难以置信,随后却沉迷其中。他学习新信息的能力稳步提高,因此顺行性遗忘只残留了一点非常细微的迹象。日复一日,周复一周,史蒂夫的记忆恢复到足以重新认知连续印象的程度。虽然在正式测试中仍存在新信息学习的轻微障碍,但对于大多数日常实践来说,他的记忆没有问题。

    但史蒂夫对过去以及事故前生活的记忆并没有像预期的那样恢复。他仍然认为他生活在17~19岁,并对他之后的生活一无所知。他不记得他上过大学,也不记得他的成功企业家的事业生涯。他认识他的父母和哥哥,但不认识他的妻子、孩子和生意伙伴。而且,他的这些记忆甚至没有一丁点儿恢复的迹象。由于史蒂夫学习新信息的能力突飞猛进,他重新学习了很多与家人相关的生活信息。但是,他明确区分了自己真正记住的过去和被他人告知的过去。这种顺行性遗忘首先恢复而逆行性遗忘“拒绝让步”的恢复过程,从神经学的角度来看是不可能发生的,但它偏偏发生了,就此改变了我对记忆机制和记忆障碍的理解。

    似乎这样还不够,史蒂夫的记忆障碍还带来了另一个谜题。他的逆行性遗忘不限于情景记忆,还包括语义记忆。这也和当时学界普遍持有的观点相矛盾,即逆行性遗忘仅会影响情景记忆。史蒂夫不记得他的大学生活,这是情景记忆丧失的一个表现。但他也不记得“马德里是西班牙的首都”,“牛顿是一名物理学家”,以及“莎士比亚是《李尔王》的作者”。这充分反映了语义记忆的丧失。

    史蒂夫的语义记忆障碍相当严重。这不但表现得很清楚,而且从某种意义上对照来看,他的语义记忆比情景记忆受损更严重。史蒂夫17岁之前的情景记忆完整无缺。但考虑到他的情况,你可以想当然地认为他在17岁之前一定学过这些他现在完全不记得的信息。莎士比亚?牛顿?马德里?在受过高等专业教育的中产阶级家庭,例如史蒂夫家,孩子们一般在10岁或12岁就会学习这类知识,也可能还更早。

    不过史蒂夫的语义记忆受损到何种程度呢?是全部受损还是部分受损?随着对史蒂夫语义记忆的研究,我们越来越清楚地看到它在某些方面得以幸免。他知道一年有多少周,分得清番茄的颜色;他能够准确地判断男性和女性的身高、体重。

    我和当时的研究助理鲍勃(“奇普”)·比尔德[Bob(“Chip”)Bilder]开始对史蒂夫的记忆进行更为系统的研究。我们很快发现,史蒂夫关于特定信息的知识严重受损,但关于一般信息的知识得以完整保留。他的记忆障碍是局部的但却是持久的,而且无法完全恢复。史蒂夫的案例告诉我们,语义记忆在脑损伤后也可能受损,但不会完全受损。这似乎是一般记忆和特定记忆的关键区别。关于特定信息的记忆会受损,关于一般信息的记忆不会。看来在所有的记忆当中,一般记忆永远不会消失。

    有了史蒂夫异常(或者说看起来是)记忆障碍引发的新思考,我和之前的研究生比尔·巴尔(Bill Barr)开始对逆行性遗忘进行更广泛的研究。抛开陈旧的偏见,我们发现史蒂夫的逆行性遗忘在已知的各种影响记忆的神经疾病里,与其说是特例不如说是规则。事实证明,脑外伤、阿尔茨海默型痴呆和科萨科夫综合征会严重损害关于特定信息的语义记忆。但在同等情况下,关于一般信息的语义记忆相对来说不会受到损害。

    永不消逝的一般记忆

    我们越是研究不同类型的记忆障碍,越是发现区分一般记忆和特定记忆的重要性。记忆构成了我们的心智生活,但并非所有记忆都能力均等。有些记忆对大脑疾病(包括老化)的影响更具抵抗力。特定记忆(描述特定事物)和一般记忆(描述整类事物的共有属性)的区分非常重要,因为它决定了我们如何理解脑疾病和脑衰退下不同知识的命运。“巴黎是法国的首都”属于特定记忆。因为只有一个巴黎和一个法国,所以这个知识指的是一个特定的实体。相反,“番茄通常是红色的”属于一般记忆,因为世界上有数不清的番茄,而这个知识指的是它们全体。

    通常,一般记忆比特定记忆的受访频率要高。普通美国人多长时间会调用一次“巴黎是法国的首都”这种知识?一个月之内屈指可数,有时是新闻里提到了巴黎,有时是你打算去度一生仅有一次的梦想假期。但当你每次穿行在超市的货架前或是把叉子插进每天的午餐沙拉时,你都会调用“番茄通常是红色的”这一知识。因此,一般记忆要比特定记忆牢固得多。由于使用频率很高,一般记忆能更快地变成长期记忆。结果,它们得以独立于在阿尔茨海默病和其他类型痴呆症里特别容易受损的皮质下组织(确切地说,是独立于非新皮质脑组织,因为海马体及其周围组织也是皮质的一部分,但它们不是新皮质)。

    图9 如何对知识进行分类

    如果我们仔细想想心智生活的两个不会随着年龄增长而退步的基本特质——语言和高阶知觉,一般记忆相对不易受到损害的特性就会变得非常明显。尽管我们往往不会把这些能力当成“记忆”,但它们确实是。为了有效地使用语言,我们需要“记住”哪一个词指代哪一种事物,因为两者的联系在大多数情况下是任意的,且无法从逻辑上推导。将词语“椅子”指代桌子、“桌子”指代椅子的语言和我们使用的语言一样有效。词语的意义是我们的语言能力的基础,而关于词语意义的记忆无疑是一般记忆,因为任何给定的词语指代的都是一整类的相似物体。白色的装饰艺术桌子、黑色漆面的中式桌子以及你家附近咖啡馆里摇摇晃晃的破桌子,都属于同一个类别,而你在提到它们时用的是同一个词“桌子”。

    同样,我们识别物体的能力也建立在记忆的基础上。难道你不惊叹于自己在遇到从未见过或听过的某样事物后立即就能知道它是什么的能力吗?你在街上看见一辆精心设计的老爷车,你知道它是一辆汽车,尽管你从没见过这样的车。你听见外面传来一个声音,你知道那是狗在叫,尽管你从没听过这样特殊的叫声。要拥有这种能力,你必须在大脑的某个地方存储抓住一类事物共同特征的一般记忆。你必须具备一个先前形成的模式。然后,当你遇到一个包含足够多共同特征的物体时,一般记忆就会被唤起,这就是物体识别的机制。

    因此,语言和高阶知觉都是基于一般记忆。某些脑疾病可能会彻底摧毁这些记忆,导致病人丧失使用词语和识别普通物体的能力。你也许还记得在心理学和医学术语中,这两种症状被称为“命名不能症”和“联想失认症”。中风、脑外伤、痴呆和其他一些脑疾病都可能会造成这种一般记忆的崩溃。但新皮质一定是语言和高阶知觉受损的直接原因。我们知道,单单是皮质下组织受损不会影响语言和高阶知觉,因为一般记忆并不依赖该组织。特别重要的一点是,语言和高阶知觉同样能抵抗正常老龄化的影响。其原因,至少是一部分原因,就在于它们独立于皮质下组织。 [1]

    随之而来的是一个很重要的问题:既然特定记忆由新皮质和皮质下组织共同决定,那么两者中有一者受损,或是连接两者的神经束受损,都会导致记忆衰退。从神经学角度来看,这等于面临双重危险。相比之下,一般记忆只依赖于新皮质。这意味着影响它们的脑损伤种类会更明确。虽然不能完全避免衰退(谁也不能),一般记忆在神经上的“阿喀琉斯之踵”更少,也就是神经易损点更少。 [2] 这就是为什么一般记忆往往不会随着年龄增长而衰退,甚至在一定程度上能抵抗痴呆影响的原因。

    特定思维任务经常用到的知识,会促使该任务加快形成一种强健长期的心理表征,而与之相关的一切(包括以前的成功方案)还有很长的路要走,这样我们才能最终理解为什么某种记忆能够抵抗大脑衰退的影响。不过,结构性新皮质表征的形成,并非大脑进化出的保护重要信息免受神经退化和神经疾病侵害的唯一“守卫”,还有其他保护机制在发挥作用。

    这些机制的发现要归功于先进的功能性神经成像的方法。这些方法包括FMRI(功能性磁共振成像)、PET、SPECT(单光子发射计算机断层成像术)、MEG(脑磁图)等,使我们在科学史上能第一次在活体进行心智活动时观察到大脑的生理激活。这些方法的引入改变了神经心理学和认知神经学的面貌,不亚于发明望远镜推动了天文学的发展。没有哪一个研究领域可以只依靠概念发展,而强大新技术的引入(它们本身是其他领域新思想的产物)通常对科学进步具有决定性的作用。

    运用这些方法,研究人员在新皮质里发现了另外两种常用知识的保护机制。它们是“模式扩张”机制和“轻松专家”锻造机制。这两种机制协同工作。

    模式扩张,是指通过实践、经验和重复使用分配给某种运动能力、知觉能力,也许还有认知能力的脑区扩张并接管邻近的皮质部位。加利福尼亚大学旧金山分校的迈克尔·梅尔策尼希(Michael Merzenich)及其同事在猴子身上做的各种技能学习实验证明了这一点。更确切地说,人类身上也已出现类似的效果。阿尔瓦罗·帕斯夸尔-莱昂内(Alvaro Pascual-Leone)已经证明,盲人之中,使用相同手指阅读六点盲文和简写盲文的个体,前者的手指皮质投射区比后者的要大。同样,弦乐演奏家左手手指的皮质投射区比其他人的要大。这种扩张使模式更能抵抗脑衰退和脑疾病的影响。要想理解该机制的工作原理,只需想象一个带有一定数量孔洞的蜂窝乳酪模型。假设孔洞的数量和大小保持不变,那么整片乳酪的面积越大,孔洞影响不到的面积就越大。

    虽然听起来可能无礼又过分简单,但蜂窝乳酪的类比并未离题。很多增龄性脑疾病中,影响大脑的都是破坏神经细胞和扰乱细胞间通信的微小、离散病灶。阿尔茨海默病的病灶是臭名昭著的微观缠结及斑块,也就是衰退和死亡的神经组织碎片。路易体痴呆症的病灶是微观的路易小体,这种痴呆症也是一种主要的退行性疾病,尽管它不那么为人所熟知,但同样对身体影响很大。还有另外一种由广泛分布的脑血管失调引起的痴呆症,即所谓的多发性脑梗或小血管疾病,其病灶是遍布大脑的微小梗塞。无论这些病灶的致病源和发病机理是什么,它们都会随机破坏大脑组织,就像是对着靶心投飞镖。然而,靶心的整体范围越大,飞镖涉及不到的部分就越广——即使不一定成比例,但至少按绝对值算,这一点对认知技能的保留可能最为重要。

    研究人员在明尼苏达州圣母玛利亚修女会发现一种令人费解的现象,即修女会成员不但长寿,而且到年老时头脑也很清醒。其原因,至少部分原因很可能就是模式扩张机制。一些修女死后,对其大脑的检验结果显示出明显的阿尔茨海默病征兆,但实际上她们在最后的日子里认知能力健全,并没有表现出心智衰退的迹象。阿尔茨海默病影响了修女的大脑,但没有影响她们的智力。虽然对修女的研究是个例,但我肯定这种现象本身并非独一无二。

    模式扩张提供的保护也许就是很多上了年纪的医生、律师和工程师仍能高水平地履行专业职责的原因,尽管他们在日常生活中偶尔会记忆缺失或注意力不集中。

    我喜欢把另外一种大脑保护常用心理表征以对抗衰退的机制称作“轻松专家”。根据实践和经验,执行任务的神经组织会降低新陈代谢的要求。这意味着大脑可以用较少的资源可靠地解决日常问题,其中包括血液供应的减少。这一发现和我们大多数人对日常生活的观察相符。当疲惫、饥饿或睡眠不足的时候,尽管你能完成一项熟悉的任务,但面对复杂程度相同或较低的新任务时却会惨遭失败。

    现代功能性神经成像法让我们能够非常精确地证明这种效应。在早期的研究中,R. J.海尔(R.J.Haier)和他的同事使用了PET来探索在执行一项复杂的新任务时大脑对葡萄糖的代谢需求。实验任务选择了俄罗斯方块,一种令人沉迷的空间拼图游戏,它可以达到相当复杂的程度。他们发现随着实验对象对任务的熟练掌握,代谢需求会稳定下降。经过几个星期的练习,大脑的代谢需求大幅度降低,但任务执行力提高了7倍。值得注意的是,那些通过练习最大程度熟练掌握任务的实验对象的代谢需求的跌幅也最大。这真是事半功倍!

    最近使用FMRI对物体分类任务进行的研究也证明了类似的“少即是多”效应:随着执行任务熟练度的提高,完成度也在提高,而与任务相关的皮质激活水平却降低了。通过一个巧妙的实验,伊恩·多宾斯(Ian Dobbins)和他的同事证明这种效应的“少”是因为分析复杂问题的能力得到了提炼,“多”是因为这种分析的提炼完全有利于习得反应的自动执行——一种模式识别的快捷机制。

    用较少的代谢资源熟练完成一项任务的能力可以很好地抵抗大脑神经疾病。在老龄化过程中,大脑局部血液供应不足障碍相对比较常见。这种障碍形式多样,从轻微到严重不等,可能会影响不同的动脉及其分支。这种障碍最常见的成因是胆固醇和其他碎片沉积在血管壁上导致血管狭窄。因此,依靠阻塞的动脉或小血管流向大脑局部的血液及其携带的氧气供应就会减少。局部血液供应的急剧减少可能导致中风,从而造成不可逆转的组织伤害,但血液供应的轻微减少仅会使人的认知迟钝。用减少的血液供应完成复杂心智任务的能力,可以说是保护脑功能免受脑血管疾病不利影响的一种强大“武器”,尽管它不是无限强大。

    模式扩张机制和“轻松专家”机制协同合作,增加了分配给熟练认知任务的大脑空间,降低了有效执行这些任务必要的代谢需求。当它们的保护能力达到一定程度,模式扩张机制和“轻松专家”机制的联合效应也许在很长一段时间内足以抵消大脑退化和脑血管疾病的影响,这段时间可能是数年,甚至可能是一二十年。

    随着我们对记忆形成及其粗略神经解剖学基础“鸟瞰图”的日益完善,我们也开始认识到在更为微观的尺度上发生的记忆过程。永久性记忆究竟如何形成是我们深入研究的课题,而且还有很多问题有待解决。我们远未搞清楚这些过程的细胞作用机制,相关的新的信息飞速涌现,以此为主题的书很可能到出版的时候就已经过时了。写作这本书时,最有意思的一个发现是朊病毒可能在记忆的细胞机制中所起的作用。这些令人震惊的强健蛋白质直到最近才被发现与无法治愈、后果严重的神经疾病,比如也被称为海绵状脑炎的克雅二氏病以及疯牛病有关。但事实证明,强健到几乎不可毁坏的朊病毒,可能在牢固记忆的形成过程中非常有用。

    记忆的细胞机制太过复杂,在这本书里我们无法完全探讨。但显然,记忆形成的变化发生在突触上,也就是相邻神经元之间的微小接触面。这些变化可能涉及新树突的生长、神经递质(负责神经元之间通信的化学物质)的增加以及受体(神经递质所附着的微粒)的增加。这些变化促进了神经元组内部的连通,因此只要激活其中任何一个子集,就会在特定路径上触发一连串的激活。这就像水流在沙地上沿着已有的凹槽流动。很多科学家——我也是其中之一 ——认为这种神经通路的形成就是长期记忆的形成,而它们的激活就是在回想先前存储的信息,或是在识别已知分类里的一种特定事物。

    沙地上的凹槽这个类比虽然有帮助,但仅限于一定程度。每激活之前形成的一个记忆,你都在“润物细无声”地改变它,方法是将其嵌入一个由当时心智活动的特殊背景所唤起的新环境。因此,凹槽的外观也会产生细微变化。为了说明这一点,我正在想象一头长着螺旋形象牙和条纹躯体的紫色大象。这是我人生中第一次幻想这样古怪的生物,基本上是把首先想到的东西写了下来。在此过程中,我激活了我对大象的视觉记忆,一个我不经常激活的健全心理表征。但这个无聊的练习却让我把大象的心理表征与作为抽象概念的“记忆”的心理表征以及沙地凹槽的心理表征连接起来。这意味着潜在神经元网络之间的连接一直在机械化地轻微地重新配置。这种变化可能是短暂的,无法在严酷的神经自然进化过程中持续。然而,假如我将来在讲座上继续以它为例向学生说明本书的目的的话,潜在神经网络之间就会形成一种持久的变化,这种变化就可能得以保存下来。因此,我们每一次回想的时候,记忆都在经历重建和重组。

    这种变化,即神经网络的动态性质,可能就是先前形成的记忆一旦被用于新任务、新环境中,就必须启动某些其他生化过程来“重新加固”它的原因。当这些生化过程受到干扰的时候,以被动、稳定的形式存储于头脑中的记忆,经过新环境的激活以后,就无法再成功地“存回”原先的状态了,它再也不是从前的记忆了。

    [1] 语言知识和感性知识在人类认知中占据着特殊的位置,甚至心理学家也不把它们称作“记忆”,尽管它们实际上都属于“一般记忆”。按照主流的术语惯例,“记忆”大多指的是我们这里所说的“特定记忆”。相反,大多数“一般记忆”(比如词语含义或者普通物体的意义)被排除在“记忆”之外。同样,“遗忘”(记忆丧失)通常不涉及词语含义的记忆丧失(病人认识普通物体但无法说出它的名称),取而代之的是“遗忘症”;“遗忘”也不涉及普通物体识别的记忆丧失(病人不能识别普通物体是什么),取而代之的是术语“失认症”。对于像我这样的临床医生来说,这种违背术语定义的常识可能会造成持久的困惑,因为我的病人完全不管复杂的术语知识,他们仍依据陈旧的常识描述他们的症状,当他们不断抱怨“记忆问题”时,实际上指的是“遗忘症”或“失认症”。

    [2] 史蒂夫的遗忘症就是很好的例子。由于没有先例,我们做了一些临床研究才找到原因。由于史蒂夫脑干中脑腹侧部分受损,特定记忆被消除,而一般记忆得以幸免。

    “吸引子”大脑

    人类如何形成记忆和回想记忆的复杂细节还有待整理,计算神经科学对这些过程的洞悉却越来越详尽。与生物学和心理学的其他分支一样,脑科学传统上是一门实证学科,需要通过艰苦的观察和实验确立一般原则。不过,判断一门学科的成熟程度,基本上都是看其发展理论分支的能力。

    我们来看计算神经学。在我看来,“计算神经学”的说法乏善可陈,因为它没有传达出这门新学科的广度和丰富性。我更倾向于和“理论物理学”内涵相似的“理论神经学”(虽然我认为形容词“理论”和“生物学”联系在一起本身就带有偏见,更别提“心理学”了)。在过去,与内涵严谨精确的术语“理论物理学”相比,它通常代表着冗长的废话和无法证实的猜想。也许正因为这样,人们才会格外谨慎地使用“理论神经学”这个词,甚至勉为其难地使用干巴巴但感觉更安全的“计算神经学”来替代它。

    但今天的计算神经学或许是脑科学最严谨的理论分支。起初,这一新领域使用的方法主要是对大脑内一些精密、孤立的过程建立数学模型。大功率计算机的出现引发了一种理论和实验相混合的特殊方法——计算机建模。关于生物系统复杂结构的理论被假定为一种计算机模型,我们从经验出发,通过让它执行不同任务以及改变它的各种参数来研究模型的“行为”。出人意料的是,这种理论和实验相混合的方法,远比单独使用其中一种方法取得的成果要多。其中一些成果直接影响我们对大脑记忆机制的理解,而它们的获得需要用到所谓的“形式神经网络”。

    形式神经网络建模是计算神经学最强大、最有前景的工具之一,它完全由大量互通的简单元素(“形式神经元”)构成,能捕捉到真实大脑运作方式的根本属性。网络中的单个元素——神经元的能力有限,单凭一己之力发挥不了多大作用。网络解决问题的能力是神经元之间连续、并行的多元互动的结果。网络处理信息的能力到处可见,而且不存在特殊的地方,它分布于整个网络。这些都和真实大脑的运作相同。

    在真实的大脑里,即使是中等复杂的认知过程,也会牵涉海量的神经元和胶质细胞,这使得我们能够对它们之间所有的重要交互作用进行实验分析。简单地说,大脑由无数活动部件构成,其最引人关注的属性源于部件之间的多元互动,而不是源于部件本身。当实验研究工具无法探测这些多元互动时,它们多数能在电脑运行的动态神经网络模型里自我暴露。

    面对各种任务,形式神经网络显示出令人惊讶的类人脑属性,其中最有趣的当属新能力和新技能的出现,设计者并未明确地将它们编程到模型里。我们把这种自发出现的新能力称作“突现属性”。通过独立获得这样的能力,神经网络在某种意义上真正“创造了自己”。当从显示反馈,也就是之前的成功或失败中受益时(监督学习),甚至在没有这种可用的反馈时(无监督学习),网络都会展现出这些能力。

    突现属性里最迷人的是“吸引子”和“吸引子状态”。一个吸引子就是一个网络,也就是一组紧密互连的、在没有外部直接刺激的情况下也具有稳定活动模式的神经元。这些自我维持的活动模式被称作“吸引子状态”。吸引子状态是可能的,因为吸引子内神经元之间的连接极为紧密(用我们之前的类比来说,就是沙地上的凹槽很深),以至于激活神经元的任何一个子集,即使是一个相对较小的子集,都足以维持整个模式的运行。这意味着通过激活任一数量的任一部件,就能全面激活作为整体的同一个吸引子。我们有时候会用一个稍显轻蔑的术语“退化”来表示吸引子的这种属性,首先将该术语引入神经科学的是杰拉尔德·埃德尔曼。事实上,“退化”是一个基本的数学属性,是代数学和数理逻辑广泛研究的对象。退化也是生物学上吸引子的一个非常重要的属性。

    为了更好地理解吸引子的作用原理,记住这个词的原初意义可能会有所帮助。“吸引子”这个词是神经科学家从数学那里借来的,它最初由19世纪伟大的数学家亨利·庞加莱(Jules Henri Poincaré)提出,指的是这样一种情况:将某集合内的各个数值代入一个方程,都只能求得一个常数解。当时有人说这个解将该集合内的数值都“吸引”进了方程。布尔代数里也能找到“吸引子”,同一个逻辑公式可以表示成很多数值的集合。

    就像一个具有吸引子属性的数学方程,一个大脑神经网络吸引子会被来自外部世界的各种不同输入信号所激活,这些信号激活的都是同一个网络。当我们在识别钢笔时,黑色塑料短钢笔、红色金属长钢笔以及炫目昂贵的黄金钢笔,它们产生的感官输入截然不同。尽管三组输入存在差异,但会激活同一个神经网络,我们就是这样识别钢笔的。

    更有趣的是,每个吸引子都具有一个所谓的“吸引盆”,一组趋向于转变成吸引子状态的相似活动模式。这就是说,各种相似但不完全相同的激活模式在某种意义上会被系统“认为”是等价的。形式神经网络主要的吸引子属性,尤其是退化属性,与部分记忆可唤起全部记忆的倾向相对应。具有“吸引盆”的吸引子和一般记忆一样,会把许许多多相似的物体识别为同一类别的成员。

    虽然吸引子及“吸引盆”的概念出自计算模型,但它们抓住真实大脑记忆形成的本质特征的可能性是诱人的。神经网络建模的先驱约翰·霍普菲尔德(John Hopfield)率先提出了吸引子观点,他实际上就是记忆的研究人员之一。

    起码我们知道大脑里存在类吸引子回路。它们的作用尚未完全明朗,但支持“记忆就是吸引子”假设的证据不断增加。其中有些来自“变形”实验。我们大多数人都看过迈克尔·杰克逊的音乐录像带《黑与白》,里面首次以面部变形的形式应用了这项技术:女性的脸变形成男性的脸,老人的脸变形成年轻人的脸,亚洲人的脸变形成白种人的脸。神经科学实验也应用了同样的技术。通过计算机绘图,你可以创建一种动物变形成另一种动物的连续图像:狗变成猫或者牛变成骆驼。假设你要求实验对象根据原先的两种动物将计算机在连续过程中生成的不同生物图像分成两组;或者用计算机合成或混合语言的发音,生成变形元音:“A”变成“O”,“O”变成“U”,等等。实验对象对这种计算机生成图像的分类通常会产生惊人的离散边界:在某一张连续变形图像之前,所有图像都被毫不犹豫、始终如一地分为一类;而之后的所有图像,则同样是毫不犹豫、始终如一地被分为另一类。这些分类的离散性恰恰反映了大脑中吸引子及吸引盆的作用。

    神经网络建模的另一位先驱斯蒂芬·格罗斯伯格(Stephen Grossberg)创建了一种强大的“自适应共振理论”,简称ART。根据ART模型,当来自外部事件的感官信号与大脑先前形成的一个网络亦即吸引子产生“共鸣”或相匹配时,对该事件的识别或“明理”就发生了。按照这一模型,识别行为只不过是重新激活了先前形成的神经网络。越来越多的神经学家接受了这种模型,它事实上反映了我们在识别一个物体或是回想某些记忆时大脑的作用机制。

    爱好研究大脑的读者可能会对吸引子和“模块”之间的关系感到好奇。“模块”是20世纪80到90年代认知科学里一个很流行的术语,目前在某些圈子里依然很流行。它指的是大脑中一个结构紧凑、“信息封闭”的受限单元,该单元致力于非常具体的心理操作,有时候这种操作相当复杂。正如前文所述,研究人员认为不同模块之间的通信极其有限,在功能和回路上几乎都不存在重叠。很多年来,这样的模块一直被视为认知和大脑的基础。大脑模块论是19世纪颅相学的“死灰复燃”,修饰美化令它摇身变成了现代化的新方法。

    对我来说,高级认知的模块化观点等同于智力上的西哥特人入侵,它阻碍了人们对大脑工作机制更为细致的理解。我还公开发表过这种说法。我拼命抗争,通常是在个别期刊上发表类似“模块论兴衰史”的文章,期待着“模块歪理”的消亡。这种消亡来得不算很慢。今天,模块化已经被彻底拆穿、否定,并遭到大部分神经科学界人士的完全抛弃。有时候,认知模块会被讽刺为“祖母细胞”,也就是存储祖母形象的一个神经元。别去找它,它只存在于模块化理论的忠实拥趸的头脑中,除非你也是其中之一,否则你的头脑里就没有什么“祖母细胞”!

    那么,吸引子真的是伪装的模块吗?或者说是“祖母细胞”?我们创造了一个高科技的计算机模拟术语,仅仅是为了重新命名一个过去的陈旧概念吗?答案是一个响亮的“不”。模块是先天的,吸引子是突现的;模块在功能上是封闭的,众多吸引子却共享相同的神经组件;模块在结构上也是封闭的,吸引子多半遍布在皮质区。后一点反映在一种常见的现象中。假设你在谈话中试图回想一个人的名字,它就在你的嘴边徘徊,直到当事人进入房间,你看到这张笑嘻嘻的脸,立刻想起了对应的名字。顿悟般的回忆出现了,尽管这个人没有佩戴名牌,不用说他的额头上也没有写着名字。

    要发生这种回想名字的现象,你的头脑里必须存在一个由包含面部信息的视觉组件和包含名字信息的听觉组件组成的网络。虽然这两种信息存在于完全不同的皮质区(面部信息储存在顶叶,名字信息储存在颞叶),但它们交织成一个吸引子。只要激活组成它的小部分神经元,就能完全激活整个吸引子。

    简而言之,这就是一般记忆的作用机制。下一章我们会讨论一般记忆是一种多么强大的认知工具。