艾莉森·高普尼克-AI的25种可能-万书网

Alison  Gopnik

艾莉森·高普尼克是加州大学伯克利分校的发展心理学专家，她的著作包括《孩子如何思考》（The  Philosophical  Baby）和最新的《园丁与木匠》（The  Gardener  and  the  Carpenter）。

注：艾莉森·高普尼克的著作《园丁与木匠》《孩子如何思考》《孩子如何学习》中文简体字版已由湛庐文化策划，浙江人民出版社出版。——编者注

布罗克曼谈艾莉森·高普尼克

艾莉森·高普尼克是儿童学习和发展领域的国际领导者，也是“心智理论”领域的创始人之一。她说孩子的大脑是一台“强大的学习计算机”，这也许是来自个人经验。她在费城度过的童年时光极大地锻炼了她的智力发展。她回忆说：“其他家庭带孩子去看《音乐之声》（Sound  of  Music）或《天上人间》（Carousel）；我们看达辛（Lacine）的《斐德拉》（Phaedra）和塞缪尔·贝克特（Samuel  Bechett）的《终局》（Endgame）。我们一家人野营时，会围着篝火大声朗读18世纪作家亨利·菲尔丁（Henry  Fielding）的小说《约瑟夫·安德鲁斯》（Joseph  Andrews）。”

最近，她援引机器学习的贝叶斯模型来解释学龄前儿童具有不使用大量数据集而能对周围世界得出结论的非凡能力。“我认为婴儿和儿童实际上比我们成年人更有意识力。”她说，“他们非常擅长从许多不同的信息源同时获取大量信息。”她把婴儿和幼儿称为“人类物种的研究和发展部门”，但这并不是说她对待他们冷漠无情，好像他们只是实验室里的小动物。实际上他们似乎很喜欢她的陪伴，喜欢她伯克利实验室里那些会眨眼、会嗡嗡作响的玩具。当她自己的孩子长大后很多年，她的办公室里还有一个婴儿围栏。

她继续研究我们人类的学习模式，以及人类的学习方法与人工智能的深度学习方法之间的相似之处。她说：“事实证明，模仿一个训练有素的成人专家的推理要比模仿每个婴儿的日常学习容易得多。算法仍然是最好的，事实上，也是我们唯一的科学解释，它解释了像大脑这样的物理对象是如何智能运作的。但是，至少现在，对于在孩子身上看到的那种创造力究竟是怎么回事，我们几乎一无所知。”

每个人都听说过人工智能，特别是机器学习领域的新进步。也听说过这些进步会带来怎样的乌托邦或世界末日预言。人们预言这些进步要么会带来不朽，要么会带来世界末日，关于这两种可能性，很多文章都做了描述。但是，即使是最复杂的人工智能也远远不能解决人类4岁孩子就能轻松完成的问题。虽然人工智能有一个很炫的名字，但它主要包含的技术是用于检测大型数据集里的统计模式的。而要了解人类学习，还需要多得多的技术。

我们怎么可能会对周围的世界了解这么多呢？即使当我们还是小孩子时，我们就已经知道很多东西了；4岁的孩子已经知道植物、动物和机器，了解欲望、信仰和情感，甚至知道恐龙和宇宙飞船。

科学把我们对世界的认识扩展到无法想象的巨大以及无穷无尽的微小，扩展到宇宙的边缘和时间的开始。我们利用这些知识进行新的分类和预测，想象新的可能性，使新的事物出现。但是，我们每个人从世界上得到的都是撞击视网膜的光子流和扰动耳膜的空气。当我们仅有有限的证据时，我们如何才能如此了解这个世界？仅靠眼睛后面的几磅灰色黏液，我们如何做到这些？

到目前为止，最好的答案是，我们的大脑对到达感官的具体的、特别的、杂乱的数据进行计算，这些计算产生了对世界的精确表征。这些表征形式似乎是结构化的、抽象的和层次化的；它们包括对三维物体、语言背后的语法以及像“心智理论”这样的心理能力的感知，心智理论让我们能够理解其他人的想法。这些表征使我们能够做出大量预测，以人类特有的创造方式想象出许多新的可能性。

这种学习不是唯一的一种智能，但它对人类特别重要。这种智能是幼儿的专长。尽管孩子们不擅长计划和做出决策，但他们是宇宙中最好的学习者。将数据转化为理论的过程大部分发生在我们5岁之前。

自亚里士多德和柏拉图以来，有两种基本方法可以用来解决我们是如何获取知识的问题，这两种方法现在也仍然是机器学习的主要方法。亚里士多德的解决方法是自下而上：从感官开始，也就是从光子流和空气振动（或数字图像的像素、录音的声音样本）开始，然后看看你是否能从中提取模式。哲学家大卫·休谟和约翰·穆勒等经典联想论者，以及后来的行为心理学家如巴甫洛夫和斯金纳进一步发展了这种方法。该观点认为，表征的抽象性和层次结构是一种错觉，或者至少是一种附带现象。所有的工作都可以通过关联和模式检测来完成，尤其是在有足够的数据的情况下。

随着时间的推移，解决学习之谜的这两种方法，即自下而上的方法和柏拉图的自上而下的方法之间，出现了拉锯现象。自上而下的方法认为，也许我们能够从具体的数据中获得抽象知识，是因为我们已经了解很多，特别是因为拜进化所赐，我们已经有了一系列基本的抽象概念。像科学家一样，我们可以利用这些概念来形成关于世界的假设。然后，我们可以预测如果这些假设是正确的，数据应该是什么样子，而不是试图从原始数据中提取模式。与柏拉图一样，笛卡尔和乔姆斯基等“理性主义”哲学家和心理学家也采取这种方法。

下面是一个日常的例子，说明了这两种方法的区别：解决垃圾邮件泛滥。数据是由收件箱中的一长串未排序的邮件组成的。事实上，其中有一些邮件是有用的，有些则是垃圾邮件。如何使用数据来区分它们？

我们先使用自下而上的方法。你注意到垃圾邮件常常有一些特殊的地方，比如一长串的收信人，邮件来自尼日利亚，其中提到百万美元的奖品或伟哥等。问题是，非常有用的邮件也可能具有这些特性。如果你看了足够多的垃圾邮件和非垃圾邮件，你可能会发现，垃圾邮件不仅有这些特点，而且这些特点往往以特定的方式连在一起（尼日利亚加上100万美元意味着麻烦）。事实上，可能存在一些细微的更高层次的关联，将垃圾邮件与有用的邮件区分开——比如，一种特殊的错误拼写模式和IP地址。如果你检测到这些模式，你就可以过滤掉垃圾邮件。

自下而上的机器学习技术就是这样做的。机器被输入数百万个例子，每个例子都有一些特征，每个都被标记为垃圾邮件或其他类别。计算机可以提取出区分两者的特征模式，哪怕只是很细微的差别。

那自上而下的方法又是怎样做的呢？我收到一封来自《临床生物学杂志》（Journal  of  Clinical  Biology）编辑发来的电子邮件，里面说他们想发表我的一篇文章。没有尼日利亚，没有伟哥，没有百万美元；这封电子邮件没有垃圾邮件的任何特征。但是通过使用我已经知道的方法，再抽象地思考垃圾邮件的生产过程，我发现这封电子邮件很可疑。

我知道垃圾邮件发送者试图利用人类的贪婪来从人们身上榨取金钱。

我还知道，正规的“开放访问”期刊已经开始通过向作者收取费用而不是向订阅者收取费用来支付成本，而且我不从事任何有关临床生物学的工作。

结合以上考量，我就有了一个很好的新假设，可以推断出这封电子邮件来自何处。它是为了吸引学术界人士花钱在一本假杂志上“发表”一篇文章。这封邮件尽管看起来与其他垃圾邮件完全不同，但它们的生产过程都是可疑的。仅从一个例子中我就得出这个结论，我可以通过谷歌搜索那个“编辑”，进一步检验我的假设，而不仅仅是考虑电子邮件本身的真假问题。

用计算机术语来说，我从一个“生成模型”开始思考，这个模型包含了诸如贪婪和欺骗之类的抽象概念，描述了电子邮件欺诈的过程。生成模型让我识别出经典的尼日利亚垃圾电子邮件，也让我想象出许多不同类型的可能的垃圾邮件。当我收到这封杂志邮件时，我往回梳理：“这看起来就像是出自垃圾邮件生成过程的邮件。”

人工智能给人们带来新的兴奋点，只是因为人工智能研究人员最近看到这两种学习方法强大而有效的一面，但就这些方法本身而言，其实并没有什么新的东西。