万书网 > 心理哲学 > AI的25种可能 > 生命



蚊子首先从10米远的地方嗅出我的气味。它触发它的追踪函数,这个追踪函数由最简单的规则组成。首先,随机地朝一个方向移动。如果气味增加,继续朝那个方向移动。如果气味减少,则向相反的方向移动。如果气味消失,就朝旁边的方向移动,直到再次闻到气味。如此重复直到最终来到目标处。

我的体味离我皮肤越近就越浓密,随着毛孔张开,体味扩散开来,这时一团看不见的粒子雾便从皮肤中散发出来,像随风飘散的烟雾。离我的皮肤越近,颗粒密度越高;离得越远,颗粒密度就越低。这种减少被称为梯度,它描述了从一个水平到另一个水平的逐渐过渡,与描述离散变化的“阶梯函数”正好相反。

一旦蚊子利用它简单的算法跟随这个梯度到达气味的源头,它就落在我的皮肤上。它用脚上的热探测器感知皮肤,热探测器与另一个梯度即温度相适应。然后,它把针形的喙推进皮肤表面,在这里喙尖端的第三组传感器会检测到另一个梯度,即血液密度。这根柔韧的针在我的皮肤下蠕动,直到血液的气味引导它进入毛细血管,然后刺破。这时我的血液开始流入蚊子体内。任务完成了。哎哟。

这种在黑暗中如此强大的昆虫雷达具有寻找血液的智能,这种智能看似是微小的大脑无法解释的,但这种雷达实际上只是一个敏感的鼻子,几乎没有任何智能可言。蚊子更像是跟随太阳转动的植物而非导弹。然而,直接照本宣科地应用这种简单的“跟着鼻子走”法则,它们就能够穿过房子找到你,穿过纱门上的裂缝,甚至一下子就能叮在你暴露在帽子和衬衫领子之间的窄窄的一处皮肤上。蚊子只是随机飞过,但它有灵活的翅膀和腿,让这种昆虫能越过障碍,它还有寻求降低化学梯度的本能。

但是“梯度下降”可不仅仅只是昆虫的导航。环顾四周,你会发现它无处不在,从宇宙最基本的物理规则到最先进的人工智能,都有它的存在。



宇宙


我们生活在一个有着无数梯度的世界,从光和热到重力和化学轨迹。水沿着重力梯度向下流动,你的身体依靠化学溶液从高浓度到低浓度流过细胞膜而活着。宇宙中的每一个活动都由梯度驱动所驱使,从行星绕重力梯度的运动到原子沿着电荷梯度结合形成分子。我们自己的欲望,如饥饿和困倦,是由我们身体中的电化学梯度驱动的。而我们大脑的功能,也就是神经元之间突触中的离子通道里流动的电子信号,只不过是沿着更多的电学和化学梯度“向下”流动的原子和电子。忘记把大脑比作发条装置的类比吧。我们的大脑更像是带有水闸的运河系统,信号像水一样从一个状态传播到另一个状态。

当我坐在这里打字时,我实际上正在寻求n维梯度拓扑的平衡状态。只拿一个举例:热量。我的体温比气温高,所以我散发热量,这些热量必须在我的体内得到补充。我消化道里的细菌都用传感器来测量它们周围液体中的糖浓度,挥动尾巴状的鞭毛游向“上游”,那里糖的供应最丰富。所有系统的自然状态是流向低能态,这一过程可以用熵来描述。熵增就是从有序状态到无序状态的倾向;所有事物最终都会崩溃,包括宇宙本身。

但是,你如何解释更复杂的行为,比如我们做决定的能力?答案就是更多的梯度下降。



我们的大脑


我们人类的智慧充满奇迹,令人不可思议。科学界正在接受这样的观点:人类大脑的运作方式与其他任何具有多个层次和反馈回路的复杂系统一样,都在追求数学上称之为“优化函数”的东西。但从某种意义上说,你也可以称之为“向下流动”。

智能的本质是学习,我们通过把输入与积极或消极的结果,也就是奖赏或惩罚联系起来进行学习。因此,对于小宝宝来说,“这个声音”,也就是妈妈的声音,是与其他和妈妈相关的知识联系在一起的,比如食物或舒适。同样,“这种肌肉运动会让我的大拇指更靠近我的嘴”。随着时间的推移和反复试验,大脑的神经网络加强了这些联系。同时,“这种肌肉运动不会让我的大拇指靠近我的嘴”是一个负相关,大脑就会削弱这些联系。

然而这过于简单化了。梯度下降的极限构成了所谓的局部极小值问题(或局部极大值问题,如果你有梯度上升的话)。如果你在山区行走,想回家,如果你总是走下坡路,你最有可能到达的是下一个山谷,却不一定能越过围绕在山谷旁、横亘在家和你之间的其他山脉。为此,你需要拓扑的心理模型,也就是地图,这样你就知道在哪里上山以走出山谷;或者你需要时而梯度下降,时而随便走走,以便可以跳出该区域。

事实上,这正是蚊子跟随我的气味所走的路线:当它靠近我的体味时,它就会下降;当它失去气味或碰到障碍物时,它会随意飞飞。



人工智能


这就是自然。那么计算机呢?传统的软件并不是这样工作的,它遵循逻辑严格的确定性树:“如果是这样,那就这么做。”但与物理世界交互的软件往往更像物理世界。这意味着处理带有噪声的输入(传感器或人类行为),提供概率而不是确定性的结果。反过来,这意味着更多的梯度下降。

人工智能软件是最好的例子,尤其是使用人工神经网络模型的人工智能。这种模型里含有多层卷积神经网络或“深层”神经网络。在这些例子中,一个典型的过程包括“训练”它们,向它们展示许多你想让它们学习的东西,以及其他随机数据的例子。比如,要让它们学习什么是猫,就给它们提供一些标记为“猫”的猫图片和其他事物的图片。这叫作“监督学习”,之所以起这个名字是因为神经网络是通过例子来训练的,包括使用与期望结果不相关的数据进行“对抗性训练”。

这些神经网络,像它们的生物模型一样,由成千上万个节点(“神经元”)组成,每个节点通过最初具有随机强度的连接与上层和下层的所有节点相连。顶层显示数据,底层给出正确答案。任何发生在正确答案层上的一系列联系都会变得更强(“奖励”),而那些错误的联系则会变得更弱(“惩罚”)。经过成千上万次的重复,最终,这种数据会建立一个得到了充分训练的网络。

你可以把这些连接的所有可能组合想作行星的表面,有丘陵有山谷。(行星的表面是三维的,但实际的拓扑是多维的。请暂时忽略这一点。)网络在学习过程中所经历的优化就像在行星上寻找最深的山谷的过程。这包括以下步骤:

定义一个“成本函数”,它会给出网络解决问题的优劣程度。

运行一次网络,看看在该成本函数上它的运行效果如何。

更改连接的值,然后再次运行。这两个结果之间的差异就是两次试验之间网络移动的方向或“斜率”。

如果斜坡指向“下坡”,则更多地在那个方向上改变连接。如果它是“上坡”,则在相反的方向上改变连接。

一直重复以上操作,直到任何方向都不再需要做出改进。这意味着你处于最小值。

恭喜!但是这可能是局部最小值,又或者是在山里稍微坑洼的地方,所以如果你想做得更好,就得继续坚持下去。你不能一直往下走,你也不知道绝对最低点在哪里,所以你必须设法找到它。做到这一点的方法有很多,以下是几个方法:

用不同的随机设置多次尝试,分享从每次试验中学到的知识;实际上,你正在晃动系统以了解它是否处于较低状态。如果在一次试验中发现了较低的山谷,就从这些设置开始。

不要只是下坡,而是要像醉汉一样蹒跚而行。这叫作“随机梯度下降”。如果这种尝试坚持足够长的时间,你最终会找到底部。这其中有一种人生的隐喻。

只需寻找“有趣”的特征,这些特征是由多样性定义的,例如边缘或颜色变化。警告:这种方式可能导致疯狂,因为太多的“趣味性”会使网络产生光学幻觉。因此,让它保持理智,强调那些本质上可能是真实的特征,这些特征并非人工制品或错误。这叫作“正则化”,有很多技术可用来实现这一点,比如那些特征之前是否见过或学习过,是否太“高频”(像静态)而非“低频”(更连续,像实际的真实世界特征)。

不要仅仅因为人工智能系统有时会陷入局部极小值,就断定这使它们变得不像真实生命。其实人类,可能也包括所有的生命形式,都经常被困在局部极小值的范围中。

以围棋游戏为例,几千年来人类传授它、学习它、优化它。但人工智能只用了不到3年的时间就发现一直以来我们玩得都不对。它发现这个游戏有更好的,几乎是全新的解决方案,但我们人类从来没有考虑过。这主要是因为我们的大脑没有足够的处理能力,无法预先提前想出许多棋步。

国际象棋比围棋容易十倍,被认为是很好理解的游戏。但即使是国际象棋,暴力机器也能用我们的策略击败我们。事实证明,当拥有高级神经网络的人工智能系统开始研究国际象棋时,这个游戏也出现了我们从未考虑过的奇怪但高级的策略,比如为了获得不明显的长期优势而早早地牺牲女王。这就好像我们玩的国际象棋是二维版本的,实际上还有更高的维度。

如果说这些听起来很熟悉,那是因为物理学几十年来一直在研究这类拓扑问题。空间是多维的,而数学是理解超出我们感官范围的“膜”的几何形状和相互作用的简化——这正是大统一理论家研究不下去的地方。但与多维理论物理学不同,人工智能是我们可以实际实验和测量的东西。

这就是我们要做的。接下来的几十年,我们将对人类700万年进化以来从未发现的思维方式进行大量研究探索。我们将从局部极小值出发,找到更小的极小值,甚至是全局极小值。当我们做到这些,我们甚至可能会使机器像蚊子一样聪明,它会一直沿着宇宙梯度下降,直到达到最终目标,不管那是什么。



Many  of  the  central  arguments  in  The  Human  Use  of  Human  Beings  seem  closer  to  the  19th  century  than  the  21st.  Wiener  seems  not  to  have  fully  embraced  Shannon's  notion  of  information  as  consisting  of  irreducible,  meaning-free  bits.

尽管如此,《人有人的用处》一书中的许多中心论点似乎都更接近19世纪而非21世纪。维纳似乎并不完全接受香农关于信息的观点。香农认为信息是由不可简化的、没有意义的比特组成。