万书网 > 文学作品 > 人生新算法 > 5.8 学习型机器会提高人类“从过去学习的能力”

5.8 学习型机器会提高人类“从过去学习的能力”




要使大数据在有科学依据的情况下发挥作用,必须用计算机代替牛顿等天才的工作。当然,模仿或代替天才的灵感并非易事。

回想一下,人类曾经梦想能像鸟一样在空中飞翔,而这个梦想是通过飞机这种完全不像鸟的东西实现的。在讨论人工智能时,有的人态度强硬,认为人类智能必须通过人来重现;也有的人想法灵活,觉得虽然起初人类梦想是能像鸟一样在空中飞翔,结果却是发明了飞机,这说明只要有方法智能地解决问题就可以了。我的想法属于后者。

有了学习型机器,计算机便可以从大量的数据中进行学习。其学习的数量和速度,远远超过人类。飞机可以用远超鸟类的速度在各大陆之间航行,而学习型机器则可以从大量数据中发现天才都发现不了的规律。

同样的事情也发生在将棋的世界。在日本一场名为“电王战”的计算机和棋手的对战中,计算机软件拥有了远超一流棋手的能力(那些勇于挑战计算机的人们,尤其是敢于挑战这场吉凶未卜的对战的专业棋手让我深受触动。我发自内心地为他们鼓掌喝彩)。

很重要的一点是,计算机能从过去的大量棋谱中学习并迅速提升能力。电王战看似是计算机和人类的对战,但其实可以说是系统性的学习方式与以往的学习方式——即从人类过去的所有智慧中学习,与从自己的体验中学习之间的对战,结果是前者胜出了。

有意思的是,专业棋手最近开始学习计算机的下法了,说不定人类会因此掌握新的能力。

如前面所述,对于  H  发现的提高业绩的对策,我们很难单纯用以往的店铺经营常识来理解。但是,经历几次之后,人类就会开始学习。因此,应该说  H  是促进人类积极学习的机器。

难道我们就不能掌握计算机那种分析并学习大量数据的能力,准确且科学地判断业务和经营吗?从这种想法出发,我们开发出了人工智能  H。“H(Hitachi  Online  Learning  Machine  for  Elastic  Society)”这个名字来自英国侦探小说家柯南·道尔笔下的夏洛克·福尔摩斯(Sherlock  Holmes)名字的首字母。在《血字的研究》中,夏洛克·福尔摩斯初次与华生见面,就根据他的细微特征猜到他有参军经历。根据证据和状况,福尔摩斯可以倒推出犯人和犯罪情况。同样,H  也是从数据中倒推出产生数据的处理模式和模型。夏洛克·福尔摩斯说道:

我完全不会先入为主,而是如实还原事实真相。

最重要的是,能从诸多事实中,分辨出何为重大事项,何为附带事项。否则只会浪费精力和注意力,无法聚精会神。(《赖盖特之谜》)

这也是我们的人工智能  H  要达到的目标。

为了达成这个目标,人工智能  H  具备了以往计算机没有的特点,即可以让输入的各种数据相互结合,自动输出可能会影响业绩的大量因素。并且,在多种因素搭配组合后,会形成复合因素,其数量就更为庞大了。

一般来说,人们想要提升的目标变量数据,是店铺  1  天的营业额(日销售额)等宏观信息,而用来说明这些信息的大量数据,是表示每时每刻、每个顾客、每个店员、每个地点的微观信息。表面看来这些数据与业绩的直接关系不大,而“H”的特点便是可以填补这两者之间的鸿沟。我们将弥补微观和宏观之间差距的独立技术(已申请专利)称为“跳跃学习”(Leap  Learning)。

下面我们介绍一下跳跃学习的优点。假设我们要探讨能有效提高店铺业绩的因素。我们很容易预测到,店铺的业绩取决于店铺面积(面积大的店铺营业额高)。对此也很容易分析,因为店铺的业绩与用来说明该业绩的店铺面积的“粒度”相同(数据一一对应)。如果我们将两者列个表,用电子表格进行回归分析,就可以预测出店铺面积每扩大  1  坪,营业额会增加多少。由于业绩和店铺面积是粒度相同的宏观量(每家店铺都有一个数据),因此很好分析。

在这次竞争中,H  发现的对策就属于影响业绩的微观因素,要想找到微观因素,并不像上面预测宏观因素那样简单。针对什么顾客、在店铺的哪里、什么时段、哪个员工接待顾客,才能最有效地提升业绩呢?要想锁定影响业绩的因素,就要对这些条件进行搭配组合,而组合的数量是十分庞大的。H  具备一种引擎,可以有效地从数据中找到影响业绩的各种因素,这是以往的数据科学家分析不出来的。

运用大数据时,最大课题是如何填补宏观业绩与微观数据之间的粒度鸿沟(为了说明一个宏观数据,要动用各种微观数据的组合)。但是,据我所知,在以往的分析技术(称为统计学、多变量解析和机器学习)中,没有一项可以弥补微观和宏观的差距,输出其背后潜藏的模型。

10  年前,我们刚开始研究大数据时,就遇到了如何弥补微观和宏观之间的差距这个难题。我们研究了各种运用大数据的工作,发现这些工作都涉及微观和宏观两个方面。因此我们思考,这个难题是不是已经被攻克了?于是,我们在统计学、多变量解析和机器学习中探索,看有没有解决这个难题的技术。

然而,寻而未果。可能是因为在大数据出现之前,这些学术领域的问题就已经固定了。例如,多变量解析广泛应用于心理学的问卷调查和临床医学的药物疗效分析,我们只要研究“人”这类粒度统一的数据即可,不必关心宏观和微观的差距。机器学习应用于图像识别(图像中的脸部识别等),我们只要研究“图像”这类粒度统一的数据即可。不管是多变量解析还是机器学习,都不必处理大数据中粒度不同的微观和宏观数据。

这  10  年来,伴随大数据的出现,处理粒度不同的微观和宏观数据的需求应运而生,但是人们从来没有正面解决过这个新问题。因此,我们决定从零开始,开发大数据分析技术,即学习型机器  H。