万书网 > 文学作品 > 人生新算法 > 5.10 通过大数据获取利益的 3 项原则

5.10 通过大数据获取利益的 3 项原则




我的研究团队从  10  年前就一直在研究如何从大数据中发现价值,那时还没有“大数据”这个词。我们的这个构想领先了世界七八年。

看到这里的读者,可能会觉得这项研究很顺利地得出了结果,但实际上,在该研究过程中,我们遇到了接二连三的困难。不过,我们的研究并非无用功。应该说,该研究有作为先行研究的意义。在困难中吸取教训,改变做法,并为此开发技术,研究适用的方法——经过这一系列努力,我们在此介绍的成果才开始显现。

在这  10  年的研究中,我们总结出了运用大数据时的  3  项原则。实际上,我们因为做了违背这些原则的事情而大吃苦头,后来我们遵循了这些原则,研究就步入了正轨。

“通过大数据获取利益的  3  项原则”如下所示[3]。

第  1  项原则 明确应该提高的业绩(Outcome)

第  2  项原则 广泛收集与提高业绩相关的人财物数据

第  3  项原则 不依靠假说,让计算机从数据中倒推出提高业绩的对策

在前面提到的商店的事例中,一开始我们就有意识地遵循了这  3  项原则。我们先介绍一下最重要却一直做不到的第  3  项原则。

简单来说,第  3  项原则就是让计算机制定假说。之所以做不到这点,是因为对于数据分析,人们普遍认为是由人类制定假说,然后用计算机和数据来验证该假说。

制定假说并验证,是解决问题的正确步骤。但是,当问题中存在大数据,就不应该由人制定假说。只有由计算机制定假说,才能体现出大数据的价值。我们必须舍弃人类制定假说这个固有观念。

前面也说过好多次,人类根本无法理解大数据的全貌。别说全貌,就连其概要人类都无法掌握——这就是大数据的特征。在这种情况下,人类必定会无视大数据的价值,依靠经验和直觉制定假说。对于存在各种大数据的问题,由计算机制定假说的时代到来了。

应该由人来制定假说,这一想法给人施加了很大的压力。如果有人被分配到有大数据的项目中,并试图做些什么,就会相应地产生一些费用。而想要使用大数据的当事人,通常没有审批费用的权限。于是,当事人必须向有审批权限的公司领导进行说明。然而,很多情况下,没有假说根本通过不了审批。因此当事人会希望将上述  3  项原则普及给公司的高层,推进正确的探讨。

当然这无可厚非,毕竟以往还没有第  3  项原则需要的学习型机器。不过现在,学习型机器  H  的出现改变了这个状况。

第  1  项原则和第  2  项原则论述的是应用第  3  项原则的前提。第  1  项原则是明确应该提高的业绩(Outcome)。对企业来说,业绩尤为重要,直接关系到财务收益。

也许你认为第  1  项原则是理所当然会做到的,但实际上做不到的情况居多。更准确的说法是,一直以来,我们因为做不到这一点而大吃苦头。在大数据的事例中,人们往往会认为,既然有这么多的数据,能不能想办法用上它们呢?很多时候,人们以这样的想法为契机开始利用大数据,而这种想法单纯地作为一个契机也的确是可以的。

但是,如果我们无法推定应该提高的业绩,这种想法就会失败。因为不能推定,就无法制定工作目标。这个道理看似谁都明白,却谁都做不到,着实出人意料。之所以会这样,是因为我们在开始观察数据,并且实现了部分数据的可视化后,就会感觉很新鲜。这意想不到的趣味性也使得顾客兴趣盎然。因此,仅仅是实现了数据的可视化,就会让顾客误以为数据是有价值的。但是,冷静地想一想,不与财务收益挂钩的东西,是没有最终价值的——这就是第  1  项原则想要告诉我们的问题。

假设我们遵守了第  1  项原则,但要遵守第  2  项原则更是难上加难。很多情况下我们会想,仅靠自己轻松得到的数据是不是就能做些什么,而不会想要广泛地收集与业绩相关的数据。

具体来说,这里有两大关卡。首先,我们往往认为,使用别人的数据时,必须要有明确的理由。而且,考虑到既然用了别人的数据,对方就会期待相应的成果,我们往往会将索要的数据限定在可以用理论说明的最低限度。这就是阻碍我们遵守第  2  项原则的关卡。这样一想,必然会认为要想得到别人的数据,必须先设定假说(结果就偏离了第  3  项原则)。但是,我们明明不知道数据中潜藏着什么,却不懂装懂地说出自己的假说和得出成果的概率,以此来索取数据——这种做法并不可行。我们希望能够正大光明地公开说出:“关于假说,就让计算机根据数据来制定吧。”

再者,人、财、物等信息全都和业绩相关,很多时候,在信息系统积累的数据中,关于物和财的数据有很多,而关于人的数据却严重匮乏。如果无视这个事实并贸然推进,结局只能是无功而返。

与人相关的数据之所以重要,是因为顾客和员工的行为会大大影响业绩。

营利活动由  4  层构造组成。首先,第  1  层是应该提高的财务层,财务直接反映业绩。第  2  层是需求层。所谓需求,指的是顾客需求和购买行为,因为付款的主体是顾客,所以需求自然会大大影响第  1  层的财务。第  3  层是业务层。回应顾客需求的是业务,业务的成功与否自然会影响需求。第  4  层是设备和投资层。对设备和人才的中长期投资决定了业务的生产力、规模和质量。基础设施的准备和人才培养等就属于这一层。

人、财、物要素贯穿于这  4  层构造,尤其是在第  2  层的需求和第  3  层的业务中,人的行为有着决定性的影响。因此,我们必须针对需求和业务中有关人的信息进行深入的分析。然而,很多情况下我们都没有进行这种分析。

现在已经有很多方法可以获取有关人类的数据。人类行为数据的测量和解析是一项有偿服务(日立高新技术集团在提供这项服务,服务名称为“人类大数据云”),虽然多少要花些费用,但是必要的数据还是要获取的。在数据不足的情况下就开始分析会浪费宝贵的人力和时间,因此获取到人类数据之后再分析反而更划算。利用这些方式收集有关人、财、物的数据至关重要。