催化型测量-斯坦福社会创新评论04-万书网

和奖励挂钩的问责型测量确实有效，但仅限于在某些条件下。此外，旨在推动社会变革的机构常常是在没有奖励的情况下运用测量，并期待借此能够改善体系。因此，为制定一种能够培育并监测“健康文化”进展状况的测量策略，我们需要找到新思路来讨论如何用测量来确定一些非奖励性机制，这种机制应该既能让测量有助于变革，又能具备完整的社会科学证据。

我们确定了四种这样的机制：目标的设定，问题的设计，通用术语的创造，场域的变换[7]。这四种机制都更强调跨界的具有催化功能的创造性和协作性行动，而不是只让行动者对事先设定的进程和目标负责。我们把这种新思路叫作“催化型测量”。

目标的设定  |  设立和公布一个测量项，就可能引发一种心照不宣的期待，即这个测量项代表了一个值得追求的目标，当该测量项是由某一知名度高、公信力大的机构所提出的时候，尤其如此。例如，许多非营利机构都定期公布筹款的总体目标和进展情况，假定只要将明确的目标公之于众，就能够促使人们捐献更多的款项。致力于男女同工同酬的组织也定期公布测量的结果，旨在曝光问题，并鼓励企业增加女性员工的报酬。

以这种方式运用绩效测量是司空见惯的做法，而且有大量的案例可以支持这一主张。但就我们所知，尚且没有任何研究显示，公布测量结果和导致行为改变之间存在某种因果关联。不过，却有来自实验室和实境田野研究的证据显示，目标的设定在个人及群体层面上可能会如何起作用。

马里兰大学的埃德温·洛克教授和多伦多大学的加里·莱森在此领域做了大量研究。他们的结论是，目标的设定会使在体系中工作的人们更为专注，更有动力，更能坚持，并且能激活已有的知识，从而可以帮助个人改善绩效。[8]

为了更好地理解这一原理，我们看一下“家庭保健开支”的例子。这是全美“健康文化”的测量项之一。这个测量项首先旨在引导人们对家庭保健开支这一问题的关注，继而期待能够动员变革力量为降低家庭的负担而采取并坚持有效的行动。在本文写作时，这一测量项并不包括具体的指标（具体的开支负担水平），但是该测量项所暗示的目标却有着清晰的指向（开支负担的降低）。

相比奖励而言，设定目标可能不那么立竿见影，尤其是当迫切需要创新的时候，例如任务非常复杂，或者缺乏如何完成该任务的诀窍。这意味着与那些需要新技术和新方法的任务相比，在那些简单易行的任务中，例如废纸回收，设定目标的做法更可能获得成功。

不过，文献也表明，在复杂任务的目标下，可以设定一些难度较低的阶段性目标（将远大目标化整为零）和学习性目标（获取实现最终目标所需的技能），这样就比较容易落实。在“健康文化”的测量项设置中，我们没有采用像“社会经济地位”这样的宽泛尺度，而是采用了“住房负担”（具体来说，就是住房开支占收入五成或以上的人口比例）这一测量项。这就比空泛的“社会经济地位”更加具体，更可操作。

问题的设计  |  测量是一种简化，它将注意力集中在系统中的某些方面而略去其他方面。虽然测量的这种“简化”倾向可能带来负面后果，但一定程度的简化和聚焦却能够帮助人们更好地理解类似“健康”这样的复杂体系。换一个角度看，测量项（以及一系列的测量项）可以帮助人们解决“设计”问题。“设计”是一种心理捷径（往往和情绪化的联想相关），个人和机构都可以借此确定一个问题的哪些方面最值得关注，这些方面彼此之间有何联系，以及与这些方面相关的“利弊”权衡。[9]

对问题的设计是“健康文化”的测量项可能造成的一个积极影响。实际上，“健康文化”的一个主要目标就是启发人们用新的方式来看待健康，包括形成一个新的观念：影响健康的因素远远不只是美国传统上所定义的“卫生部门”，例如医院和诊所。

举例来说，“重视物质和社会环境对健康互依性的影响”这一测量项，就旨在追踪这种意识重构的一个重要方面的进展。该测量项来自强生基金会“全美健康态度调查”中的一个问题。2015年的这项调查发现，仅有34%的成年人相信一个人所处的环境（包括他人的行为和社区的状况）对个人的健康具有影响。我们希望这一测量项能让更多人意识到这种关联的存在，并鼓励人们看到，重视社区中传统上认为与健康无关的因素，亦能影响健康与福祉。[10]

“健康文化”的整套测量项的设计，是为了改变个人、机构和政策制定者对于哪些因素会影响健康的观念。那些不熟悉健康的社会、经济和文化因子的人们可能会惊讶于图书馆、选民和义工参与度、社区政策的制定乃至住房的负担程度都是“健康文化”的测量项之一。纳入这些测量项的目的正是为了让读者形成这样一种问题设计，即健康与福祉不仅仅取决于发生在诊所和医院里面的事情。

通用术语的创造  |  问题的设计为测量赖以促成变革的第三种机制提供了基础：为讨论创造通用术语，让个人和机构更容易看到事物或行动的共性，或至少有足够的相似之处可以进行比较。

例如在车辆事故调查领域，诸如“认知错误”“决策错误”“操作错误”等简明扼要的测量类别提供了通用术语，让行车的当事各方能够在每年数以万计的交通致死案件中区分出具有共性的类型，并让人们能够就稀缺资源的分配方式和方向展开明智的讨论。[11]这样做能够促进指向共同目标的合作行动。这种合作也是在处理类似“健康文化”愿景所包含的大规模社会性和系统性变革时的一个重要因素。

当然，测量也可能剥离了太多的背景信息，从而在将复杂系统的组成部分简化为可对比项时过犹不及。以对学生成绩的测量为例，批评者抱怨分数不能反映学习过程的一些重要方面，还掩盖了存在于学校和社区当中的重要差异。但这样的简化也让人们看到，个别学校、社区或其他身份所遇到的问题是具有共性的，因此这些问题或许源自一个更大的系统瑕疵。这种方式能够凸显人们的共同利益，暴露问题的普遍性，并且帮助人们通过社交网络与其他社区的个体建立联系，最终会促使个人增强参与集体行动的意愿。

举例来说，有证据显示，发布临床护理品质的测量结果可以鼓励医师向得分高于自己的其他同行寻求改进建议。还有许多例子表明，在关于大规模系统性变革的辩论中，绩效测量数据扮演了重要角色。经济方面的指标，例如消费者价格指数，对关于现行经济政策利弊的讨论有重要影响，并常常为新政策的出台提供基础。同类相比的做法也引起了竞争，因为消费者更容易在提供同种产品的厂商当中“货比三家”。这正是各种消费者排行榜的初衷，例如《美国新闻与世界报道》的大学排行榜，就影响着大学在同类院校和招生数据中的声誉。[12]

在“健康文化”中，对健康的价值共享处于核心地位，而测量为不同社区提供了通用的讨论健康因素的方式。例如，“受慢性疾病影响的失能调整生命年”[13]为讨论所有社区中个体的若干健康状况（如糖尿病和慢性呼吸系统疾病）提供了一种通用方式。“不好的童年经历”这一测量项也有类似效果，一系列的童年创伤（被忽略或者身体、言语或性的虐待）会对不同人群中所涉个体的健康造成长期影响，而这一测量项提醒人们注意这些长期影响的相似之处。

场域的变换  |  一个问题如何在行动者当中被设计和被讨论，对于该问题用什么方式以及在什么地方被解决可能造成影响——这就是场域。政治科学家弗兰克·鲍姆加特纳和布莱恩·琼斯在他们关于“政策意象”和“政策场域”之互动的研究中对此做了探讨。[14]政策意象就像是一些设计，有助于人们定义关于问题成因和出路的主导性信念，也有助于区分所谓“好”或“坏”的各种解决方式。场域则是出台关键决策的制度性“地点”（例如国会委员会、市政厅、法院和公司董事会的会议室），以及导致这些决策的游戏规则（例如多数原则、先例原则、对收益—成本标准的应用等）。

要理解场域，可以看看鲍姆加特纳和琼斯如何追溯美国核电站管理制度的发展史。最早的核电站管理机构——原子能委员会对核电产业是友好的，并为“倡导核能的企业、政治和技术精英们”大开方便之门。而当原子能委员会的技术雇员开始传播对安全存疑的数据时，批评家便跻身关于核能安全的公众辩论当中，有效地打破了原先的政策垄断。这致使原子能委员会被核能管委会所取代，后者是一个更加重视安全的机构，并由一系列被动员的成员来参与对核能扩散的审查，由此便形成了一个良性循环：意象或设计的改变支持了场域的改变，而场域的改变又支持了设计的进一步改变。

而要理解场域是如何运用测量的，可以参考《美国新闻与世界报道》的法学院排行榜对法学院的影响。在对法学院管理人员和教职人员的深度访谈中，社会学家迈克·索德发现，通过向潜在学生和其他人群宣传这些排名，法学院内部的制度性权力之平衡发生了变化，和提升学院排名直接相关的活动获得了更多的预算，为了管理排行榜中学院的形象，法学院还改变了职务描述并设置了新的组织结构（场域）。[15]

我们为“健康文化”所选择的许多测量项都是专门设计的，以便将新的行动者引入关于健康的讨论，并将新的场域引入与健康相关的决策过程。例如，表面上看，“青少年接触不健康食品广告的状况”这一测量项（基于“尼尔森媒体研究”的数据）寻求的是估算以儿童为目标的不健康媒体信息的流行程度。然而，这一测量项的弦外之音乃是促进卫生、传媒、食品和饮料行业之间更有力的合作。因此，这种合作的情况有助于改善该项的得分。

同样，“美国企业对社区和经济发展、对基础教育和高等教育的贡献”（企业在健康领域的领导力）这一测量项的设置，是为了鼓励企业参与健康领域。而“与卫生和保险机构、州和地方政府及社区组织结成正式联盟的医院比例”（医院伙伴关系）这一测量项则旨在鼓励医院和各种社会服务机构及社区组织开展合作。