万书网 > 心理哲学 > 斯坦福社会创新评论02 > 走出普适化的迷宫

走出普适化的迷宫




作者:玛丽·安·贝慈

拉切尔·格兰斯特

译者:聂传焱


决策者需要不断面对普适化的难题:一个成功的模式如果放在别的环境中,能产生类似的效果吗?本文阐释的普适化框架提供了一个实用的方法来综合各类证据,以评估特定政策是否可能在某种新情境下生效。


Abdul  Latif  Jameel反贫困行动实验室2003年创建于麻省理工学院,在全球拥有特聘教授和专业人员网络。2013年,卢旺达总统希望我们提供整个非洲大陆各类社会发展项目的评估结果,以便为其国内决策提供参考。我们首先想到了在肯尼亚做过的一个艾滋病预防项目,名为“小心干爹”(Sugar  Daddies  Risk  Awareness),它显著减少了艾滋病传播的一条重要途径——少女与“老男人”之间的性关系。一个随机对照试验发现,在给八年级女生和男生放映了十分钟的视频,并展示了年长男性艾滋病发病率较高的统计数据之后,这些学生的行为明显发生了改变:在随后12个月里,与“老男人”发生性关系以致怀孕的少女数量下降了60%以上。1卢旺达政府也想知道该项目在卢旺达是否能奏效。

这项研究之所以引人注目,部分原因在于其研究方法:哪些女孩参与这个风险告知项目,哪些女孩只是继续接受标准课程教育,是随机的。由此,我们的政府合作伙伴就能够相信,危险行为减少了,应归功于这个项目。但是,如果他们在别的环境中复制这种方法,能产生类似的效果吗?

决策者不断面对这种普适化的难题:特定项目的效果是否普遍适用于其他情境。对于如何才能做出正确的判断,决策者之间长期存在争论。但是这些争论常常被那些令人费解的无益的问题困住,例如,决策者是该依赖来自当地的不太准确的证据,还是该依赖来自其他地方的更精确的证据呢?在推广某个方案之前,是否永远需要在当地先进行一次新的试验呢?

这些问题本身就是伪命题。精准严格的影响力评估并非旨在替代当地数据,而是提高其利用价值。当地机构拥有的具体知识与关于普遍行为的全球性知识之间存在着互补性,这种互补性对于贫穷行动实验室的哲学原理和实践至关重要。



四种具有误导性的思路


为了阐明我们的工作理念,有必要先审视一下有关基于证据决策(evidence-basedpolicy  making)的四个常见的但具有误导性的思路。我们的工作正是为了解决这些问题。



1.一项研究只能为当地提供政策依据吗


考什克·巴苏认为,一项在肯尼亚做的影响力评估绝对无法向我们提供任何关于在卢旺达应该怎么做的有用信息,因为我们不能确信评估结果是否适用于卢旺达。2诚然,我们永远无法准确预测人类的行为,但社会科学研究的目的就是描述出能够成为指南的一般规律。比如,一般来说,价格上涨需求就会下降。对决策参考来说,描述出在各种条件和时间段中发现的普遍行为规律特别重要。最好的影响力评估就是为了检验这些关于人类行为的普适性命题。



2.我们是否应该只使用从特定地点获得的证据


为了确保方案或政策在当地有效,一些研究者,如兰特·普利切特和贾斯汀·桑德福认为,即使质量不太好,决策者也应该主要依靠本地提供的所有证据。3高质量的本地数据当然非常重要,但如果因为来自其他国家、地区或城镇的证据可能在普适性上存在风险,就建议决策者们忽略这类证据,那就会浪费宝贵的资源。挑战在于,如何将本地信息与全球性的证据匹配在一起,并利用每个证据来帮助我们理解、诠释和补充其他证据。



3.在规模化推广之前,是否一定要在推广地进行新的随机化评估研究


针对推广地的适用性问题,一种解决方法是利用全球证据库作为政策理念的来源,但在规模化推广之前,始终要在当地对该项政策进行一次随机化的评估研究检验。鉴于反贫困行动实验室非常关注这种方法,我们的合作伙伴通常认为,我们一定会建议在当地重新做一次随机化评估研究——但我们并没有这样做。在资源和评估专业技术非常有限的前提下,我们无法严格地检验全球每个国家的每项政策。我们需要确定优先事宜。例如,对于有条件现金援助(conditional  cash  transfers)带来的影响,我们在九个中低等收入国家中进行了十次随机化评估研究,并对此进行了三十多项分析。尽管对这些方案的最优设计还有待进行更多的深入研究,但是,在许多其他扶贫政策尚未经过严格检验的情况下,将有限的资金用在对有条件现金援助的每个新方案都做随机化影响力评估上,显然不是最佳选择。



4.在规模化推广之前,对同一个方案或政策是否需要进行特定次数的重复检验


我们被问得最多的问题之一是,一项研究需要在不同情境中重复多少次,才能让决策者信赖在其他情境下研究得出的证据。我们认为这种考虑证据的方式是错误的。在某些案例中,同样的方案会在多个地点进行检验。例如,为帮助七个国家的赤贫者,我们对某个分级强化项目进行了相互一致的七次随机化对照试验,结果表明,它们在大多数情况下都产生了积极的影响。我们在决策时应高度重视这类证据。但是,如果我们只采用已重复多次的研究结果,我们就丢弃了大量潜在的相关信息。