根据现行机制,在某种情境中学到的经验能够并且确实成功地运用到了其他情境当中。我们最后再举个例子来阐释这个话题。最近,我们芝加哥教育实验室的同事们与芝加哥公立学校合作,以帮助那些学业不佳的高中男生取得进步。他们与适配教育(Match Education)进行合作,利用随机评估测试了个性化的二对一辅导方案,该方案因大幅提高学生的数学成绩而获得了全美的关注。12
哪些因素决定了我们选择在芝加哥尝试个性化学习方案呢?研究小组不仅利用了得克萨斯州密集化辅导的准实验评估成果,13还参考了在肯尼亚和印度进行的随机评估结果。没有人会认为后者的环境类似于芝加哥,但是,审视那些帮助落后学生提高学业的根本机制,我们就会在极其不同的环境中找到非常吻合的证据。
在肯尼亚,早期的随机评估发现,为学生提供新教材无助于改善孩子的学习状况,除非这些孩子已经是班级中的尖子生。14这表明,部分问题在于,课程和教科书是根据班级中的部分而非所有学生的学习水平而设计的。后续评估考察测试了先根据初步学习水平对学生进行分组,然后由教师提供更具针对性的教学的做法,结果发现各个小组中的学生成绩都提高了。15
与此同时,在印度,致力于改善教育状况的非政府组织布拉罕协会(Pratham)也正在应对同样的挑战,招募当地志愿者教导年幼孩子学会基本的识字和算术能力。虽然背景和方法不同,但是该方案也采取了类似的根本机制:通过提供适当水平的重点教学,正规学习课程明显落后的孩子能够相对迅速地迎头赶上。在过去十年中,我们的同事与布拉罕协会合作,在不同的环境中——农村和城市,通过不同的人——志愿者或正式教师,在不同时期——教学、上学期间或暑假期间,反复检验辅导方案,效果一直很好。16
同事们在设计芝加哥学习方案时审查了所有相关证据,他们发现了与普适化框架相关的不同地区条件的类似之处。在芝加哥——与印度和肯尼亚一样——部分学生在课程上落后了好几年,但是现行教育体制鼓励教师们讲授与学生年级相应的学习资料,而不是针对学生实际学习水平进行补课。方案的实施也有相似之处:辅导者可以接受培训,以教授相应水平的学生,而不用担心无法管理需求各不相同的整个班级。匹配教育的方法是引进受过良好教育的个人,让他们愿意将此当作公共服务而以微薄的薪金工作一年,否则的话,这种做法(小组教学)会因成本过高而不太可行。与印度相同的是,由于教师不再需要经过专门培训以管理复杂的课堂,单单注重年级教学目标也失去了意义,因此,他们能够运行小组方案,并更容易控制成本。
这个例子表明,有效阅读文献需要寻找看似不同的研究成果之间的内在联系。对各种有效方案背后的共同机制的学术回顾对决策者有很大的价值,因为这能使他们深入了解从看似不同的情境中概括出来的基本行为。这迥然不同于某些政策圈子推崇的荟萃分析(meta-analysis)的新潮流。在传统上,荟萃分析往往用于医学,仅对不同研究所发现的结果进行平均化处理。虽然这类荟萃分析能够对一种特定类型的研究提供综述,但它无益于我们芝加哥的同事:将教材评估结果与其他投入(如椅子和书桌)的研究结果进行简单的平均化处理,而补习则被纳入另一组研究之中。荟萃分析不可能从这两种研究中挖掘出理论联系,因为这两种研究虽然理论出发点相同,却在考察不同的干预措施。
理解不同的情境
关注当地情境的人与做影响力评估的人经常被视为水火不容,但是这种看法是错误的。我们在进行影响力评估,并帮助政府将其经验教训融入政策的过程中,也对深入理解当地的情况满怀热情。普适化难题的核心在于,我们必须将任何实际的政策问题拆分成多个方面:利用当地的制度知识和客观数据来解答问题的某些方面,并同时利用其他情境下的影响力评估证据来解答另外一些方面。
本文阐释的普适化框架提供了一个实用的方法来综合各类证据,以便评估特定政策是否可能在某种新情境下生效。如果研究人员和决策者继续将影响力评估结果视为一个黑匣子,也不聚焦于机制,那么基于证据决策的运动就将远远无法发挥其改善人类生活的潜力。
注释
1 Pascaline Dupas, “Do Teenagers Respond to HIV Risk Information? Evidence from a Field Experiment in Kenya,” American Economic Journal: Applied Economics, vol. 3, no.1, 2011, pp. 1-34.
2 Kaushik Basu argues that, because tomorrow is a new context, we cannot assume that a program that worked in Kenya yesterday will be effective in Kenya tomorrow. See his article “The method of randomization and the role of reasoned intuition,” Policy Research working paper, no. WPS 6722, World Bank Group.
3 See Lant Pritchett and Justin Sandefur, “Context Matters for Size: Why External Validity Claims and Development Practice Do Not Mix,” Journal of Globalization and Development, vol. 4, no. 2, 2013, pp.161-197.
4 For a discussion of how experiments can be designed to test mechanisms, see Ludwig, Jens, Jeffrey R. Kling,and Sendhil Mullainathan, “Mechanism Experiments and Policy Evaluations,” Journal of Economic Perspectives, vol. 25, no. 3, 2011, pp. 17-38.
5 Abhijit Banerjee, Esther Duflo, Rachel Glennerster, and Dhruva Kothari, “Improving Immunisation Coverage in Rural India: Clustered Randomised Controlled Evaluation of Immunisation Campaigns with and without Incentives,” BMJ, 340:c2220, 2010, pp. 1-9.
6 Pascaline Dupas and Edward Miguel, “Impacts and Determinants of Health Levels in Low-Income Countries,” NBER Working Paper Series, no. w22235, 2016.
7 See Neil Buddy Shah, Paul Wang, Andrew Fraker, and Daniel Gastfriend, “Evaluations with impact:Decision-focused impact evaluation as a practical policymaking tool,” 25, 3ie Working Paper, 2015.
8 For more details, see Dina Grossman, “Incentives for Immunization,” J-PAL Policy Briefcase, November 2011.
9 See Michael Kremer and Rachel Glennerster, “Chapter Four: Improving Health in Developing Countries:Evidence from Randomized Evaluations,” Handbook of Health Economics, edited by Mark V. Pauly,Thomas G. Mcguire, and Pedro P. Barros, vol. 2, 2011, pp. 201–315. Also see Pascaline Dupas, “Health Behavior in Developing Countries,” Annual Review of Economics, vol. 3, 2011, pp. 425-449.
10 Jessica Cohen and Pascaline Dupas, “Free Distribution or Cost-Sharing? Evidence from a Randomized Malaria Prevention Experiment,” Quarterly Journal of Economics, vol. 125, no. 1, 2010, pp. 1–45.
11 Rebecca L. Thornton, “The Demand for, and Impact of, Learning HIV Status,” American Economic Review, vol. 98, no. 5, 2008, pp. 1829–1863.
12 Philip J. Cook, Kenneth Dodge, George Farkas, Roland G. Fryer Jr., Jonathan Guryan, Jens Ludwig, Susan Mayer, Harold Pollack, and Laurence Steinberg, “Not Too Late: Improving Academic Outcomes for Disadvantaged Youth,” Institute for Policy Research Northwestern University Working Paper WP-15-01, 2015.
13 Roland G. Fryer, “Injecting Charter School Best Practices into Traditional Public Schools: Evidence from Field Experiments,” Quarterly Journal of Economics, vol. 129, no. 3, 2014, pp. 1355–1407.
14 Paul Glewwe, Michael Kremer, and Sylvie Moulin, “Many Children Left behind? Textbooks and Test Scores in Kenya,” American Economic Journal: Applied Economics, vol. 1, no. 1, 2009, pp. 112–135.
15 Esther Duflo, Pascaline Dupas, and Michael Kremer, “Peer Effects, Teacher Incentives, and the Impact of Tracking: Evidence from a Randomized Evaluation in Kenya,” American Economic Review, vol. 101, no. 5,2011, pp. 1739-1774.
16 Abhijit Banerjee, Rukmini Banerji, James Berry, Esther Duflo, Harini Kannan, Shobhini Mukherji, Marc Shotland, and Michael Walton, “Mainstreaming an Effective Intervention: Evidence from Randomized Evaluations of ‘Teaching at the Right Level’ in India,” NBER Working Paper Series, no. w22746, 2016.
* * *
玛丽·安·贝慈(Mary Ann Bates)
反贫困行动实验室副主任
拉切尔·格兰斯特(Rachel Glennerster)
反贫困行动实验室执行董事