从印度到芝加哥-斯坦福社会创新评论02-万书网

根据现行机制，在某种情境中学到的经验能够并且确实成功地运用到了其他情境当中。我们最后再举个例子来阐释这个话题。最近，我们芝加哥教育实验室的同事们与芝加哥公立学校合作，以帮助那些学业不佳的高中男生取得进步。他们与适配教育（Match  Education）进行合作，利用随机评估测试了个性化的二对一辅导方案，该方案因大幅提高学生的数学成绩而获得了全美的关注。12

哪些因素决定了我们选择在芝加哥尝试个性化学习方案呢？研究小组不仅利用了得克萨斯州密集化辅导的准实验评估成果，13还参考了在肯尼亚和印度进行的随机评估结果。没有人会认为后者的环境类似于芝加哥，但是，审视那些帮助落后学生提高学业的根本机制，我们就会在极其不同的环境中找到非常吻合的证据。

在肯尼亚，早期的随机评估发现，为学生提供新教材无助于改善孩子的学习状况，除非这些孩子已经是班级中的尖子生。14这表明，部分问题在于，课程和教科书是根据班级中的部分而非所有学生的学习水平而设计的。后续评估考察测试了先根据初步学习水平对学生进行分组，然后由教师提供更具针对性的教学的做法，结果发现各个小组中的学生成绩都提高了。15

与此同时，在印度，致力于改善教育状况的非政府组织布拉罕协会（Pratham）也正在应对同样的挑战，招募当地志愿者教导年幼孩子学会基本的识字和算术能力。虽然背景和方法不同，但是该方案也采取了类似的根本机制：通过提供适当水平的重点教学，正规学习课程明显落后的孩子能够相对迅速地迎头赶上。在过去十年中，我们的同事与布拉罕协会合作，在不同的环境中——农村和城市，通过不同的人——志愿者或正式教师，在不同时期——教学、上学期间或暑假期间，反复检验辅导方案，效果一直很好。16

同事们在设计芝加哥学习方案时审查了所有相关证据，他们发现了与普适化框架相关的不同地区条件的类似之处。在芝加哥——与印度和肯尼亚一样——部分学生在课程上落后了好几年，但是现行教育体制鼓励教师们讲授与学生年级相应的学习资料，而不是针对学生实际学习水平进行补课。方案的实施也有相似之处：辅导者可以接受培训，以教授相应水平的学生，而不用担心无法管理需求各不相同的整个班级。匹配教育的方法是引进受过良好教育的个人，让他们愿意将此当作公共服务而以微薄的薪金工作一年，否则的话，这种做法（小组教学）会因成本过高而不太可行。与印度相同的是，由于教师不再需要经过专门培训以管理复杂的课堂，单单注重年级教学目标也失去了意义，因此，他们能够运行小组方案，并更容易控制成本。

这个例子表明，有效阅读文献需要寻找看似不同的研究成果之间的内在联系。对各种有效方案背后的共同机制的学术回顾对决策者有很大的价值，因为这能使他们深入了解从看似不同的情境中概括出来的基本行为。这迥然不同于某些政策圈子推崇的荟萃分析（meta-analysis）的新潮流。在传统上，荟萃分析往往用于医学，仅对不同研究所发现的结果进行平均化处理。虽然这类荟萃分析能够对一种特定类型的研究提供综述，但它无益于我们芝加哥的同事：将教材评估结果与其他投入（如椅子和书桌）的研究结果进行简单的平均化处理，而补习则被纳入另一组研究之中。荟萃分析不可能从这两种研究中挖掘出理论联系，因为这两种研究虽然理论出发点相同，却在考察不同的干预措施。

理解不同的情境

关注当地情境的人与做影响力评估的人经常被视为水火不容，但是这种看法是错误的。我们在进行影响力评估，并帮助政府将其经验教训融入政策的过程中，也对深入理解当地的情况满怀热情。普适化难题的核心在于，我们必须将任何实际的政策问题拆分成多个方面：利用当地的制度知识和客观数据来解答问题的某些方面，并同时利用其他情境下的影响力评估证据来解答另外一些方面。

本文阐释的普适化框架提供了一个实用的方法来综合各类证据，以便评估特定政策是否可能在某种新情境下生效。如果研究人员和决策者继续将影响力评估结果视为一个黑匣子，也不聚焦于机制，那么基于证据决策的运动就将远远无法发挥其改善人类生活的潜力。

注释

1  Pascaline  Dupas,  “Do  Teenagers  Respond  to  HIV  Risk  Information?  Evidence  from  a  Field  Experiment  in  Kenya,”  American  Economic  Journal:  Applied  Economics,  vol.  3,  no.1,  2011,  pp.  1-34.

2  Kaushik  Basu  argues  that,  because  tomorrow  is  a  new  context,  we  cannot  assume  that  a  program  that  worked  in  Kenya  yesterday  will  be  effective  in  Kenya  tomorrow.  See  his  article  “The  method  of  randomization  and  the  role  of  reasoned  intuition,”  Policy  Research  working  paper,  no.  WPS  6722,  World  Bank  Group.

3  See  Lant  Pritchett  and  Justin  Sandefur,  “Context  Matters  for  Size:  Why  External  Validity  Claims  and  Development  Practice  Do  Not  Mix,”  Journal  of  Globalization  and  Development,  vol.  4,  no.  2,  2013,  pp.161-197.

4  For  a  discussion  of  how  experiments  can  be  designed  to  test  mechanisms,  see  Ludwig,  Jens,  Jeffrey  R.  Kling,and  Sendhil  Mullainathan,  “Mechanism  Experiments  and  Policy  Evaluations,”  Journal  of  Economic  Perspectives,  vol.  25,  no.  3,  2011,  pp.  17-38.

5  Abhijit  Banerjee,  Esther  Duflo,  Rachel  Glennerster,  and  Dhruva  Kothari,  “Improving  Immunisation  Coverage  in  Rural  India:  Clustered  Randomised  Controlled  Evaluation  of  Immunisation  Campaigns  with  and  without  Incentives,”  BMJ,  340:c2220,  2010,  pp.  1-9.

6  Pascaline  Dupas  and  Edward  Miguel,  “Impacts  and  Determinants  of  Health  Levels  in  Low-Income  Countries,”  NBER  Working  Paper  Series,  no.  w22235,  2016.

7  See  Neil  Buddy  Shah,  Paul  Wang,  Andrew  Fraker,  and  Daniel  Gastfriend,  “Evaluations  with  impact:Decision-focused  impact  evaluation  as  a  practical  policymaking  tool,”  25,  3ie  Working  Paper,  2015.

8  For  more  details,  see  Dina  Grossman,  “Incentives  for  Immunization,”  J-PAL  Policy  Briefcase,  November  2011.

9  See  Michael  Kremer  and  Rachel  Glennerster,  “Chapter  Four:  Improving  Health  in  Developing  Countries:Evidence  from  Randomized  Evaluations,”  Handbook  of  Health  Economics,  edited  by  Mark  V.  Pauly,Thomas  G.  Mcguire,  and  Pedro  P.  Barros,  vol.  2,  2011,  pp.  201–315.  Also  see  Pascaline  Dupas,  “Health  Behavior  in  Developing  Countries,”  Annual  Review  of  Economics,  vol.  3,  2011,  pp.  425-449.

10  Jessica  Cohen  and  Pascaline  Dupas,  “Free  Distribution  or  Cost-Sharing?  Evidence  from  a  Randomized  Malaria  Prevention  Experiment,”  Quarterly  Journal  of  Economics,  vol.  125,  no.  1,  2010,  pp.  1–45.

11  Rebecca  L.  Thornton,  “The  Demand  for,  and  Impact  of,  Learning  HIV  Status,”  American  Economic  Review,  vol.  98,  no.  5,  2008,  pp.  1829–1863.

12  Philip  J.  Cook,  Kenneth  Dodge,  George  Farkas,  Roland  G.  Fryer  Jr.,  Jonathan  Guryan,  Jens  Ludwig,  Susan  Mayer,  Harold  Pollack,  and  Laurence  Steinberg,  “Not  Too  Late:  Improving  Academic  Outcomes  for  Disadvantaged  Youth,”  Institute  for  Policy  Research  Northwestern  University  Working  Paper  WP-15-01,  2015.

13  Roland  G.  Fryer,  “Injecting  Charter  School  Best  Practices  into  Traditional  Public  Schools:  Evidence  from  Field  Experiments,”  Quarterly  Journal  of  Economics,  vol.  129,  no.  3,  2014,  pp.  1355–1407.

14  Paul  Glewwe,  Michael  Kremer,  and  Sylvie  Moulin,  “Many  Children  Left  behind?  Textbooks  and  Test  Scores  in  Kenya,”  American  Economic  Journal:  Applied  Economics,  vol.  1,  no.  1,  2009,  pp.  112–135.

15  Esther  Duflo,  Pascaline  Dupas,  and  Michael  Kremer,  “Peer  Effects,  Teacher  Incentives,  and  the  Impact  of  Tracking:  Evidence  from  a  Randomized  Evaluation  in  Kenya,”  American  Economic  Review,  vol.  101,  no.  5,2011,  pp.  1739-1774.

16  Abhijit  Banerjee,  Rukmini  Banerji,  James  Berry,  Esther  Duflo,  Harini  Kannan,  Shobhini  Mukherji,  Marc  Shotland,  and  Michael  Walton,  “Mainstreaming  an  Effective  Intervention:  Evidence  from  Randomized  Evaluations  of  ‘Teaching  at  the  Right  Level’  in  India,”  NBER  Working  Paper  Series,  no.  w22746,  2016.

*  *  *

玛丽·安·贝慈（Mary  Ann  Bates）

反贫困行动实验室副主任

拉切尔·格兰斯特（Rachel  Glennerster）

反贫困行动实验室执行董事