首页 >> 教育学 >> 普通教育学
PISA的政策影响:类型、方式及其启示
2015年02月06日 10:40 来源:《外国教育研究》2014年7期 作者:李刚 陈思颖 字号

内容摘要:国际学生评价项目(PISA)在定位上具有强烈的政策导向,在其影响下,参与国出现了政策加固、政策借鉴、政策革新与政策冷漠四种政策回应。提供证据与进行比较是PISA开启政策之窗的重要方式,但是证据只有具有信息势差之后方会产生效果,比较却引发了排名效应。我国需要学习PISA的政策证据生产,重视教育政策证据的生产与集聚,但是需要审慎对待排名,合理引导证据传播,并进一步完善教育监测体系以提高教育证据生产与反思能力。

关键词:PISA;政策影响;类型

作者简介:

  作者简介:李刚,陈思颖,北京师范大学 教育学部,北京 100875;陈思颖,杭州师范大学 外国语学院,浙江 杭州 311121

  李刚(1988-),男,浙江杭州人,北京师范大学教育学部博士生;陈思颖(1982-),女,浙江台州人,北京师范大学教育学部博士生,杭州师范大学外国语学院讲师。

  内容提要:国际学生评价项目(PISA)在定位上具有强烈的政策导向,在其影响下,参与国出现了政策加固、政策借鉴、政策革新与政策冷漠四种政策回应。提供证据与进行比较是PISA开启政策之窗的重要方式,但是证据只有具有信息势差之后方会产生效果,比较却引发了排名效应。我国需要学习PISA的政策证据生产,重视教育政策证据的生产与集聚,但是需要审慎对待排名,合理引导证据传播,并进一步完善教育监测体系以提高教育证据生产与反思能力。

  关 键 词:PISA 政策影响 类型

  由经济合作与发展组织(Organization for Economic Co-operation and Development,简称OECD)发起的国际学生评价项目(Programme for International Student Assessment,简称PISA)凭借其先进的评价理念与技术以及巨大的国际影响力,被越来越多的国家或地区认可并引入,参与国家或地区从2000年的43个增加到2012年的65个(为便于叙述,下文不再区分国家与地区)。需要明确的是,PISA不是全球性的学生竞赛,亦非单纯的学院派研究,“政策导向”是其重要指向。PISA 2000报告中便开宗明义地指出,PISA“旨在为政策对话以及教育目标的界定与实施提供一个新的基础”。[1]但是,我国研究者对PISA产生了哪些政策影响、这些影响又是如何发生的等问题关注甚少。上海在PISA测试中“两连冠”引发了社会各界对教育的广泛思考,在此背景之下,我们更应理性审视PISA这一国际化的教育政策分析工具,并进一步反思以PISA为代表的大规模国际测评对我国教育政策制定与教育政策研究的现实意义。

  一、PISA引发的政策回应:类型与实例

  哈佛大学比较教育政策专家斯坦纳-克哈米斯(Steiner-Khamsi)认为,国际比较会造成三种基本态度,即羞耻(scandalization,批评了某国薄弱的教育系统)、赞颂(glorification,褒奖了某国优秀的教育系统)和对结果的漠不关心(indifference)。[2]基于这三种基本态度,本研究将参与国在PISA结果公布后的政策调整归纳为政策加固、政策借鉴、政策革新与政策冷漠四种类型。

  (一)政策加固

  政策加固是指该国学生在PISA测评中表现优异,教育系统得到“褒奖”,其会选择继续坚持甚至强化之前的教育政策。这一“更进一步”的逻辑诚然合理,但是现实却不尽然。芬兰在PISA 2000中获得桂冠,正当国际社会为芬兰现有的教育体系喝彩之时,芬兰政府依然选择改革原有的课程体系,通过增加必修课程的比例和加强核心学科的比重来保持课程体系的平衡。[3]PISA 2003结果公布后,PISA芬兰项目组仍感叹,芬兰学生在PISA中的突出表现的确令人欣慰,但同时也给芬兰教育当局和教育决策者带来了一定困惑:“我们一度认为,我们的教育改革应当借鉴他国的经验,我们曾经向德国学习”。[4]同样的情况还出现在上海,虽然上海两度夺冠,但是诸多媒体和网民将PISA的这一褒奖归因于应试教育传统、教育资源集聚等因素,而非因此肯定上海的教育政策。如《光明日报》便在PISA 2012后发表了题为《PISA全球第一不值得陶醉》的文章,告诫大家“如果学生出色的考试成绩是靠大量的时间刻苦出来的,以及家长、学校和教育部门用大量钱财堆积出来的,虽然成绩很骄人,但他们作为未成年人的幸福感并不强”。[5]从上述两地来看,测评成绩与教育政策选择并非总是紧密相连的,测评表现的优异并不必然带来教育政策的加固,PISA结果不足以形成一国对自身教育政策的自信。

  (二)政策借鉴

  政策借鉴的发生是因为他国教育系统得到了褒奖,而本国教育系统招致批评,受批评的国家向表现优异的国家学习教育政策经验。与芬兰国内对于结果的“淡定”形成鲜明对比的是,诸多国家纷纷向芬兰“取经”,介绍、挖掘芬兰在PISA中成功的经验。但是从关注的目光和纷至沓来的参观学习到教育政策的对话和迁移仍有很长的距离。人们“试图寻找解决教育问题简单的、现成的方法,但是这些方法往往是与具体的情境紧密相联的”,[6]政策借鉴需要考虑两国复杂的背景因素。也正因为如此,笔者实难找到芬兰具体的教育政策经验得到他国采用并取得良效的案例。

  有的国家将PISA本身的理念或技术纳为本国教育政策的重要组成,这种借鉴倒是较为常见。如德国,一方面参照PISA对素养的理解与对精熟度的设定,形成了类似PISA评价框架的基础教育阶段自然科学能力二维模型;[7]另一方面,采用与PISA测试相同的测试工具,在初等教育和中等教育结束期进行大规模测评。又如,上海在参加PISA后推出了自己的评价体系——绿色指标。PISA中国项目组组长张民选教授便表示:“上海参加PISA一个很重要的原因就是,通过参加测试学习人家的一整套质量评价与检测方法,从而建立起一套适合上海特点的质量评价体系……参加是为了不参加”。[8]

  (三)政策革新

  政策的革新是指参与国针对PISA反映的问题出台针对性的政策予以回应,德国便是其中的典型案例。在2000年,德国学生阅读素养在32个国家中排在第21位,数学素养排在第20位,科学素养排在第20位,三项成绩都在OECD国家平均分之下。在阅读素养方面,23%的学生处于最低精熟度及以下,移民学生的表现更是让人堪忧。[9]针对PISA 2000反映出的问题,德国出台了“七个行动领域”计划,包括:1)从学前教育阶段便开始提高学生的语言能力,尤其是提高移民背景儿童的语言能力;2)加强学前教育阶段与小学教育阶段衔接,促进学生尽早入学;3)改善小学教育,提高学生阅读素养以及对数学、科学概念的基本理解;4)为教育劣势学生提供特别的帮助,尤其是要关注那些有移民背景的儿童和青少年;5)基于富有约束力的标准与结果导向的评价来提升教与学的质量;6)提高教师教学专业化水平,特别是重视教师诊断性与方法性的能力,并将其视为学生系统化改进的重要因素;7)增加校内外的全日设施设备,为学生提供更多受教育机会,尤其关注受教育劣势学生与英才儿童。[10]对比问题与措施,我们不难发现其中的对应。

  (四)政策冷漠

  与PISA在德国形成了巨大反响截然不同,美国对2000年、2003年与2006年的PISA结果更多的是“漠不关心”。虽然美国学生在这三轮PISA测评中的表现持续在OECD参与国的平均水平之下,但是公众与媒体并没有对此给予太多的关注。在所有OECD国家中,美国媒体对三次PISA结果的回应是最少的。[11]但是,随着2009年上海在PISA测评中一举夺魁,美国各界对PISA的态度发生了巨大改变。美国国内对PISA的结果大肆报道,引发了公众对基础教育的热议,诸多政客发声。《纽约时报》在2010年12月7日以《上海顶尖的成绩令教育工作者为之震惊》(Top Test Scores from Shanghai Stun Educators)为题在教育版发表头条文章,将这一结果比喻为又一次“人造卫星的发射”。教育部长阿恩·邓肯(Arne Duncan)在采访中说道:“我们必须把这当作警钟……我们可以对成绩吹毛求疵,或者我们也可以直面残酷事实,认识到我们的教育落人之后”。[12]针对美国在PISA 2009中的表现,邓肯部长委托OECD研究表现优异的学校系统所具有的特征以及美国可以从中吸取的经验,最后形成了《超越上海:基于世界领先教育系统的美国教育议程》(Surpassing Shanghai: An Agenda for American Education Built on the World's Leading Systems)一书。

  英国在2000年与2003年的PISA测评中表现优良,但是整体而论PISA并没有引起广泛的讨论,政府对学生的表现也没有表现出太多的惊讶。但是从PISA 2006开始,英国学生表现的国际排名持续下滑,这一结果引起了政客、学者与一线教育者的广泛关注。有研究者认为后期出台的《儿童计划:构建更加美好的未来》(The Children's Plan: Building Brighter Futures)与《教学的重要性:学校白皮书2010》(The Importance of Teaching: The Schools White Paper 2010)等政策与英国在PISA中排名的下降不无关系。[13]

  二、PISA如何开启政策之窗:“证据”与“比较”的力量

  各国对于PISA的政策回应不尽相同,有如美英初期一般的政策冷漠,又有如德国这般进行了重要的政策调整,但是不可否认的是,PISA在不少国家扮演了打开政策之窗(policy window)的角色,“让特定问题得到关注或帮助政策倡导者提出政策建议”。[14]政策之窗的开启需要问题溪流(指一些教育事件需要被政策制定者定义为问题)、政治溪流(诸如公众的情绪,压力集团间的竞争、选举结果等)与政策溪流(指政策原汤周围漂浮的各种建议)的汇流。[15]PISA在其中发挥作用主要通过两种方式:提供证据与进行比较。

  (一)证据与信息势差

  现代政策科学之父哈罗德·拉斯维尔(Harold Lasswell)在界定政策研究概念之时便强调,政策研究需要“通过数据的搜集与分析对特定政策问题提供解释”,[16]可见以数据为核心的证据在政策过程与政策研究中的重要性。在欧美诸国,教育研究者日益强调向重视证据的医疗研究学习,在教育研究中重视并挖掘证据,为教育决策提供有质量的智力支持;政府亦强调在政策制定中遵循“证据为本”(evidence-based)的原则,从而提高决策的理性化水平。英国前教育大臣戴维·布伦基特(David Blunkett)在2000年时就说:“社会科学应该处于政策制定的核心。在政府和社会研究团体的关系上,我们需要革新——我们需要社会科学家来帮助我们决定什么政策起作用以及为什么起作用,哪些类型的政策改革可能是最有效的。”[17]

  在这样的背景下,一种情况存在与否及重要程度可以用一系列指数来反映成为其是否能够被合理地定义为政策问题的关键,[18]PISA无疑可以为问题溪流的清晰提供证据。这些证据主要可以分为三类:其一,PISA对学生测评成绩数据与学校内外关键因素的关系加以分析,发现不同家庭社会经济背景的学生的表现差异和学生在学校之间、不同类型的教育体系之间的表现差异,使决策者更为明确如何发挥教育对不同家庭社会背景、学校背景的学生的正向作用,发现教育系统现存的问题,为政策革新提供证据;其二,PISA可以呈现参与国范围内教育系统投入产出的现状与经验,让参与国知晓本国教育所处的位置,以及本国教育体系的比较优势与比较劣势,促成政策的加固或借鉴;其三,PISA本身也是教育评价的研究与实践,它在开展过程中的成效与问题,可以为他国教育评价方式的改革提供证据,亦可成为政策借鉴的内容。

  很多研究或测评项目都可以提供类似的证据,为何PISA的证据产生了更大的政策影响?一是因为PISA具有系统、科学的整体设计。PISA确定了现代社会所需的学生素养结构,继而形成科学的测评工具,采用规范的抽样方式,对教育系统的投入产出进行分析。PISA证据生产的方式基于强有力的学术研究,整个过程具有严格的数据管控,这可为理解一国教育提供清晰易懂、科学可靠的证据。反之,一旦框架不合理或者管控有所偏差,便会导致证据的无效,PISA在开展过程中也遭遇过这样的情况。在PISA 2000与2003中,英国教育与技能部(Department for Education and Skills)认为有偏抽样导致高估了英格兰学生的表现。[19]也正是因为如此,2005年的《14-19岁教育与技能白皮书》(14-19 Education and Skills White Paper)援引了TIMSS和PIRLS的结果而不是PISA的结果。二是因为PISA的组织方OECD国际组织的属性。这令其证据生产可以保持中立,减少本国证据生产可能存在的掩饰心理,更具可信度。而且它可以建立一个参与国教育水平的“常模”,方便各国进行横向比较,明确自身教育的比较优势与比较劣势。三是因为PISA具有开源的数据库,可以让全球范围内的教育研究者与政策制定者参与PISA的数据挖掘,进行政策证据的生产与反思。

  但是,并不是PISA提供了准确无误的证据便可发挥政策价值,证据产生政策影响需要“信息势差”的存在,即一国自身掌握的关于本国教育的证据与PISA提供的证据之间存在鸿沟,甚至是冲突。美国前期对PISA的结果并不关注,很重要的原因便是美国拥有比较完善的教育评价监测手段。如肇始于1990年的美国国家教育进步评价(National Assessment of Educational Progress,简称NAEP),会周期性地对4、8、12年级的美国学生进行全面测试,测试涵盖阅读、数学、科学、写作、美国历史等学科,搜集的数据是美国教育改革与政策制定的重要参考。正如一位美国教育官员在接受访谈时指出的,PISA并没有提供什么有意义的新信息:“很多学校教育质量低已经成为了共识,PISA只是确认了学校的这些劣势,并不能引起激烈的反应”。[20]英国前期的政策冷漠也是因为其长期以来对标准化考试的关注以及娴熟的数据搜集和使用能力。[21]这种证据搜集与使用能力的重要体现便是其完善的教育督导系统。除了规范的官方督导外,英国还出台多项指导性文件引导学校进行系统、长期的自我评价,如《充分利用督导:学校和校董指南》(1996)、《学校评估事项》(1998)、《我们学校的质量如何?——使用质量指标进行自我评价》(1998)、《提高标准—设立目标:中学支持文件包》(1998)和《提高标准—设立目标:小学支持文件包》(1988)等。这些文件不仅让国家的政策证据生产更为科学规范,更提高了学校搜集证据并利用证据进行改进的能力。

分享到: 0 转载请注明来源:中国社会科学网 (责编:毕雁)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们