基础教育领域大型国际教育评价项目研究——以国际数学和科学趋势研究(TIMSS)为个案
发布时间:2017-05-04
  •   NOESP

      全 国 教 育 科 学 规 划 课 题

      成果公报

      课题批准号 GFA111015

      课题 名 称 基础教育领域大型国际教育评价项目研究——以国际数学和科学趋势研究(TIMSS)为个案

      课题负责人 赵慧

      所在 单 位 上海市教育科学研究院

      填表 日 期 2016年12月6日

      课题成果公报

      上海市教育科学研究院 全国教育科学规划“十二五”规划2011年度教育部重点课题负责人(赵慧、助理研究员)主持完成了“基础教育领域大型国际教育评价项目研究” (课题批准号:GFA111015)。课题组主要成员:丁笑炯(博士,上海师范大学副教授)、陈建俞(博士,上海交通大学医学院研究生院科长)、方乐(硕士,上海市教育评估院评估研究所专家),课题还有两名合作者:毛建茹(上海市教育科学院高教所)、王湖滨(上海市教育科学研究院普教所、PISA研究中心科研人员),课题顾问为江彦桥教授(博士,上海市教育科学研究院原党委书记)。

      一、内容与方法

      本研究课题在界定了相关概念以后,以研究分析国际大型教育评价项目来入手,重点聚焦国际数学和科学趋势研究(以下简称TIMSS),并提出我国现阶段引进国际大型教育评价项目值得思考的问题,为我国推进科学、有效的教育评价提供决策参考。主要研究内容有以下三个部分:(一)主要的国际大型教育评价项目总体概况及分析。主要介绍TIMSS的前身、国际阅读素养研究(Progress in International Reading Literacy Study,简称PIRLS)、国际学生评估项目(Programme for International Student Assessment,简称PISA)等国际大型教育评价项目;分析三个评价项目的相同点和主要区别,相同点主要有:1.评价项目具有明显的年级或年龄性特征;2.学科界定明确,普遍认为学生的阅读、数学、科学素养和能力是核心内容,最能体现教育质量;3.参与国家、地区以及所发挥的影响力都有不断扩大的趋势。不同点主要有:1.评价理念不同,TIMSS的理念是评估学生在基本知识和概念方面,与课程框架紧密联系的数学、科学和阅读的思维能力。PISA的理念是评估学生在日常生活情境中处理问题所需要的阅读、科学和数学素养;2.评价内容不同,TIMSS评价内容大多与学校课程有密切的联系,试图测量学生对具体知识、技能和概念的掌握程度,大量题目覆盖课程的内容,少量题目测评学生综合能力。PISA则侧重于测量广义的“素养”,主要是应用知识和技能解决问题的能力,以及在日常生活情境下做出良好判断和决策的能力。这些不同于且高于对学校课程所设置的学科相关知识的理解或记忆能力的考察;3.评价目的侧重点不同,TIMSS项目主要面向学校,所收集的学生背景信息侧重于反映不同国家的教师是如何进行教学的,以及这些教学对学生的成绩可能产生的影响。PISA在于衡量各国义务教育的产出,应用测试结果提供教育成效对比的有效指标,并通过收集家庭、学校等方面的相关信息,侧重点在于为国家教育政策制定和调整提供参考;4.评价对象抽样不同,TIMSS采用以年级为基础进行抽样的方式,主要报告课程成绩。PISA采用以测试时年龄在15岁3个月到16岁2个月的学生为基础进行抽样的方式,目的是描述义务教育结束时的教育成效;5.评价结果报告不同。TIMSS项目的国际平均值以所有参与国家和地区为基准,包括工业化国家、中等收入国家和发展中国家和地区。PISA以30个OECD成员国(主要为世界发达国家)的平均值为基准,教育质量国际平均值代表了当今世界发达国家的平均水平(二)TIMSS项目个案解析。主要包括:1.研究TIMSS的发展演变历程及趋势,从实测工具和施策目标、参与的国际和地区分布情况、历次TIMSS测试的主要结论和发现等三个方面研究分析TIMSS的发展趋势;2.最新完成的TIMSS2011测试的评价框架,分别介绍分析了TIMSS2011数学测试和TIMSS2011科学测试评价框架的维度划分和占比情况;3.施测情况及结果分析(TIMSS2011数学测试和TIMSS2011科学测试),主要结论与分析详见下文。(三)若干有关论题的思考,主要包括:1.从分析研究TIMSS所带来的对国际大型教育评价项目的认识;2.参与国际大型教育评价项目对我们自身教育体系所发挥的价值等,具体对策建议详见下文。

      本课题研究以教育评价学视角切入,并用国际比较、专家访谈、个案研究等研究方法,通过面上分析国际大型教育评价项目特征、运作、发展等,剖析TIMSS个案,聚焦若干值得思考的问题,为我国大规模引进国际大型教育评价项目提出建议,探索推动我国教育评价理论研究与实践发展。

      二、结论与对策

      本研究从介绍分析主要的几个国际大型教育评价项目(TIMSS的前身、PIRLS、PISA等)入手,以国际数学和科学趋势研究(TIMSS)为研究个案,重点分析TIMSS2011项目评价进展概况,主要结论观点如下:

      1.新加坡、韩国、日本、中国台北、香港特别行政区等5个东亚国家/地区在TIMSS2011数学测试中持续领先世界。与学生数学学业成就具有正相关的因素有:对学生的早期培养,即早期培养对于锻炼孩子的数字技能至关重要;家庭资源保障和学校资源保障,即家庭资源保障和学校资源保障情况对学生数学学业成绩的重要影响;学校的学习氛围和学习环境,即身处在学校非常强调学术成就的环境、学校纪律和安全情况良好以及较少有欺凌行为发生的学习环境中,学生更易取得较好的数学测试成绩;教师的教学准备程度及职业满意度,即师资力量的情况与学生数学学业成就有直接影响,教师教学准备程度越充分、职业满意度越高,学生越易取得较好的数学测试成绩;学生对数学学习的态度,即学生对数学的喜欢程度、有信心程度以及重视程度与其测试成绩呈正相关;学生参与教学的情况,即师生在教学中的互动合作对于学生数学学业成绩有重要影响,学生参与教学越多、越积极,容易取得较好的数学测试成绩;学生的基本营养情况和睡眠,即学生的身体状况特征对于课堂氛围也是非常重要的,进而影响数学学业成绩,那些基本营养状况良好、能保障充足睡眠的学生更易取得较好的数学测试成绩。

      2.上述五个东亚国家/地区在TIMSS2011科学测试中表现突出,但没有像数学测试那样稳居前五名,其他国家,如芬兰、俄罗斯、美国等也表现不俗。国家之间成绩分布总体差异较大。TIMSS2011科学测试与前几次科学测试相比,更重视学生科学探究的表现,但结果显示,科学探究表现与学业成绩并没有相关性,TIMSS科学测试成绩名列前茅的东亚国家,学生的科学探究表现普遍不佳,而成绩排名靠后的一些国家的学生在科学探究方面的表现良好。与学生科学学业成就具有正相关的因素有:家庭资源保障和学校资源丰富程度,即家庭资源保障和学校资源保障情况对学生科学学业成绩的重要影响;学校重视学业成就的程度和学校的纪律状况,即身处在学校非常强调学术成就的环境、学校纪律和安全情况良好以及较少有欺凌行为发生的学习环境中,学生更易取得较好的科学测试成绩;教师的教学准备程度及职业满意度,即师资力量的情况与学生科学学业成就有直接影响,教师教学准备程度越充分、职业满意度越高,学生越易取得较好的科学测试成绩;学生对科学学习的态度,即学生对科学的喜欢程度、有信心程度以及重视程度与其测试成绩呈正相关;学生参与教学的情况,即师生在教学中的互动合作对于学生科学学业成绩有重要影响,学生参与教学越多、越积极,容易取得较好的科学测试成绩;学生的基本营养情况和睡眠,即学生的身体状况特征对于课堂氛围也是非常重要的,进而影响科学学业成绩,那些基本营养状况良好、能保障充足睡眠的学生更易取得较好的科学测试成绩。

      通过以上本文对以TIMSS为代表的大型国际教育评价项目的研究与分析,对大型国际教育评价项目的认识以及对于参与国的启示主要有以下方面:

      1.关于教育质量测评的研究与认识。一方面是进行大规模的教育质量测评很有必要,这主要源于国际上对教育质量的越来越关注并相应地对教育质量的研究也越发深入,通过各种教育评价体系检验国家和学校的教育质量成为一种主要举措;第二方面是文化因素非常重要,已经有越来越多的研究者和实践者认识到文化因素在教育质量评测体系中有着较大的影响作用。但遗憾的是,文化因素在教育质量测评体系中常常被忽略且无法测试,本研究认为这也是国际大型教育评价项目改进完善的一个方向。

      2.参与大规模国际教育评价项目的思考,主要包括三个方面:一是通过数据可以有针对性的开展大量的改良工作,国际比较的结果不仅仅是一张排行榜,通过这些数据可以有针对性地开展大量的改良工作,也可以对学校结构性与教学结构性条件。如班级规模、课时量、社会身份、移民背景,以及对制定学校发展纲要、教师合作等方面,进行广泛而深入的探究,从而为学校发展、教育领导以及学生成绩的改进提供必要数据;二是参加测试可以聚焦比较,发现优势与不足;比如中国台北在 TIMSS2011表现非凡,很大程度上仰仗于TIMSS测试内容与官方课程高度吻合,或者说,官方课程的国际化程度颇高,这可以说中国台北在课程内容的国际化方面是一个优势。同时,在测试中成绩居后的一些发达国家也逐渐认识到本国教育体系中存在的某些不足,激发他们对TIMSS进行深入细致的研究,例如美国的政府相关部门、教育研究机构及个人对TIMSS进行多方面、多层次的研究分析,这些分析和研究结果在很大程度上推动了美国近十多年基础教育的改革发展;三是参考数据信息制定合适自身教育系统的政策。对于参与国际大规模教育评估的教育体系来说,评估数据可以用于诊断甚至缓解教育体系现存的问题与不足,并向教育政策制定者和学校发展研究者提供线索,以便制定合适自身教育系统的政策。比如新加坡在TIMSS项目测试中成绩名列前茅,但TIMSS测评信息也反映出新加坡教育体系一些不足,比如强调科学探究精神不够、以教师为中心重视知识传授等,基于此,新加坡政府希望能够在创造能力和创新精神方面有更高的发展,因此致力于改变现有的教育体系,要培养年青一代能够独立思考,以便于下一代和将来的年轻人能够找到解决问题的方法,而无论他们遇到什么样的问题。提出建立“思考的学校,学习的国家”(Thinking Schools,Learning Nation),成为新加坡学校教育改革的大目标,而批判性与创造性思维成为新加坡教育体系实施的重大革新举措之一。

      三、成果与影响

      本项目在课题组的协作研究和共同努力下,现已达到课题结题所规定的成果发表要求,由课题负责人赵慧在北大核心期刊《外国中小学教育》上公开发表论文三篇,分别是:1.TIMSS2011科学教育评价框架及运行研究,刊登于《外国中小学教育》2014年第9期;2.TIMSS2011数学教育评价框架及运行研究,刊登于《外国中小学教育》2015年第2期;3.TIMSS2011四年级调查问卷的设计研究,刊登于《外国中小学教育》2015年第9期。为深化研究,作者及课题组成员撰写了4篇相关的专题研究报告,分别是:1.大型国际教育评价项目的现状与发展方向;2.关于教育质量测评的研究和认识;3.TIMSS2011项目的设计与实施;4.我国跨区域大型教育评价项目的设计与运作研究。这4篇专题研究报告从不同的视角对TIMSS项目进行了更深入的分析和研究。

      本研究课题的论文发表产生了较好的反响,文章“TIMSS2011科学教育评价框架及运行研究”和“TIMSS2011数学教育评价框架及运行研究”为基础教育领域的教育行政管理者、教育研究者、中小学校的校长、教师等认识TIMSS这一国际教育评价项目提供了详实的数据信息、深入的研究分析,为他们了解外国同行(教育体系、学校、教师、学生、课程等)提供多维度的渠道和线索,为他们将自身情况进行国际比较和借鉴提供实证信息和研究支撑。其中刊登于《外国中小学教育》2015年第2期的论文“TIMSS2011数学教育评价框架及运行研究”被中国人民大学复印报刊资料全文转载,刊登于《初中数学教与学》2015年第6期。文章“TIMSS2011四年级调查问卷的设计研究”则是从“问卷调查”的角度对TIMSS项目测试进行深入分析,问卷调查在我们的研究工作常常处于一个不太受重视的状态,而TIMSS项目却是包含大量的问卷调查,非常注重问卷调查内容的深刻性以及问卷调查设计的精细化,本论文深刻剖析了TIMSS调查问卷的科学性和专业化特征,这对于我们设计研究项目的调查问卷有重要的借鉴意义。

      四、改进与完善

      虽然本研究课题已经公开发表若干篇研究论文,并完成研究总报告的撰写,但是由于课题组对本课题的研究认识水平的局限性以及研究计划规定的时间要求等诸多原因,本课题仍有一些需要改进和完善的地方,主要有以下几个方面:

      1.国际大型教育评价项目本身有需要改进的空间。目前有越来越多的国家和地区参加国际大型教育评价项目,并将评价结果作为调整本国或本地区教育政策的重要依据之一,但是本研究认为,任何一项国际大型教育评价项目都有其可取之处,也都有缺憾,TIMSS不例外,在本研究中就指出文化因素非常重要,也的的确确在学生的学业成绩中具有重要影响,但在质量测评体系中却无法体现,这可能是包括TIMSS在内的大多数国际教育评价项目所共有的缺陷。除了文化因素以外,TIMSS是不是还有其他的不足,这需要进一步的研究探讨。

      2.本课题组对项目的研究水平存在局限性。主要有两个方面:一是从课题组成员构成来看,本课题组成员大多是从事教育研究的科研人员,对于学术理论的把握、数据资料分析、国际比较、研究方法的使用等方面具有较大的优势,但是对于教育实践(比如教育政策在实践中的运用情况、学校的教育运行状况、教师群体信息、学生群体信息等)缺乏亲身体验和了解,这是本研究存在局限性的一个因素。另外一个方面在于TIMSS项目并没有在中国正式测试过,仅在2003年的部分地区(上海、河南、辽宁、新疆)2547名学生参加了高三年级数学素养测试,小范围的试点不具有典型意义。这使得本课题组无法从TIMSS的中国实践中得出更多、更有启发的建议和意见,为弥补这一缺憾,课题组研究其他国家、尤其是和我们具有相同文化背景的东亚国家运用TIMSS测试结果进行教育改革的具体实践和举措,经过提炼概括变成具有普遍意义的建议,但毕竟国情不同,教育体系也有很大差别,在政策建议这一方面本研究仍有改进完善的空间。同时本课题组对TIMSS调查问卷最具独特性的课程问卷单独拿出来作为模板并经过适当改造,特请上海有关课程专业研究人员进行问卷回答,据此结果分析了上海基础教育(主要是指4年级)数学和科学课程的实施情况,并提出政策建议。

      五、成果统计一览表(请按下页的“课题组成果统计一览表”栏目填写完整)

      课题组成果统计一览表

  •  序号

      作者

      成果形式

      成果名称

      出版单位/发表刊物

      刊物级别

      (CSSCI/核心)

      出版时间/刊物期号

      转载

      获奖情况

      决策采纳

      1

      赵慧

    论文

      TIMSS2011科学教育评价框架及运行研究

      外国中小学教育

      全国中文核心期刊

      2014年第9期

         

      2

      赵慧

    论文

      TIMSS2011数学教育评价框架及运行研究

      外国中小学教育

      全国中文核心期刊

      2015年第2期

      中国人民大学复印报刊资料《初中数学教与学》2015年第6期

       

      3

      赵慧

    论文

      TIMSS2011四年级调查问卷的设计研究

      外国中小学教育

      全国中文核心期刊

      2015年第9期

         

      4

      赵慧

    专题报告

      大型国际教育评价项目的现状与发展方向

               

      5

      赵慧

    专题报告

      关于教育质量测评的研究和认识

               

      6

      赵慧

      陈建俞

    专题报告

      TIMSS2011项目的设计与实施

               

      7

      赵慧

      方乐

    专题报告

      我国跨区域大型教育评价项目的设计与运作研究

               

      1.“成果形式”请注明为论文、编著、专著或教材

      2.“获奖情况”请填写政府颁发的、省部级二等奖以上的奖励,奖项名称应与课题名称对应。

      3.“决策采纳”指被省部级以上党政领导机关完整采纳吸收,并附有基本材料和相关证明。

Baidu
sogou