导读 教育考试服务 (ETS) 首席研究主管 Andreas Oranje本周在 SXSWedu 上对聚集的人群说,考试的中断是不可避免的,而且时机已经成熟。

教育考试服务 (ETS) 首席研究主管 Andreas Oranje本周在 SXSWedu 上对聚集的人群说,考试的中断是不可避免的,而且时机已经成熟。 他预测,在接下来的 10 年中,评估和测试将与最佳学习“密不可分”,拥有正确的数据将比以往任何时候都更重要,并且至少 95% 的当前教育技术产品将消失或过时因为它们并没有真正提供作为工具的价值。

也许最值得注意的是,他指出评估是近似值,但它们越接近被测量的真实事物,学生的能力与这些能力的证据之间的推理距离就越小。

本质上:对学生执行给定任务的能力的直接衡量越多,评估实际涉及的实际活动就越多。

这就是绩效评估的用武之地。

周三下午,来自俄亥俄州和德克萨斯州的评估专家和管理人员讨论了他们在这方面采取的方法。

斯坦福大学评估、学习与公平中心 (SCALE)执行董事Ray Pecheone表示,2010 年财富 500 强最有价值的技能以团队合作、解决问题、人际交往能力、口头交流和倾听技巧位居榜首。 此外,惠普基金会提出的深度学习能力包括掌握核心学术内容、批判性思考和解决复杂问题、协同工作、有效沟通、学习如何学习和培养学术思维。

当前的标准化考试和课程模式并没有解决这个问题。Pecheone 引用了教育家约翰·杜威 (John Dewey) 的愿望,希望自己的孩子能够培养学习的乐趣,并具备追求自己学习的技能和能力,并说这是不同测试的核心。

然而,评估这些 21 世纪技能的实践障碍仍然存在,因为基于测试的节奏和脚本课程继续本质上作为高风险州评估的考试准备。主时间表也超载,抑制了同伴和教师的协作。佩奇奥内说,人们需要时间交谈,并补充说国际社会对这些事情了如指掌。

什么是绩效考核?

小组成员解释说,性能评估以一系列“粒度”进行。最小的粒度是可以在一个班级内完成的任务,由学生个人完成,而最大的本质上是嵌入课程的项目,可能需要几周时间才能完成。问题也必须是开放的,为学生提供空间以最适合他们的方式找到解决方案。但最重要的方面,也许是他们使学生的任务变得真实,提供现实世界的相关性和背景。

刘易斯维尔(德克萨斯州)独立学区的中学识字和语言艺术管理员肖恩·胡德重申了这一点,他说这些任务必须将学生的技能置于情境中,说明他们为什么重要。例如,对莎士比亚戏剧的研究可以加强对修辞信息的批判性思维。这是关于回答为什么你需要知道这一点的问题,以便你可以在生活中以重要的方式应用它。

“当我们处于州一级时,我们的最终目标是双重的,”俄亥俄州公共教育总监保罗·德玛丽亚说, 并补充说领导人必须使州评估系统有意义。

他补充说,在州一级,越来越明显的是,部分由于联邦政策,标准化评估已经到位,作为衡量学校和学区表现的标准,以及衡量学生知识的主要工具。但很明显,学生可以通过多种方式展示他们的知识和能力。

“我们还想做的是创建一个与良好教学实践相结合的评估系统,”德玛利亚说,并补充说他从不想听到学生说他们在学习了一些东西后认为他们可以做什么,比如如何阅读,是“考得好”。

各州是如何做的?

俄亥俄州、德克萨斯州和其他州的绩效评估运动主要是草根运动。

在俄亥俄州,K-8 教学数学教练 Christa Krohn 说,奥兰治市学区正在进行绩效评估的第三年。他们从俄亥俄州教育部的个性化学习资助开始。首先,他们必须了解什么是绩效评估、为什么需要它以及评估的“粒度”。他们还必须学习如何编写绩效评估。

第二年,他们开始研究标准化考试的蓝图。他们将人员添加到他们的队列中,该队列目前包括该州的六个地区。他们现在正在进行实地测试,重点是代数 I、六年级数学、科学和历史。为了建设能力,他们刚刚从首席州立学校官员委员会 (CCSSO) 获得资金,用于在该州培训更多地区。

胡德说,德克萨斯州的经历与此类似,并指出教师之间“有这样做的愿望”。那些实验者想要一些新东西,但管理人员必须弄清楚这意味着什么,以及如何让他们为此做好准备,同时确保教师所看到的内容的可靠性。

“在这项工作中解决成年人的需求是巨大的,”德克萨斯州学校行政人员协会学习和领导服务主管埃里克辛普森说。他指出,需要大量的专业学习。教学职业是观察和提供反馈并找出导致结果的原因,它必须朝着教师成为评估员的方向发展,而不仅仅是接收评估数据。

然后,小组成员断言绩效评估应该引导学生进入更深层次的学习和思考,让他们以独特和创造性的方式解决复杂的问题,小组成员播放了一段视频, 展示了数学和科学的绩效评估示例。俄亥俄州多个年级的学生在同伴学习环境中合作解决乘法、体积和物理问题。

为了进一步详细说明这些方法在结构上的样子,SCALE 为教育工作者开发了一个方便的资源库。

但是,由于联邦要求等因素,能够切换开关并使用基于性能的评估的技术现实仍然很复杂。因此,从长远来看,政策变化仍然是必要的。参与这些努力并展示出可靠结果的州越多,这种可能性就越大。

“观察这种情况如何发展将是一个有趣的时刻,”德玛利亚说。