像往常一样,NAPLAN今年引起了很多争议。该测试已经进行了10年,新南威尔士州政府呼吁废除该测试,在一份报告发现测试结果在10年内没有任何变化后,有人呼吁进行审查。6月,一项关于NAPLAN信息使用的审查终于下达了命令。
最近的争议——推迟发布NAPLAN的结果——部分是关于纸质和在线测试的分数是否可以进行统计比较。
今年收集到的数据将是可比较的,无论是纸质测试还是在线测试,以及与往年的测试,因为它们将在一个共同的尺度上进行比较。
今年原定于8月8日发布的NAPLAN数据的初步发布被推迟了。我们还不知道它什么时候会发布。
美国教育部负责人质疑,这两种考试的差异是否太大,无法进行统计上的比较。维多利亚州教育部长James Merlino批评了澳大利亚课程、评估和报告管理局(ACARA)对在线考试的管理。
当我们考虑可比性时,理解它的不同含义是很重要的。在测量的意义上(与NAPLAN一起使用的方法),它意味着我们在一个“普通数学量表”上比较学生的成绩。这并不意味着它们是“相同的”。也就是说,在线考试不同于纸笔模式。但这两种形式都证明了学生在计算和读写方面的知识和能力。
这种相似性经常发生。例如,如果你想比较澳元和人民币,你可以把它们放在一个共同的尺度上(1澳元=5元)。然后你可以用“金额”来比较它们,但是它们是不一样的。
同样,当我们构建澳大利亚高等教育录取排名(ATAR)时,我们转换不同科目的分数,使它们在一个共同的量表上具有可比性,然后将分数相加,然后计算一个鞑靼人。这使得比较他们的综合高等学校证书(HSC)的综合能力成为可能。主题不是 相同,但它们是 类似的在一个共同的尺度上。
同样的,当NAPLAN测试以纸笔形式和在线方式完成时,分数也可以进行比较。当我们从纸笔NAPLAN测试转移到网络NAPLAN测试时,对比不同年份的结果是非常相似的。
在这种情况下,ACARA进行了重要的研究,以检查如何执行测试对结果的影响。这表明,就NAPLAN的宗旨而言,几乎没有(如果有的话)重大影响。
NAPLAN并不是唯一一个从纸笔测试转向在线测试的项目。国际学生评估项目(PISA)和许多其他高风险的国际评估项目最近都搬到了网上。经合组织网站明确指出:
在2015年国际学生评估项目(PISA)的计算机和纸上测试之间,以及在2015年国际学生评估项目和之前的纸上测试之间,学生的表现是相当的。
毫无疑问,关于NAPLAN可比性的争论是小题大做。学生们都会尝试高质量的NAPLAN测试,并尽自己最大的努力。结果将会给他们一个指示,告诉他们在这个场合会如何进行。
当结果出来的时候,我有根据的猜测是,老师们会发现他们的学生的表现和预期的差不多,这是基于老师们通过课堂评估获得的关于学生成绩的所有其他信息。NAPLAN从另一个角度提供了更多的证据,有助于塑造学生的整体形象。
支持这一争议的真正问题是NAPLAN数据的滥用。从来没有打算使用NAPLAN数据对学生进行细粒度比较。
MySchool网站助长了NAPLAN数据的滥用。例如,来自网站的分数被用来进行比较,而不考虑在进行比较时需要考虑的“误差带”。人们将一定程度的精确性归因于测试开发时从未打算过的结果。测试从来没有被设计成高风险的,结果也不应该被如此使用。
当人们质疑NAPLAN测试的“有效性”时,他们应该质疑结果使用的有效性。NAPLAN具有较高的有效性,但我们需要更好地理解它,并以更明智和更合理的方式使用结果。正确使用NAPLAN数据是一个主要问题,需要优先处理。