多知4月16日消息,据《得克萨斯论坛报》(The Texas Tribune)消息,近日,参加美国得克萨斯州STAAR考试(State of Texas Assessment of Academic Readiness,得克萨斯州学术准备评估测试)的学生将迎来新的阅卷方式:学生在当地标准化考试中的书面答案将由AI评分系统自动评分,该评分系统将取代该地区大多数人类评分员。
据介绍,得克萨斯州教育局 (TEA) 正推出一种使用自然语言处理的“自动评分系统”,用于回答得克萨斯州学术准备评估中阅读、写作、科学和社会研究的开放式问题。
据了解,得克萨斯州教育局今年计划雇佣2000名评分员,而2023年所需人数为6000名。由于减少对评分员的需求,官方预计该系统每年可节省1500万至2000万美元。
这一变化始于2023年改版的STAAR考试。STAAR考试衡量的是当地三至八年级学生对核心课程的理解,在重新设计后,该考试减少了多项选择题的数量,增加了更多的开放式问题。
得克萨斯州教育局学生评估主任Jose Rios表示:“我们希望保留尽可能多的开放式问题,不过,这类问题往往需要花费大量时间才能评分。”
根据TEA官网上的信息显示,新的评分系统是使用 3000 份考试答案进行训练的,这些答案已经接受了两轮人工评分。
此外,还有一些稳妥措施已经实施。例如,AI评分结果的四分之一将由人类评分员重新评分,会令AI评分系统混淆的答案也会由人类重新评分。