欢迎来到新航道官网!英语高能高分,就上新航道!

咨询热线:0755-82204025

新航道深圳学校 > 托福 > 托福口语 > 托福口语考试机器评分机制

托福口语考试机器评分机制

来源:新航道深圳学校    浏览:    发布日期:2021-07-27 15:20:22

首页

了解托福考试评分标准对于熟悉托福考试很重要,我们能够更清楚托福考核什么,可以通过针对性的练习,提高托福考试成绩,而托福口语考试官方进行评分的时候,是结合人评和机评两种评分方式的结合,那么今天新航道托福培训老师就给各位同学介绍一下托福口语机器评分机制。

2019年8月托福改革除了减少题目数量,缩减了考试时间之外,还有一个重大的改变就是托福口语评分标准部分的评分引入了机器评分,开始实施人工评分和自动化评分结合的评分机制。从官方的报告中可以发现此次自动评分系统使用的是5.0版本的引擎(最早口语自动评分的引擎是2008年的1.0版本),那个时候这个自动评分系统只用于托福考试的官方练习平台TOEFL Practice Online中的口语练习的自动评分,并没有用于正式考试的口语评分;并且根据官方报告,真人评分和机器评分的相关系数已经达到了0.81,也就是说ETS觉得这个自动评分系统已经非常人工智能化了,可以用于真实考试的评分机制中。

从官方的第23页中的表格可以发现,机器评分主要可以评的部分是delivery(表达)和language use(语言使用)总共细分成20个小项,最终20个小项的系数加起来是1。每个小项所占比重不一样也就是权重不一样,系数越高也就表示权重越高,今天挑出几个权重较大的评分小项来分析一下,也指明了在实际口语练习过程中侧重点。

1、20项中权重最大的是第一项---Mean silence duration(平均沉默时长),达到了0.119也就是11.9%,也是20项中唯一一项超过0.1的影响因素,也就是说在托福口语回答中,不正常的停顿是负面影响口语分数最严重的因素,停顿的时间越长,停顿的次数越多,对分数的负面影响越大。

2、20项中权重第二位的一项---Score point with the highest word CVA similarity score(单词的相似性)权重是0.099。这一项指的是你的词汇量越大,在口语回答中能够适当的应用不同的词或者词组来表达同一个意思,那么分数就会越高。

3、20项中权重第三位的一项—Speaking rate in words per second(每秒平均的单词数),影响指数到达了0.097.这里指的其实就是语速,在正常的情况下(强调),你的语速越快,分数就越高;相反,你说的越慢,分数就越低。再次强调并不是单纯的越快越好,你整体的回答必须是在正常范围内,让人听起来比较舒服的语速,让考官easy to follow,而不是像机关枪一样。

4、20项权重位居第四位的一项---Total acoustic model score for all words with model trained on native data,权重是0.081,这里的意思是评判考生的英文是否地道,这里的地道是从音上来判断,即发音/语音语调/节奏,越接近地道的发音,你的分数就越高;

除了以上权重最大的四小项,后面其次分别是:Average of chunk length in seconds–平均意群长度;No repetitions---重复程度;Score point with the highest grammatical similarity score---语法的相似程度;total no different lexical types---词汇的多样性等等。

综上所述是托福口语考试机器评分的几大核心要素的介绍和解析,希望各位同学能更进一步的了解评分细则然后在实际的口语学习中针对性提高口语得分。

联系我们icon

推荐阅读

【本文标签】:托福口语机器评分,托福口语评分标准

【责任编辑】:新航道小编    版权所有:转载请注明出处

  • 关注新航道深圳学校动态

    关注新航道动态

客服热线
0755-82204025
集团客服热线
0755-82204025

罗湖校区:罗湖区深南东路5015号金丰城B座9楼

南山校区:深圳市南山区科技园文化广场2-3楼