来源|多知
作者|王上
作为出国留学的英语能力测试项目,多邻国英语测试( Duolingo English Test,简称“DET”) 是一个独特的存在。
在以往,中国学生去英语国家留学需要提供托福(TOEFL)或雅思(IELTS)等英语水平考试成绩,这两项考试都是线下考试,考试时长超过2个小时。而多邻国英语测试成为了一项新选择,它可以在家考试,且是全球首个在线自适应的英语测试,考试时长1小时左右。
最近,多知对话了多邻国的首席商务官Bob Meese、多邻国英语测试全球考生业务负责人王妍,他们讲述了多邻国英语测试的运作机制,并介绍了多邻国App的一些最新进展。
根据介绍,多邻国英语测试于2016年推出,2020年进入中国。在线下考试已经恢复的情况下,多邻国英语测试的高校认可度依旧保持增长,截至目前全球已经有超过5000高校的认可多邻国英语测试;同时,考生量也在持续提升,中国是多邻国英语测试前两大市场。
Bob Meese和王妍向多知介绍,多邻国更广泛地采用了“human-in-the-loop(人机回环)”的开发方式,AI模型在多邻国英语测试内容和课程内容生成等更多环节中与人力结合,极大地提高了生产效率。
在Bob Meese看来:“由于科学性、便利性和高性价比等特点,多邻国英语测试成为留学考试行业的变革者。”
01
“首次将线下英语测试考试场景转移到线上”
和多邻国App一样,推出多邻国英语测试同样的思路同样是用技术推动教育普惠。
联合创始人、CEO路易斯·冯·安(Luis von Ahn)曾多次介绍自己的求学经历,他在中美洲国家危地马拉长大,当初他在申请美国大学时发现危地马拉已经没有英语测试考试的名额,他只能花费1000美元前往邻国萨尔瓦多参加英语测试,过程非常复杂,因此他想创建一个测试,以便让英语测试变得方便和普惠。
王妍提到:“生活已经高度的电子化、线上化了,教育领域的诸多场景也是如此,而考试可能是唯一一个还没有被从线下转到线上的使用场景。”
2016年,多邻国推出多邻国英语测试,这是全球首个在线英语测试,随时随地都能考。
一名学生对着电脑填写单词组中缺失的字母,听并选择他认为正确的单词,然后对着镜头描述所看到的视频场景……这是一名考生在家进行的一场多邻国英语测试考试。
多邻国英语测试和线下考试完全不同,线下考试一般都是去指定考点,每次考两三个小时,花费超过270美元(约合2000元),完全出分需要4-10天,甚至更长时间;多邻国英语测试则是在家即可考,只要能上网,世界上任何地方的任何人都可以参加,只需65美元(约合450+人民币),且仅需1小时考试,48小时内可以出分,每个月可以进行有效认证两次。
除了考试本身时间和地点不受限,多邻国英语测试考试形式本身的独特之处在于计算机化和自适应模式,它在出题和评估方面均运用了AI技术,能够灵活适配考生的需求。
而多邻国英语测试能推出背后离不开多邻国App的影响力,它于2012年推出,以游戏化的学习方式而被人所熟知。到目前,多邻国App覆盖40多种语言,在全球的下载量已超过5亿次,截至目前,月活跃用户 (MAU) 为 8840 万。
02
如何通过AI迭代自适应考试?
多邻国英语测试考试是自适应的,比如一个考生在前面的回答中正确率很高,那么问题就会变得更难。同时,不同题型的出现频率不一,针对每场测试和每位参试者,每种题型的数量并不固定,因此每场测试的体验都是独一无二的。
这背后是AI技术的运用。
在传统考试中只是一份试卷,每一份试卷的题型是固定的。多邻国2021年与OpenAI合作,开始在多邻国英语测试中运用了生成式AI技术,AI可以帮助生成大规模的题目。目前,多邻国题库里大概有超过1万道题,且这些题目是不断实时更新的。
Bob Meese向多知解释:“多邻国英语测试是最早在测试中使用生成式人工智能的公司,我们使用AI技术帮助我们生成新的测试题目,我们有一个非常庞大的题库,我们能够保持它们的新鲜度。题目越多,测试就越安全。传统测试的题目要少得多,因为它们是由人类自己动手产出的,我们则是利用生成式AI技术来生成更多的测试题目。”
Bob Meese坦言,实际上最初,多邻国第一次尝试用生成式AI出题时也有担忧,AI能否创造出高质量和可靠的测试题目呢?
针对这个疑虑,多邻国进行了一次试验,将人工智能测试与以人为中心的测试进行了对比,事实证明可行,但也不能完全交给人工智能。多邻国后来尝试扩大规模,用AI生成新的题目,以提高效率和成本效益,但之后也会使用人力对其进行审查,即“human-in-the-loop”(人机回环)工作模式。
可以说,在多邻国英语测试内部,已经有非常成熟且高效的生产线。
对于题目的生产流程,王妍向多知介绍:“整体来说会有几个节点,第一是多邻国的语言专家需要针想要测评的能力进行初级定义,比如从A1到C2,想要考什么样的场景,题型长什么样,涉及的一些词汇、语法的概念有哪些等等,专家设计好之后,放在模型里面,模型一分钟之内可以生成几百条符合题目形态的样体。
第二,会经过多轮的人工复核,复查各方面的因素。比如从教学角度来讲是否严谨,还有从公平性以及道德的角度来核查,比如是否涉及到一些比较敏感的话题等等。
第三,针对任何的题型,多邻国都会在练习题库里进行用户灰度测试。如果发现某些题型的用户的行为可能跟其他题型不一样,会进行复核。经过多轮内测之后,团队才会最终把题目放在正式考试里,并且不断监测新题型在考试中的表现。
整个过程都是可视化的。在这种流程之下,多邻国英语测试的更新频率很快,且每年进行升级,以进一步提升测试效率, 更精准地评估考生的英语水平。比如,今年4月2日起,多邻国英语测试正式引入两项新题型“互动写作题”和“填空题”,同时,“阅读选择题题型变更”。
Bob Meese向多知解释,我们是一家科技公司,我们希望不断优化多邻国英语测试。因此,我们每年都有一次更新。每年招生季结束后,我们会推出新版本的多邻国英语测试。而在推出新版测试之后,我们就要开始思考下一次要更新哪些内容了,以保证测试是准确、可靠和可行的。
王妍补充:“多邻国英语测试每个月甚至每周都会有新的题型悄悄地上线,也会有一些旧的、然后使用频率较多、曝光率比较高的题型悄悄地下线。一些过往下线的题型,我们会放到练习题库里,免费让学生进行模考以及练习。因为我们有很多整体的数据,对一个题型的平均表现是有一定的预估的。如果某个题型的表现非常反常,我们也会抽出来重新进行调查。整体来讲我们对新引入的题目会有非常缜密的跟踪,也会用一些早期的数据去验证,确保新引进的题目是能够达到整个考试的水平要求的。”
王妍总结,整体来说,多邻国英语测试是基于CEFR,从A1到C2,在不同的等级上,多邻国英语测试都有相匹配的题目,在不同的题型里面设有不同难度等级的题目。
03
坚持“中国优先”策略,采取本土化方案
中国无疑是重要的留学生源国。根据教育部统计数据,我国出国留学人数从2020年的45.09万人回升到2022年的66.12万人。经过2023年的急速反弹,2024年出国留学呈现出常态化的趋势。多邻国提到,中国是多邻国英语测试的前两大市场 。
多邻国英语测试如何拓展中国市场?
多邻国此前提出了“中国优先”策略,并采取了本土化的方案,推出了"卓越教师千人培训计划",即在城市巡回,去邀请当地的高校以及中介、培训机构等,与教师们面对面交流,介绍多邻国英语测试。
以去年为例,2023年5月至10月,“卓越教师千人培训计划”共完成10场线下教师培训覆盖上海、武汉、广州、杭州、西安、成都、北京七个城市;与此同时,线上教师培训也同步开展,2023年共完成18场线上教师培训,提供了包括题型、英语能力、评分标准等在内的9个话题的讲解。
王妍向多知透露,截至目前,“卓越教师千人培训计划”已经培训了超过6000+老师。
王妍提到:“我们发现在国内整个英语学习的体系非常成熟,而且老师的角色非常重要,而老师也是一直都被忽略。在之前,很多竞品他们做教师培训是收费的,但是很多学校是没有这个经费的,所以我们觉得作为新产品,我们非常愿意去承担市场开发的责任,迈出第一步,所以我们会想办法让更多人了解我们。”
多邻国英语测试于2020年进入中国,彼时受疫情影响,只能在线考试。实际上,中国本身即是在线化比较高的国家,此外年轻人也乐于接受新模式。
越来越多的中国考生使用多邻国英语测试测试,这背后在于更多的高校认可多邻国英语测试考试,这些院校在多邻国英语测试官网可查。
王妍说:“多邻国英语测试无论是产品体验、考试的方便性和便捷性以及价格优势等,都跟传统考试不同。当然考生选择多邻国英语测试的前提肯定是世界上的大学尤其是知名学府,愿意承认多邻国英语测试的成绩。而在这个方向上,我们做了非常多的努力。”
对于如何获得院校的认可,Bob Meese提到:“刚开始的时候,没有人接受它,但我们坚持不懈地争取大学签约,而后创造了滚雪球般的效应,越多的高校认可我们。”
在疫情期间多邻国英语测试有爆发式的增长,而今,多邻国英语测试依然在增长。Bob Meese向多知解释:“在疫情期间,多邻国英语测试发展得非常迅速,全球认可院校持续增加,从2019年的890所到2020年攀升至3000所,并持续稳步增加,到现今的5000+院校。当然,这并不是一个可持续的增长速度,因为疫情那一年每个人都得知了多邻国英语测试。但我们的整体增长势头不减,我们确实扩大了多邻国英语测试业务的整体规模,而且在那之后的每一年,它都在以非常可观的速度增长。
”
据联合国教科文组织UNESCO数据,中国学生前五大留学目的地分别为美国、英国、澳大利亚、加拿大、韩国,占比分别为28.92%、14.27%、9.15%、7.81%、5.81%。
可以说,中国留学生大部分会选择英语环境的国家,而多邻国英语测试作为英语测试,也争取在全球英语环境的院校签约。
目前,认可多邻国英语测试的院校大部分来自美国。“从全球来看,每个国家的情况都有所不同,目前,我们在美国的接受度最高,虽然还没有达到100%,但已经非常接近了。而我们现在不仅关注美国,还关注英国、加拿大、澳大利亚、新西兰等地方。”Bob Meese告诉多知。
04
“希望多邻国App和多邻国英语测试联系更为紧密”
随着多邻国App的快速增长,越来越多的人也了解到多邻国英语测试,可以说,练习与考试正形成闭环。而多邻国也希望用户能将两个产品能联系得更为紧密。
从多邻国财报可以看到,这家公司有四大营收来源:App订阅、广告、多邻国英语测试、应用内购买,其中订阅是营收支柱,近两年,多邻国英语测试增长逼近广告业务。
根据2023年第四季度财报,多邻国营收为1.51亿美元,同比增长45%;其中,App订阅为1.17亿美元,同比增长50%;多邻国英语测试为1081.9万美元,同比增长29%。从2023全年来看,多邻国2023年全年5.31亿美元,同比增长44%;其中,App订阅4.05亿元,同比增长48%;多邻国英语测试全年营收为4121.2万美元,同比增长26%。
可以看到,虽然多邻国英语测试的体量虽然相对小,但是和多邻国App订阅一样在持续增长。
现在,多邻国也希望用户通过在多邻国App学习,从而选择多邻国英语测试。Bob Meese说:“我们希望将多邻国英语测试与多邻国语言学习App日益紧密地联系在一起。我们一直在优化多邻国App,尤其是在应用程序中提高英语教学体验,增加更多的中级课程。这样,人们就可以使用多邻国App进行学习,然后参加多邻国英语测试的考试。因此,我们认为如果我们能够做到这一点,那么我们就可以提高国际知名度,我们可以让更多的人使用多邻国App来学习英语,并用多邻国英语测试的分数来谈论熟练程度。”
而今,多邻国英语测试也正借助大多邻国的技术和产品的经验进一步优化产品,Bob Meese说:“在过去的 10 多年里,我们打造了多邻国APP这样一款让人们感觉有趣且引人入胜的产品,也因此而闻名。我们现在拥有的很多技术和设计都是从语言学习 APP 中积累起来的。多邻国英语测试是一项非常现代化的英语测试,我们相信与传统风格的测试相比,很多学生更喜欢多邻国英语测试。”
值得注意的是,雅思和托福等传统留学语言测试和多邻国英语测试瞄准的是不同的人群,且雅思和托福也在变革。多邻国英语测试的挑战并不小,未来的竞争也会愈发激烈。
一位留学行业资深从业者告诉多知,“留学语言考试已进入买方市场,学生的选择越来越多。因此,留学语言考试正变得越来越‘友好’,比如,十年前托福考试一位难求,而现在考试几乎随时可以报名,很多都是机考,出分更快,雅思考试甚至允许单项测试。”
不过,能否留学成功,并非只有“语言成绩”一项指标。近年来,海外大学越来越考查学生的学习能力。
对于多邻国英语测试未来的发展,Bob Meese告诉多知:“就像很多行业都经历了线上化的过程,比如银行、打车、外卖业务等等,考试行业也一样。我们认为未来趋势是数字化主导的。我们开发多邻国英语测试的初心是希望打破教育障碍,为考生提供更为经济、高效、以及更令人愉快的测试产品。”
END
本文作者:王上