“AI在教育行业解决的是信息传递的效率。”

新东方拥抱AI:大学事业部如何应用大模型?

2024-04-23 19:33:01发布     来源:多知    作者:徐晶晶  

  来源|多知

  作者|徐晶晶

  编者按:

  自去年以来,在AIGC浪潮中,大模型如何赋能、落地教育场景,是新东方内部不断思考的问题。

  近日,在阿里云AI智领者峰会·杭州站上,新东方大学事业部P端产品负责人张辰分享了大模型落地新东方教育场景的最新探索。

  据了解,在新东方,通义大模型已正式“上岗”,在学生体验、教师教学质量、教研内容研发等场景下,学员满意度整体提升了3%。“以往,我们需要投入大量的人力物力才能将学员满意度提升1%-2%,现在基于大模型几乎可以零成本做到这件事情。”张辰表示。

  以下为张辰分享原文(经多知编辑,有删减):

  大家好!感谢阿里云的邀请,今天有机会探讨一下AI与教育的结合。

  在整个人类历史科学浪潮中,AI可能是一小部分,整个人类科学发展是什么样?一般来说是一条直线,一般是先有基础科学,进而衍生到应用科学,再往后是技术的演进,最后产品化,找一个贴近实际应用的场景落地。

  在能力侧,AI具备理解、生成、推理三大能力。

  在场景侧,每个企业在应用大模型之前需要先考虑究竟有哪些场景、能否量化某个目标,让AI融入整个生产过程中。当人效提升、决策成功率提升后,总成本一定是降低的。

  那么,具体到教育行业的场景,首先需要考虑的是学生体验、教师的教学质量、教研内容的研发效率和成本。

  关于学生体验。很多人认为用户体验不过是一些交互的直观感受,或者是用户完成某个动作的操作步骤和效率。但是对于我们而言,当学生来新东方购买了一份课程,他的诉求是非常明确的——希望在这里学到知识。这期间,会有很多老师、学管、客服与其不断沟通,他们之间的沟通质量和沟通效率是新东方非常关注的。在这波AIGC浪潮出现之前,我们当然也关注沟通质量和效率,但那时我们只能做到其中一部分,比如通过用户主动打分来判断NPS(Net Promoter Score,净推荐值)。这个动作其实后置了一些。

  一旦出现服务质量问题,我们以前要么是与客户高频反复沟通以拿回更多的数据,判断用户的满意度和行为,要么就是通过全程跟踪,投入大量的人力物力分析每一次沟通的内容,判断用户的行为,不过这显然不现实,我们是做不到宽度和广度同时具备的。

  但是有了AIGC,事情就有了明显的不同。下图橙色的部分是借助AI完成全过程跟踪的方式。

  

  具体怎么做?大语言模型会把我们所有的行为、思考过程都集成到文本上——学习过程中的电话沟通、线上的文字沟通,都可以转化成文本,这些文本和原有的原生文本一起被喂给大模型,根据这些内容以及根据对一些行业的理解,我们会对每一次沟通做提示词管理,判断每一次沟通的好坏:我们会判断学生、服务人员或者老师的情绪如何,最后判断某件事情是否得到有效解决。当我们拿到这套东西(不管是分数、排名,还是最后的主观文字结果)之后,才有办法推进不同的部门、不同的方向进行过程上的改进。

  自去年年末开始做这件事情以来,我们的整体学员满意度提高了3%。乍一看,大家可能觉得3%这个数字并不多,但是,前提是,之前我们的学员满意度已经非常高了。以往,我们需要投入大量的人力物力才能将学员满意度提升1%-2%,现在基于大模型几乎可以零成本做到这件事情。

  我们还在尝试将这些沟通的内容沉淀下来,帮助内部每个人去学习、改善自己的服务方式。当然钉钉会提供一套比较成熟的现有能力,会有一套通用化的、SaaS化的能力,我们也希望在这个过程中把一些文档的主旨,包括学员沟通的数据、过程中的东西沉淀下来,提升整个团队对外输出的文字质量。

  不过,我们仍在探索过程中,还没有大面积试用和落地,所以这只是一个举例。

  说完体验部分,再来说说教学部分。

  怎么理解这件事?首先,我们的每门课程包括视频课程、音频课程、教案讲义或者试题,这些表象下有大量的知识点沉淀在底层。借助AI的能力,可以在既有的知识点上逐渐分析现有的课程、拆解到每个知识点。

  学员在听课的过程中,如果在某一个环节没有跟上老师的互动,这个环节所涉及到的知识点是薄弱的,那么在课后的测试、阶段性考试或者是课后作业数据,我们也能拿到,也知道他在某些方面有薄弱的地方。在这两者之间出现了一个机会点,是不是可以做到千人千面?因为一个学生上课的时候开小差了,考试的时候没考好,但是老师并不会为你做定制化的改善计划,现在有了AI可能就能做这件事情,我们也尝试做了一个专项。

  具体的方法和刚才很类似,将现有的课程音视频、文本和现有的试题(格式化文本),包括用户在过程中的数据,我们会组合起来组合成一套标准的prompt,喂给大模型,它给出学员和课程或者知识点之间的匹配关系。甚至我们当时多想了一步,会不会有一种情况是我们的课程体系仍然存在不完善的地方,可能仍然无法满足一些知识点的缺口,大模型可以快速地帮我们发现,进而推动教研、教辅,把类似的素材重新补完。

  我们和通义有一个具体的合作。我们在整个过程中会分章节,通过通义听悟的分析和能力根据章节把每个节点自动打点,打点完之后把打点范围之内的文本内容做沉淀、总结。刚才提到学生效率的问题,以前一节课可能得40-50分钟,要把整个课程听完,这对于学生的要求门槛非常高。我们帮学生做了分段、知识点的总结、课程内容的梳理之后,其实对学生来说,学习知识这件事情的门槛降低了非常多。学生通过这套工具可以快速地学习到一节课程传达的主旨或者知识点,这是学生体验上比较领先的尝试。

  在多模态上,前两天京东刘强东发布了自己的数字人来直播卖货。数字人方面,我们也在做一些尝试。不过这其中要耗费的成本还是非常高的,而且目前来看,作为教学场景效果可能没有那么好,还是在边走边看,期待整个技术上有飞跃性的演进,我们才可能实际做一些应用。

  说到最后,我们怎么来看待教育和AI的结合?我们真正能做到千人千面,目前我的角度来看,整个传统教学教培行业发展到现在有二三十年了,随着AI技术的发展,传统的教学教培行业可能面临一次非常大的变革,AI解决的是效率问题,AI在教育行业解决的是信息传递的效率。当信息传递的效率到达一个临界值的时候,作为教学资源的普及率可能就会面临大幅的提升,以及我们在信息传递的过程中,在各个场景下,每一个教学效率上可能都会面临着大幅提升,这是我们即将面临的变革。我们大学业务部门也算是整个新东方最先介入,照这个行业里做尝试的方向。

  以上就是我的分享,希望对大家有所帮助。

  END

  本文作者:徐晶晶