多知网11月29日消息,在GES2017未来教育大会上,好未来旗下学而思网校总经理陈宁昱、学霸君创始人兼首席执行官张凯磊、Wyzant联合创始人兼首席执行官Andrew (Drew) Geant围绕“大数据时代下的K12课外辅导市场新模式”主题展开讨论。
以下为部分现场分享内容,经多知网编辑整理
AI出现,改变了教育的哪些方面?
John J-H Kim(嘉宾主持):从孔子的时代开始一直都是老师对学生的培训,但我们现在开始谈论用大数据和人工智能,请问用大数据或者用人工智能和10年前单向的培训有什么不同?
陈宁昱:在好未来的学而思网校,我们利用大数据、AI辅助老师,从关系层面,老师跟学生的关系还是教学和被教学的关系;但原来一个老师教十几个学生可能已经是极限了,现在一个老师可以教成百上千个学生;另外,学生得到的体验以及效果基本上跟以前差不多,甚至比以前更好。
虽然依然是师生互动的过程,但因为有了机器的加入,一个老师的口语课可以同时给几百个学生同时上,但每个学生都会收到它自己个性化的反馈,这样它就提高了老师的效率。
再举个例子。我们一个晚上大概能收到十几万条来自于学生发起的学习问题,其中大概有7000-8000道是竞赛类的题目,竞赛类的题目可能会非常难,普通老师是没有足够的能力去很好的处理。
我们通过后台分发的数据,可以把一道题目是数学还是物理先分清楚,机器算出后,会分发给北师大附中晚上在那讲课的一个老师,它可以很轻易的把这道题目讲明白,我们瞬间可以把这个效率拉高到这样一个程度。
当我们能拉高到这种程度的时候,我们让知识获得变成了普及。所以,它除了效率之外,更大的提升是你愿意付一点点的成本来获得更多的教育资源。
张凯磊:
是的,它变轻松了。
举一个例子,中国有大概1400万中小学老师,其中900万人没有获得过大学本科以上的学历。我们给那些准备授课的初级老师做了一个测验,一张150分的卷子,绝大部分人很难考到90分以上,这就是我们在日常接受教育的实际情况。
但今天我可以让他一个晚上一直在答立体几何类的题目,让他在两个月的时间内见到比它20年教学经验里见到过的还要多的立体几何类的题目,包括学生各种不同的答案,可以在两个月的时间里迅速成为立体几何方面的专家。
所以,大数据它是在让分工变细,是在让人变得更专业、更垂直,所以我认为入门变简单了,但他要成为一个专家变得越来越难了,如果不是非常非常的努力,他很难成为一个顶尖的数学老师。
Andrew(Drew)Geant:
我非常同意你说的,我觉得现在可能入门的要求变低了,但是有更多的细分,而且我们没有办法在每一方面都成为专家。所以我们会减少对某一些领域的要求,希望某些老师能够成为具体某一个学科、或者某一个领域的专家。
那么,大数据也是辅助了我们学习的能力,我们可以了解导师是否满足市场最基本的需求,他们是否能够保持持续学习的能力。
陈宁昱:
未来的教学肯定是分工越来越明确、越来越细。比如说一个老师是一个本科生,但是未来可能他在某一方面就是一个博士。
John J-H Kim:
我们现在讨论的是使用大数据和人工智能来帮助导师提高他们的能力,我们把讨论的范围更细化一些,你觉得这些机器人能在高考中做到什么水平?
张凯磊:
到今天为止,我们看不到强人工智能的突破。我们今年做了一个机器人参加高考,在数学成绩134分,这基本上已经达到了一个顶尖的学生的水平。我们明年会让这个机器人再参加一次高考,它的整个理科分数都可以全线达到考清华北大水平。
但是,我们做机器人、做AI与老师并不矛盾,我们做教育的很清楚,老师是传道、授业、解惑的人,但其实这里面没写还要负责批卷找题目、备课。
我们今天让机器来干这个事情就是希望老师回归到传道、授业、解惑的本职上。所以,机器人的出现,或者说数据的出现,是为了赋能老师,让老师成为超级老师。
陈宁昱:
我认为老师不会轻易被AI替代
因为教育这个行业并不仅仅是说你能解题就行,或者说你能发现错误,这个东西都不是最核心的。孩子为什么有兴趣?很多时候是因为老师的关注,他需要一个真人的关注,而不是一个机器的关注。
所以,其实我也比较赞同这个观点,未来的很长一段时间内,我们可能解决的问题就是用像给医生提供验血结果、CT核磁共振结果的方式来帮助老师,让老师的效率越来越高,但是AI在很长的一段时间内,应该都不能解决这个问题。
短期内,机器人无法替代老师
John J-H Kim:
我觉得其实大家都已经说得非常全面了,比如说AI可以帮助我们来检查作业,我现在已经看到很多这方面的尝试,这还会继续垂直下去。但是谈到长期的以关系为基础的授课模式,或者在对一个学科的精通掌握程度上,这是无法被AI所取代的,机器人很难来替代老师,可能几百年之后会有不同的情况,但是至少现在是不可能的。
在一些辅导学生或者和机器人对话来这一块儿,可能会有一些帮助,这些可能会给我们提供一些帮助,但是我们强调是:以关系为主导的辅导或者授课,AI肯定是无法替代的。
我总结一下刚才三位的观点,我们谈到了使用数据来进一步使项目或者使整个学习过程更加有效一些。我们也谈到了把不同的角色分离出来,比如说鼓励学生更好地学习,在数据使用、传授内容等方面可以进行有效的分工。
我的想法是,其实这是一个开放性的问题,这会进一步增加还是减少好的辅导老师的数量?未来辅导老师这个职业是否会有大量的需求?还是会有更多的不同的分工参与进来?
这是一种未来的趋势,我们是应该更加区分化还是均衡化?
陈宁昱:
我觉得现阶段,老师的数量应该是不够的,即使说老师的效率越来越高,但是在二三线城市,甚至农村,其实我们优秀老师的整体数量是不够的,一个小学老师会同时教好几门课,所以在短期之内,我们肯定是要增加优秀老师的数量。
但是,未来会不会出现因为效率的提升,老师的数量开始减少?我觉得是有可能的,但是是特定的科目。我觉得未来的教学不会只是教语数外或者物理化学这些科目了,未来还会有一些像科学、理财之类学科。那这些学科可能就需要更多的老师,另外包括一些专业的方向,他可能也需要更多的老师。
所以,我觉得如果从单一学科来看,因为效率的提升,老师的数量可能会减少,但是从整体上来看,随着学科的增加,我们的老师数量还会增加。
John J-H Kim:
这个市场是很好的案例,我们的业务正在发展,学生数量也在进一步增长,现在人们都在利用线上资源而不是线下资源进行学习,所以整个教师的数量是减少的。整个教课的范围和规模还会进一步扩大,线上的老师会进一步覆盖更多的群体。
张凯磊:
教育是一个在马斯诺需求理论里面更高一层的需求,伴随经济的增长,教育整体需求是在不断地在往上伸展。
我认为,今天任何一个技术的进步,都会激发更多的教育需求,所以我们不会看老师减少的可能性。在这个过程中,市场越成熟,就会有越多的人加入到教育这个行业。所以我们觉得老师的数量正在增加,这是一个整体在爆发的行业。
John J-H Kim:
我比较好奇的是你怎样知道应该挑选什么样的数据,并且知道会有什么样的作用呢?我们都知道这个行业充满了各种各样的数据,但是获取有效信息的方法和渠道是非常匮乏的。这就是说,我们有很多的数据,但是很难了解哪个数据能够有得到有效的应用。
陈宁昱:
我原来是在互联网行业和广告行业工作,发现人工智能跟大数据在不同行业里,使用起来是有非常大的差别的,在教育行业,虽然我们也有大量的数据,但是我们根互联网行业最大的不同就是优化目标不是那么明确,什么叫优化目标不那么明确呢?
比如说,在互联网行业我们优化点击率,但是在教育行业,我们优化的是孩子的学习能力,可能是他的学习能力是否提升,是特别难评估的,我们能拿到有效的数据,比如孩子做了多少道题,对了多少题、错了多少题,他花了多少时间。但是它到底是进步了还是退步了,他到底是不是实际上掌握了这个能力呢?我们是很难掌握的。
所以整个教育行业,确实是像刚才Kim所说的那样,数据很多,但是抓取的有效信息很少。我们不能判断学生两次考试成绩不一样是因为考试题目的变化,还是说他现在状态的变化导致的,还是它真正学会了,所以我们只能从短期来确定这一个知识点他是不是彻底学会了。
张凯磊:
我来说一下我们做的几件事。第一个,在中学的理科方面,所以我们把手写识别做好了,再结合我们自己特质的硬件,可以有能力采集学生的所有书写轨迹。每秒钟采集120次,并且可以把它给全部复原回来。
整个教育行业现在还处在传统医学的阶段,还没有进入到现代医学。现代医学在发现了细胞,以及开始有了验血、核磁共振等一系列技术之后,才突飞猛进到今天的。我们今天先把一个技术先给做好,就是说我能复原学生的笔记,我能复原它做的这个题目,并且我能把它翻译为机器能理解的语言的时候,我们复原了主要场景。
但是我们现在还有很多进步的空间,比如说我们可以将考65分的孩子分为两类,虽然我们能明确知道他们是不一样的,并且告诉你不一样的点在哪,比如这一个孩子他考65分是因为耐力不够,他一个小时之后就开始出现大量的错误,不管什么题都错;另一个孩子考65分,是因为他阅读能力有问题,语言复杂一些他就会容易丢分;我知道这些不同,但是我不知道造成这些不同的原因。
我们有很多数据,但是信息不够,我们把这数据反推回给人,老师可以弄明白这件事情,大数据弄不明白,说明它的训练依然不够。
所以,这就是我印证了我刚才所说的,到今天为止,机器不能代替人,我们不知道孩子是从哪一刻开始,这个能力丢失了或者没有被培养起来,但是老师知道了这些信息之后是能够去改变学生的,这就是为什么说我们今天干的本质上就是CT及核磁共振,我们给医生、老师一个很好的报告。
数据的获取与使用,如何把握?
John J-H Kim:
那你觉得这个数据应该如何收集使用?我们从6年前就开始专注于数据的收集,在有了很多数据之后,我们开始思考哪些是可以进一步优化的,哪些数据可以直接使用。我们最近出了一个机器人,它可以让人们追溯之前所做的笔记,看一下哪个环节出现问题,这其中其实是包含很多数据的。
我们可以通过利用数据来进一步优化,并且提供更好的建议,能够帮助学生实现更好的、更有效的学习。其实你每一次点击网页,产生的信息都可以被我们抓取,现在有很多公司都在捕捉这些数据里合适的信息,它的潜力是无穷的,我们可以更好地使用这一块儿的数据。
我们把这个数据还原到非常有用的信息需要有一个闭环,这些收集的数据,是要应用到教学中,教学也是需要能够改变学生的成绩,这些也是需要能够收到学生的反馈。
我做一个论述,看看大家同不同意?你们觉得公司是不是能够用大数据和人工智能在收集这些数据以后,使用这些数据来教学?再用这些教学来收集更多的数据,这些公司会成功吗?但是这样对有些学校会不会不容易做到?
因为有的学校只能是在早上和晚上收集,它们没有办法收集在家里的数据,那么像在座各位的公司,你们都有学术的数据,也有行为的数据,你们同意我这种说法吗?或者你们觉得这个还是一个开放性的话题吗?
陈宁昱:
你是说,有的公司可以收集到学习的数据,然后再反馈到教学,然后再收集到更多的数据,形成这样一个闭环?
John J-H Kim:
对,收集这个行为数据,以及收集学校内和学校外的数据。
陈宁昱:
目前相对来说是比较难的,我觉得这个产业其实是分成好几块的,比如说像学而思网校,我们主要负责课外辅导,包括线下班的辅导,但课内的学习,包括作业,比如说像学霸君,它可能会有一项搜题,包括像作业盒子,一起作业这种公司,它可能会进另外一个产业,比如说进公立校,包括学霸君现在也在进公立校,我认为目前在整个学生教学数据的收集上,不同的公司如果联合起来,它可能形成了一个闭环,但是目前为止,我觉得我们倒没有任何一个企业单独能形成一个完整的闭环。
John J-H Kim:
我想在AI和大数据只会有少数的赢家,只有少数的公司能够收集足够的数据来使用这些数据。所以,我们需要有足够的需求,你同意这一点吗?
你觉得在以后几年,如果我们搜索越多,就越能够获得成功,你觉得在未来会发生吗?
陈宁昱:
其实,教育跟search还是有一个非常大的区别,教育看起来是一个市场,比如说我们认为教育是一个万亿的市场,但其实教育还是要细分的。
我们认为语文、数学、英语都是细分的,未来很有可能,包括成人教育、各种各样的学科都其实是一个细分的领域,如果我们仔细去研究,它可能不是一个通用的领域。如果这个数据在某一个特定的领域形成足够多的密度或浓度,它可能自己就能产生一个非常大的价值,当然它可能需要在单个领域产生巨大的数据量,这个数据量也是越大越好,应该是有价值、有标注、有目的性的数据,这种数据越多,肯定会越好。
张凯磊:
我们现在看到的情况就是,你问我会不会出现最后大家上的是同一个培训班的?我会说永远不会发生。但你问我说,有没有可能最后你的所有的数据被少数几个公司真正掌握,我会说完全有可能。
这是一个巨大的分发性的行业,所有的从业者都在使劲,或者有意无意地在做一件事情,就是尽量地使教学数据结构化,在过去的5年里面,有一堆人已经被落下了,剩下了一些人还在继续努力。
所以再过5年,教学数据的结构化可能会被少数的公司真正地所掌握。