来源|多知网
作者|宋嘉伟
整理|冯玮
摄|张蔚斐
以ChatGPT为代表的技术落地讨论依旧火热。
“只需要加一个Let’s think step by step,它就可以自己做推理:这是一个特别有趣的现象”——笔神作文创始人宋嘉伟在多知网第39期Open Talk现场解读,ChatGPT不仅能流畅地开展多轮对话,也正在越来越多的领域展示出解决多种通用问题的能力:。
笔神作文,全面接入AI能力的作文软件,主要通过AI批改,AI辅导,AI动画内容提供更丰富,更高效的作文学习方式。创始人宋嘉伟曾任索尼高级系统架构师、奇点机智CTO。
无论是此前的技术背景,还是几年间以AI技术与作文教育相融合的经验,都让宋嘉伟对ChatGPT与教育场景的融合有更为独特的视角。
宋嘉伟判断当下正处于革命性的爆发节点上:“它开始真正具备了思维的能力、推理的能力、演绎的能力,还有归纳总结的能力。”
在教育场景的可能性上,宋嘉伟分享了GPT4发布时的一个案例——通过苏格拉底的方式教学,将永远不会给学生答案,只在过程中通过提问让学生自己找到答案:“这可以帮孩子们真正去思考问题该如何解决。”
以下为宋嘉伟的分享原文,多知网编辑整理。
大家好,我是笔神作文的宋嘉伟,给大家分享一些这段时间的思考。
现在这个时刻是一个正产生着巨大变革的时刻,可能今天我讲的都是错的,大家有任何疑问可以随时打断,我们随时交流。
先介绍一下笔神作文,可能很多人对我们不是很熟悉,我们是一个用AI来解决作文学习的APP,一共有过四轮投资,我们的APP拿到了大部分应用商店的奖项,比如华为的匠心奖,小米的金米奖等,家长和孩子也都对我们的产品很认可,这也是我们继续在AI+作文学习这条道路上探索的动力来源。
我们长期一直在做作文的AI批改服务,这是我们APP上最受欢迎的功能,同时我们还是一些比较知名的学习平板内置的AI批改服务To B的提供商。
我今天想分享的是这几点:
1、有了AI,孩子要不要学作文?
2、ChatGPT所解锁的新能力。
3、AI会带来作文学习领域的哪些改变?
4、教育还可能会发生的变化?
01
有了AI,孩子还要不要学作文?
AI现在写文章的能力已经很强了,我自己作为一个曾经写过一本书的人,会发现它写得比我好。那么如果它写作能力这么强的情况下,我们还要不要学写作文?
(笔神作文创始人 宋嘉伟)
举个例子,有计算器的时候,孩子要不要学数学?大家应该都有自己的答案了,因为这是每个人的必备技能,所以必须学,还因为考试要考,所以还要学;有了打印机,我们要不要练字?我以前一直觉得练字是完全没有用的技能,因为出了学校以后,除了签名,我们可能都不会再写字了。但现在却还是发现练字的课卖得很好,这也是因为考试的时候,高考的时候卷面分还是很重要的分数,所以家长还是会愿意让孩子有能力写出一手漂亮的汉字。
有了AI,孩子肯定还是需要写作文的,因为不管从个人能力培养来说,还是从考试分数来说,肯定不能放弃掉,所以这个问题的答案非常简单。
02
ChatGPT所解锁的新能力
CoT(chain-of-thought 思维链)我估计大家已经听说过很多次,那为什么ChatGPT这次这么火?它到底做了什么事情?解锁了哪些能力?
CoT的Paper是谷歌去年发的,大家都以为是OpenAI做了很多事情,其实不管是最底层的transformer 的Paper还是CoT的Paper其实都是谷歌发的。
CoT是什么意思?左边是一个标准的Prompt:说了一大堆东西,问ChatGPT,它的答案错了,就其实是一道简单的算术题,但它会回答错了。
右边换一种方式,把思考过程也作为Prompt放进去就回答对了,它会把思考的过程也写出来。也就是说最开始如果把一个过程、一个例子告诉ChatGPT,它其实能推理出来。
后来又发现只需要加一个Let’s think step by step,它就可以自己做推理——这是一个特别有趣的现象。AI需要你告诉它一步一步来思考,它就可以一步一步告诉答案。
在这个过程中,我们会发现这次不一样,为什么说这一次是一个革命性的爆发点?它开始真正具备了思维的能力、推理的能力、演绎的能力。
另外一个方式是归纳总结的能力。
我问它,如果孔子在世,它怎么看特朗普?
这个问题很复杂,它需要提取很多知识:首先需要知道孔子是谁,要提取孔子所有的观点;再知道特朗普是谁,提取特朗普所有的观点;这两个观点之间进行比较,比较出他才能知道孔子怎么评价特朗普的,但是我们发现它真的可以说的还是头头是道。
我可能自己去做需要花一天时间总结也不一定总结的比它好,它的归纳理解能力也很强,思维所能有的两个能力它都已经具备了,甚至已经超过我们人类。
这是GPT4发布的时候它的技术文档的图,大家如果关注的话应该都看过。
有一个观念深入人心,AI在围棋方面肯定超过人,没有人会质疑,以后AI会在所有教育学习的领域,它们能超过所有老师,这只是时间问题。
听说现在让AI在读arxiv上所有的Paper,如果AI把所有的Paper读完,可以想象它不出意外超过所有人、超过所有的教师、而且是全科的教师。
这也是在GPT4发布的时候,官方举的一个可汗学院所应用GPT4的例子,左边是原文,右边是GPT4自己翻译的。
原文里面提到“未来几年在平台构建更多类似导师功能”,所以可汗学院在做的一个尝试,就是用AI来做导师,这个功能叫khanmigo,已经是可以试用的。大家只需要捐20美金,就可以加入申请试用的waitinglist了。
这也是GPT4发布时候给的一个例子,用苏格拉底的方式教学,通过sys的promote来设定“永远不要给学生答案,只是出恰当的问题,引导学生自己找到答案“。
这种方式是可以帮孩子真正弄懂每一个问题,真正理解每一道题最后怎么解出来的。因为“我从不给他答案,只是告诉他,你可以这样思考,思考过程是你自己来做的”。
GPT4其实已经具备了这个能力,它用这种方式来展现给我们一个例子:怎么样让孩子解一个线性方程组。
如果大家有时间,仔细看一下这个例子,会发现它比所有一对一的老师教得更好,而且很有耐心,它也比妈妈教得好,因为不管你怎么问它,都不会生气,还会继续分解出更简单的问题来引导你的思路。
03
AI会带来作文学习领域的哪些改变?
大模型在教育领域中首先最大的一个应用就是比真人更强的AI辅导老师。
我们知道上一个在线教育爆发是因为发明了大班在线直播双师课:一个主讲老师和一个辅导老师,因为这个模式,在线教育同时在学的人数突破了一千万。
很多大公司用这个模式都取得了商业都成功,扩张很快,不过这个模式里有一个问题:公司里的成本结构里很大一部分都来自辅导老师,很多公司都雇佣几万人的辅导老师团队。如果今天看来,辅导老师这个角色完全可以由AI来承接。
更有趣的事情是:也许会出现一个SaaS公司可以提供辅导老师的能力,是不是就可以不需要大公司了,一些名师自己去买一些AI的辅导老师的SaaS服务,就组成了一个可以上课的基本单位,不再需要特别大的一个机构帮他提供服务。
如果成本服务变得很低,是不是大机构就变成很多的个体户,有可能会发生这样的变化,不过现在都只是猜测。
AI做不到的事情是什么?我问了它做不到的事情是什么:
1、它做不到实时交互。
现在确实做不到,因为推理可能会比较慢,但是这个问题未来是可以解决的,它有点谦虚。
2、完全个性化的学习路径。
到GPT4的时候,这个可能还是做不到,因为整个的输入token其实是有上限的,当时是24000多个,GPT3是8000多个,这个长度应该还没有办法完全了解一个学生所有的问题。
不过我们可以设想一下,如果它能够把一个人从小到大所有的试卷全部扫完,然后输入给他,是不是就能知道这个学生的弱点在哪里,这是很有可能随着技术发展,在后面的模型里会解决的。
3、监控和评估学习进度。
这个应该不难,它是可以做到的。只不过应该是用其它方式,而不是用聊天对话的方式。
4.人机互动和情感支持,
现在可能做不到,出来都是很官方的,很冠冕堂皇的回复,还感受不到情感的交流。
它不能做的,我补充一下,一个是学习动力和情感支持,它可以回答你的问题,没有办法激励你的学习,不像一个老师,老师有的时候去鼓励,有的时候去鞭策,可以用各种方式帮助学生进步提升,AI是做不到的。
还有一个它目前没有办法做到的,就是没法帮你定一个学习计划。我们看到很多机构的课程是经过精细规划的,分阶梯,L1、L2、L3,一步一步去规划,现在AI还没有办法规划一个系统课程,就是教研员来负责的统筹规划的事情,AI目前还没有办法做到。
在作文领域我们的一些尝试,有些在内测中。
在作文领域有两个问题,写之前不会写,写之后没有反馈。
这两个问题可以通过AI来解决,在写之前我们可以让AI来教你怎么写,提供一个基于问答的写前辅导;而在写之后,我们可以提供AI批改。AI批改是我们已经做了很多年的事情,我们有自己迭代了很多版的小模型,也是基于transformer,跟ChatGPT是同源的技术。
我们现在的解决方案是通用大模型+专用的小模型,这样才会给用户可以媲美真人的一个作文学习的解决方案。
04
AI在教育中的应用会是什么样?
接下来聊一下整个教育行业的思考:AI在教育中的应用会是什么样?
这也是GPT4出的一个官方技术文档里的例子,问它能不能解释一下为什么这个漫画很搞笑,也是step by step。
这个图本身是讲机器学习两种方式,一种是神经网络,一种是统计学习。
如果是深度学习的话,只需要堆更多的层就可以达到很好的效果,这算是比较抽象的学术圈的一个梗,它也能解释的非常好,所以它读图的能力是非常强的。
所以大家也许可以做一个新的拍搜APP,拍完了以后问它这个题怎么解,它可能会用苏格拉底的方式告诉你,最大的一个好处不需要积累题库。这也许是一个很好的创业方向。
以前的电销、网销,凡是跑SOP的工作,把SOP文档变成prompt告诉AI,它肯定比真人跑的好。
确实有很多销售人员是有天赋,他们从SOP的框架中跳出去,会取得很好的销售效果,但是经过实际测试,如果所有人完全按照SOP跑,效果也还很不错。如果这样的话,前端销售也可以被取代。
我个人认为学习过程需要思考两个问题。
一个是教育资源的问题,我认为未来教育资源是比较容易获取的,比如说通过丰富多样的海量可选择的AI课或者是名师的录播课,再加AI辅导老师这种双师模式,就可以达到教育资源普惠的状态。
教育资源的问题因为今天AI所涌现的能力可以实现完美的解决方案。一个AI辅导老师,它也许会比我们现在所有的辅导老师更强。
另外就是学生学习动力的问题。
所有人都能接触到最好的教育资源,剩下就是拼学生动力,学生动力最有效的方式是群体的动力大于老师家长的压力大于个人自驱力,个人自驱力太难,大部分很难坚持自驱的去学习,99%的孩子是没有这样的自驱力。
可以提供比较好的群体学习动力的地方就是在学校里,如果有好的学习氛围,有积极向上的同学互相竞争鼓励,其实要比有一两个好的老师更加重要。但是一个负责任的老师和家长还是要比学生自己去自我驱动的效果更好的。这也是AI目前还没有办法提供的能力。
大概就给大家分享这些,有什么问题可以交流。
05
Q&A
问:刚才您在PPT里讲了一个AI能够代替很多SOP的工作岗位,我本质上理解,AI是解放社会生产力的工具,您理解的AI它将来的一个定位用来取代社会上的工人还是取代社会上的工程师呢?
宋嘉伟:可能都能取代得了。
以前确实没有取代,因为NLP的技术发展还没用达到那个临界点,如果我们看一下GPT2,会发现它生成的内容是不通顺的,到GPT3 transformer深度达到96层以后,现在所有语句都是通顺的而且是具有逻辑的,这个问题基本解决了。
第二,涌现出来的逻辑能力、思维能力,这个已经超过人了。在以前不通顺的情况下,已经有AI的销售机器人在打电话,只不过打一半,识别到客户有购买意向,立刻转真人承接,因为AI继续聊下去很容易被人看出来。
但是现在,它的对答的能力、思维方式涌现出了推理能力,已经让人完全分辨不出来是真人还是AI,所以就没有必要接真人了。
GPT3我们为什么认为它能力很强,如果看它的结构会发现它的整个模型里面,低层和中层的参数对应的语言之间的基本语法的关系。
这里面有一个让大家细思极恐的事情,它中文语料可能占不到1%,非常小的比例,但是它说中文一点问题没有。语言本身内在是有一些联系的,AI只训练英文语料就能触类旁通,顺便把中文全部学会,所以我们对语言本身的理解还不够深刻。
像围棋机器人,现在围棋的AI下出很多棋,人类的棋手觉得完全理解不了,但是它能赢。所以它的认知很有可能比我们更强。看到有些paper讲整个大模型里,transformer的高层参数可能把一些更抽象的语言知识,思想存储在里面,而transformer的低层存储是语言本身词法,词性,句法的知识,现在语料不够,后面会把图片、视频全部加入训练,假如96层到两三百层以后,会抽象提取出什么样的知识和能力,后面会涌现出什么能力来,还是很可怕,有可能不只替代的是工人,后面是不是会自己做科研,生物领域已经在做科研了,把做科研的很多人干掉,其它的领域是不是它自己做科研,这是很有可能的。到那个时候,工程师和科学家都可能会被取代。
问:我可以理解为您觉得AI只要给它足够的样本跑深度学习的模型,它未来的成就很有可能会直接超越人类目前所有的成就,是这个意思吗?
宋嘉伟:是这个意思。
问:使用ChatGPT的时候,我发现有一个问题,怎么提问是一个比较难的问题,甚至说怎么听懂对方的话也是比较难的问题。有没有什么通用的方法或者说需要具备的技能?
您的孩子在培养的过程中,在应用ChatGPT的过程中需要具备哪些学科的技能或者说他的逻辑能力,学习力,哪些方面需要培养?
宋嘉伟:Prompt现在,硅谷那边有Prompt工程师,可以招聘这样的人,薪水比工程师还要高。甚至研究怎么写prompt还可以发paper,比如刚才说的CoT思维链,就发了一篇Paper讲怎么样提问题,讲怎么用step by step来回答。
GPT3是不需要fine-tune的,只需要加Prompt就可以。
原理上来说因为在GPT3这个大模型,1751亿个参数里面,它可能已经包含了所有的模型,可以认为是所有的小模型在里面。一个大模型里面包含了无数个模型,但是怎么样激活每一个小模型,你或许只需要把Prompt正确的放进去。
思维链为什么要加一个let’s think step by step,它可以一步一步来解出来,这个原理可能是因为它以前训练所有的语料里面会有非常多的类似的范式,前面有let’s think step by step,后面就是这样的模式来回答。
所以说我们在prompt里加了“let’s think step by step”,正好激活了那块区域的参数,所以它会按照一步一步来做。
人类很难直接知道训练用过的所有语料里面,哪种前置问题对应的回答方式的样本分布比较大,所以说需要不停去试,Prompt工程师就变成一个工种。
第二个问题,我是孩子的家长,有两个孩子,我自己认为未来是看不清楚是什么样子对。以后什么东西有用,什么东西没用,其实很难预测。我自己的方式是孩子想学什么都看他自己愿意,让他尽量接触更多的东西,他愿意往哪个方向发展都可以。我儿子玩游戏比较多,看课外书也比较多。
问:我补充一下,你的问题现在是因为ChatGPT它用自然语言来去描述的一段程序,如果学过汇编和C++就知道,它越来越接近人的语言思维的方式。
我最近也在和一些朋友聊,孩子怎么来适应未来AI深度参与的社会,最大的还是他的好奇心。他们做了一个很有意思的实验,孩子在学校会觉得和小伙伴关系不好,我该怎么办,家长没有兴趣听他唠叨那么多,其实在语言的层面,GPT是可以满足的,我看有些家长很有意思,我们家孩子最喜欢吃番茄炒蛋,你能不能用GPT形成一个Prompt,去画出来我们家做的那道菜,孩子会非常感兴趣。
而且他们会发现GPT给它大量描述是它不认识的单词,它会基于这个去学这些词,这些词对他现在的年龄段是超纲的,但是他有兴趣学。
GPT的P是Pre-trained,Pre-trained意味着你要非常好的选择这个语料,您怎么考虑这个问题,现在因为4是不联网的,刚刚开发联网的功能,相当于以前训练的都是筛选过的,在未来随着GPT本身自己不管是产生的内容被反向输入到互联网里面,相当于一定程度上我们叫语料被污染了,这个会对它的未来产生什么影响?
我们看到谷歌ICO就把它大量的原来那套逻辑给它人为改变,这个过程中会发现会看到奇奇怪怪的被操纵的方向,未来您怎么看这块它的training被污染之后产生的影响?
宋嘉伟:现在来说GPT3是相当于所有互联网的内容,所有语料都已经用完了,它自己生成的这些东西我猜再放进来对它对梯度不会造成太多的改变。
问:有没有影响?
宋嘉伟:不知道,最好去做实验,我只是猜测。因为它已经是全量的东西,生成出来的也是按照这个逻辑生成出来的,它用自己生成对语料去调自己的参数,有点像一个人自言自语会不会改变自己的认知的问题。
问:它未来的进步靠什么驱动呢?
宋嘉伟:GPT4开始读图片了,还有大量的图片、视频内容可以参与多模态的训练,当然还有很多细节专业领域的内容,利用plugin的方式接入,因为那些专业化的语料也不会开放出来。
问:这个技术出来之后我的理解还是有很多突破,在您的领域怎么应用这个东西?显而易见这个技术突破性有,这个情况下在,具体的事情上面,原来做的产品或者方案比较被替代掉,您会不会担心会出来一堆的叫笔神1、笔神2的企业?怎么去应对?
宋嘉伟:我刚才说的现在大模型确实很强,但是有可能还是需要一个大模型+小模型的方式,小模型有很多专业的领域的数据和解决方案。
从GPT-4来看,官方也认为它不是一个就可以全部打掉其他所有领域,所以开放了plugin,因为各个不同领域有自己积累的独特数据,这些数据是不公开的,所以也是学不到的。
我们积累的人工批改作文也是这样的专业领域的数据,所以如果新出来的公司做我们的事情,他也需要有积累专业数据的过程,还是需要有一定的时间,才可能达到同样的起跑线,但是在这段时间里,还是会继续往前跑。
问:您提到在生产端ChatGPT可以给咱们带来的变化,笔神作文或者产品端、应用端,跟客户面对的那块,我们提供的服务上面有没有什么想法?
现在有一个把您笔神创始人的身份拿掉,有这个机会做这个事,您想做成什么样?
宋嘉伟:最想做到的形态其实就是GPT4演示的内容,用苏格拉底方式教学。
现在听名师直播课的方式,每个人的理解能力不一样,上大学的时候我也会发现有一些课,如果迟到15分钟,一个学期都听不懂了。大部分人的成绩之所以不一样,每个人的理解不一致,不同步,同样是听一个大班直播课,同一个知识点,有些孩子很快理解,有些孩子就是听不懂。
这时候是不是直接发一个Prompt,说这块我没懂,给我详细讲一下,跳出一个AI的辅导老师详细地把具体的过程讲明白了,孩子完全学会了以后再继续听后面的内容,这个方式对每个孩子来说是最好的学习方式。当然作文领域也可以做类似的尝试,所以笔神创始人的身份并不冲突。
问:您回答第一个问题苏格拉底的教学,有没有一种可能,它直接用GPT-4就可以,产品层面没有对教育应用场景进行太多的,只是提供一个服务界面,剩下都是市场和商业运作方向的事情,在产品层面您觉得它对于教学还需要有什么比较有突破性或者有可能出现突破性的方向?
宋嘉伟:OpenAI的人也不这么认为只有它一个大一统的产品就可以了,因为openAI投资了speak,是做学英语的,所以openAI还是投了一些垂直的教育产品。很多人的观点认为大模型供了一种可能类似于浏览器的能力,上面还会浮现出一个一个垂直应用出来,OpenAI的人可能也是这么认为的,否则他也不会去投其它产品。
问:在教育的场景应用中,未来会不会大模型+小模型会产生比较多的创业方向,其中有哪些是比较好落地?现在有很多大模型公司,是不是像跟语言文本类的更容易落地?
宋嘉伟:个人认为辅导老师,答疑老师一对一的问题解答会更快速落地。
问:如果是答疑,有一个问题,怎么样去防止他出现一些错误,现在GPT-4里面测试的时候,有的时候答题也会出现一些错误。
宋嘉伟:你说的对,去年全国一卷语文第一题是材料题,一共五道题,三道客观,两道主观,三道客观全错了。GPT-4没有学过我们高中语文的考试技巧,确实容易掉坑里,所以它现在还不是万能的,出错的情况还是有很多。
问:是否可以理解成首先应用的是一些高容错场景?
宋嘉伟:它还在发展,可能有更多专业语料以后,知识能力会更强一些,按照官方技术文档给出来的考试评测成绩,如果它先在某类考试中得到比较好的成绩,可以再把它变成一个答疑老师。平常在学校里我们也会请教同学,如果这个同学他数学考了全班第一,我们问他没错,但是有时候他还是会出错,会告诉你一些错误的答案。
这个东西跟人很类似,做题有对有错,在一些测试集上表现的效果非常好,超过百分之90的人,或者都能考满分的时候,是可以问它的,但是如果它在某个测试集表现不好,那就暂时别用。不过AI发展特别快,也许到GPT-5以后,它把所有的Paper都学会,所有的考试就都能够得到特别好的分数了。
问:因为OpenAI也在做数字人形机器人这块,它首先投的是安全领域,如果涉及到人形机器人,比如说应用到AI陪伴,去做低龄的孩子情感上的,能实现吗?我问他什么,他就能答什么,有点像一个私人家教一样?
宋嘉伟:私人家教应该是可以,情感上的支持,我现在说不好,不是很确定,它自己回答它没有办法做情感上的交互。
正常的答疑是可以。
OpenTalk第39期相关内容: