深度|对话猿力科技CTO杨元祖：大模型为教育解决方案带来“第三种可能”

2024-05-21 10:35:39发布来源：多知作者：王上

　　来源|多知

　　作者|王上

　　“大模型对我们来讲是‘技术’，不是‘产品’，它应该在产品中发挥价值。”猿力科技联合创始人、CTO杨元祖在与多知对话时反复如是强调。

　　2023年11月，猿力科技自研大模型落地教育应用“海豚AI学”，其中，小学数学练习解析环节的“小白老师”苏格拉底式答疑陆续开启公测，这款产品被猿力科技视为“新一代智能学习产品”——这个分量并不轻。

　　猿力科技于2014年成立了AI Lab，旗下产品猿题库、小猿口算及小猿搜题等都是以AI Lab为基底发展而来。近日，北京猿力科技有限公司“看云”生成式人工智能备案成功。猿力科技正全面拥抱生成式AI，大模型正进入到各个业务/产品线、各个环节，但它并不明显，而是隐藏在产品的交互背后。从产品角度来看，大模型可能体现在某个功能、某个场景、某个环节，甚至是服务的过程中。

　　对于大模型的应用，杨元祖提到，“从AI原生角度去出发去打造一个产品，就像拿个锤子去找钉子，不一定是靠谱的。猿力科技的做法一直是从用户场景出发，看自己的‘工具集’如何去满足用户。”这种思考方式更像是“让钉子去找锤子”。

　　在杨元祖看来，做大模型应用，最困难的是找到一个对用户有价值且大模型可以实现的场景。为此，猿力科技还组建了一个“预研团队”，这是猿力科技落地大模型应用的一个探路先锋队。

　　人工智能的进展，从电影剧情照进了现实。体现在企业日常经营、产品迭代中，更多是涓涓细流式的探索与积累。

　　杨元祖认为，猿力科技这些年的发展节点不是“做出一个产品”，而是“做出一个决策”。大模型就是这样的一个关键决策，但它并非灵光一现的结果，而是经过长期关注、来回认知、不断验证的过程。

　　他说，大模型是教育解决方案接下来改进的最大变量。假设没有大模型，猿力科技也会一直迭代产品，但这是相对渐进的过程。而大模型这个变量给了猿力科技一次重塑教育产品的机会。

　　杨元祖认为，做完多模态大模型的拼图就完整了，多模态对教育领域的重要性远超其他领域，猿力科技对多模态的期待和投入非常大。

　　这次对话反映了一家头部教育科技公司探索大模型之于教育改革的真实状态，其中“做出决策”至关重要，而产品则是决策的结果，创新往往孕育于日常耕耘之中。

　　以下为访谈内容（经多知编辑）：

　　大模型“上限很高，成本可控”，教育领域会有无限的应用场景

　　多知：猿力科技是什么时候决定要做大模型的？

　　杨元祖：它可能不是一个准确的时间节点，大模型这件事情并不是ChatGPT发布那一刻我们灵光一现，然后下重注，并不是。

　　预训练、GPT很早就有，我们很早便在关注Transformer的架构对于教育的影响，一开始我们发现大模型渲染成本特别高，但它的效果可能还比不上我们原有自研的一些模型，所以是一直保持关注的过程。

　　来来回回，有过反复，甚至有过怀疑。最初大家对于大模型背后技术的预见还比较模糊，没有认为这就是将来的希望。全世界就OpenAI一家是在2017年 Transformer 架构论文发布时就笃定这是未来，且下了重注。

　　在ChatGPT发布之后，我们逐步地去挖掘它能被用来做什么，也越来越感觉到它令人震撼。但也没有认为应该马上去自研大模型。

　　首先这东西要怎么应用，大家并不知道。没有人能在第一时间判断它一定能用到我们的应用当中去，所以开端没有那么戏剧化。这是一个慢慢理解的过程，慢慢有更多的信息摄入，包括各种观点争鸣。

　　GPT-4的发布是一个完全不同的节点，因为它跟之前的GPT-3.5是有质的差异，这个事情带来的变化比想象的要大得多。所以这时候我们才会考虑要自研一个大模型。

　　多知：最后为什么做出了自研大模型的决策？

　　杨元祖：最初大家面临的问题是大模型成本非常非常高，可能数亿美元。所以就会面临一个决策，“大模型是值得我们公司去投入的吗?还是它就应该是微软、Google，国内像百度、阿里、腾讯这样的公司去投入的?”这是需要回答的问题。

　　随着接触的信息越来越多，我们发现其实成本没有那么夸张。我们计算到底需要多少数据量，需要多少运算量，需要多少钱，最终算出来后才明白大家把这个事情神化了，其实并不需要特别夸张的资金投入。它就是一个慢慢地不断来回反复的过程。

　　但是最终决策肯定不能够等到(大模型的一切都)完全清晰，那就太晚了。整体上粗略计算要花多少钱，我们觉得是可接受的，所以就开始做了。可以说，它的上限无限高，下限就是这个成本。

　　多知：成本大致是怎样的？

　　杨元祖：我们大概有几百台机器，资金投入是动态变化的。总之，上限很高，成本可控。我们当时的判断是大模型会给教育带来巨大的不同，这是一个最直接的判断。

　　然后准备团队，购买机器。到底怎样产品化，这是后续的工作。

　　多知：团队希望看云大模型主要解决哪些问题？

　　杨元祖：大模型能力还是希望它更通用，只是说我们的大模型能更加符合教育领域，比如说更会做题，更擅长以一个老师的方式来掌握知识点。也就是说通用的大模型可能对于语言的理解能力是很强的，但它对语言的理解能力是一个普通人的理解能力，它不是一个语文老师的理解能力。普通人和语文老师看待同一句话、同一句语言的视角不一样，这是两者的差异。

　　比如我们要训练的“辨识”这一类的能力，要比通用大模型要好。它可能用在哪呢?比如作文批改。

　　接下来还有更多应用场景，这就是大模型吸引人的地方，它有无限的应用场景。我们希望它把教育的能力学会了之后，能重塑更多的教育场景。

　　多知：海豚AI学背后应用了哪些技术？

　　杨元祖：我们认为AI技术都应该是为我们所用的，而不是特别强调采用的是哪一种技术。比如RAG (搜索增强)、检索增强或者预训练，这些我们都会用。不管叫“垂直大模型”还是叫“教育大模型”，只要它叫“大模型”，就具备一定的通用能力，这是它最大的特点。区别只是我们自己训练的大模型在通用能力上或许无法达到全球顶尖水平。

　　但是我们在教育方面的能力上能够达到甚至超过GPT-4，然后在教育相关的具体任务上，比通用大模型好，同时，我们的通用能力能够达到过关的水平，这是我们的目标。

　　假设我们一开始就想要做一个比GPT-4通用能力还要好的大模型，我觉得大概率是做不出来的，这不是我们这样的公司应该去投入的地方。

　　(海豚AI学界面)

　　多知：自研大模型在教育能力上能达到甚至超过通用大模型，是因为猿力科技拥有更多教育类的数据吗？

　　杨元祖：对，这是非常明显的，或者说这是非常直接的，就是因为有更多的数据，比如题目的数据，老师讲课的数据，老师怎样去拆解一道题目的数据等，都可以用来做训练，所以能够在教育这件事上做得更好，这也是通用大模型很难一下子能搞定的事情。

　　生成式AI为教育解决方案开辟了第三种可能：“创造一套可交互的内容”

　　多知：教育领域，生成式AI 最早被应用在了英语科目上，现在各个科目落地情况如何呢？

　　杨元祖：为什么会最先应用到英语上，是因为大模型有些事情是它擅长的，有些事情是它不擅长的。它擅长自然语言的理解，自然语言的交流交互，它可能不太擅长计算和推理。

　　我们在研究大模型应用场景的时候，一个思路是：要寻找一个对用户有价值的场景，并且要发挥大模型擅长的能力，规避大模型不擅长的能力。那很显然，英语口语对话是一个大模型天然擅长的能力。

　　大模型擅长自然语言沟通，单单是这一点可能就适合所有科目，只要不让它从头到尾做一道题，而是把答案给它，让它给讲一遍，它都能做到。

　　我们要把它最擅长的能力发挥到极致，不擅长的暂且规避一下。

　　多知：告诉大模型答案，让它发挥讲解的能力，可以解决做数学题的幻觉问题吗？

　　杨元祖：其实做大模型的一直都非常关心，甚至整个研究领域都特别关心大模型数学题目能不能做对。首先大模型不会100%做对，跟人一样，人也不会100%做对，但大模型跟人还是有差距。

　　大模型的能力会越来越高，但我认为，接下来一段时间内它不可能达到一名真正老师的水平。但要把它落地到产品中去的时候，我们会去刻意地帮它“降级”，即我们给它答案，这样对它逻辑推理的要求就会降低很多。

　　我们给它答案它就会了，让它只负责讲，照着答案讲。它并不是照本宣科读一遍。我们甚至会顺着大模型的“脾气”把答案告诉它，那它可能有更深的理解，可能用它自己的语言来表达。

　　用这种方式就可以去规避它在准确率方面的限制，但并不是说我们就不依赖它的准确率。这背后比如我们要给它答案，那答案怎么出来呢? AI 能解决 90% 的问题(即给出正确答案)，10% 的问题是人在帮助它解决，整个链路就变成了【我们要非常精确的答案】，需要【提前准备好答案】，那【AI可以辅助我们提前准备好答案】，然后【知道正确答案的大模型，把题目讲解明白】，是这样的一个逻辑。

　　多知：猿力科技原有的产品加入大模型之后会有什么样的改变？可以举一两个例子吗？

　　杨元祖：我举几个例子，比如斑马App中“斑马阅读”这个产品，孩子阅读完一篇文章之后，系统会向孩子提一个问题，比如“曹操为什么会感到很失望?”在大模型出现以前，让机器来评估孩子的回答是很难的。

　　现在，大模型可以多轮交互了，系统问一个问题，小朋友回答后，系统还能进一步引导他。这是一个非常小的场景，甚至不是核心的场景，但是用户体验发生了质的变化。

　　我再举一个例子，比如大班课模式相比于1对1 模式，老师并不能关注所有的学生。但是， AI 在这件事情上又带来了新的可能性，大班课能够去支撑一个名师，同时AI可以实现关注所有的学生，这是大模型给原有产品在体验方面带来质的变化。

　　在线大班课解决了一些教育资源不均衡的问题，但没有解决个性化教育的问题。当时不做1对1，本质是因为没有那么多好老师，而AI有可能解决这个本质矛盾。

　　大模型让我们第一次有了解决本质矛盾的办法，这也是我们努力的方向，但不是说现在开发一个产品就解决了，还很远。

　　多知：双师大班课原来是由辅导老师去关注所有学生吧？

　　杨元祖：辅导老师也不可能实时关注所有人。老师问学生一个问题(指主观题)，孩子用语音直接回答，系统是没有办法给反馈的，而大模型第一次给了我们这样的一个机会，可以给所有学生反馈。

　　我们会发现“工具集”更加丰富了，这个“工具集”使得我们重新去思考教育解决方案有什么样的提升空间。

　　多知：可以理解为这个工具集更丰富了之后，以前产品的各个环节都可以用大模型重新做一遍？

　　杨元祖：是这样的。

　　多知：这意味着不一定非得是一个原生的AI应用才是教育领域该做的？

　　杨元祖：我认为AI Native或者AI原生，从这个角度去出发去打造一个产品，就像拿个锤子去找钉子，反而不一定是靠谱的。

　　我们公司一直以来的一个做法是从用户场景出发。不是因为我们有了一个大模型，所以，就让大模型去上课。相反，我们希望“上课场景”在大模型下能够做得更好。因为工具集的丰富和进步，使得我们第一次有机会可以以新的方式来提供服务。

　　从这个逻辑来看它有可能是原有的场景，在体验方面得到了极大的提升，也有可能是原来不可能的场景，现在又有了新的机会。从来都应该是从用户需求出发往回找工具，然后再来用。

　　多知：像海豚AI学属于有了一个场景，有了用户的需求，刚好可以结合AI老师答疑？

　　杨元祖：是的。我们来思考一个教育的产品或者教育的解决方式，一般可分为两种解决方案：一种是静态的视频内容，加上一定的规划;另外一种是有真人老师交互的，老师可以做很多事情，比如答疑等。

　　海豚AI学刚刚开始做的时候，我们认为可能是第一个方向。但是大模型的发展使得我们有了一个新的机会，我们发现在这两个形式之间可能存在另外一个机会，即它不一定是静态的内容，它可以是一个可交互的视频内容，那能不能把静态内容、产品形态做一次更迭?

　　理论上用户是需要交互、需要实时反馈的，因为这件事情是人们学习过程中必然需要的。所以这时候我们想，能不能不通过真人老师来满足这个需求，而是通过 AI 老师来满足?

　　因此，海豚AI学更远大的目标，是希望创造一套可交互的内容，它是教育领域的第三种解决方案。

　　目前海豚AI学已经发布的几个场景，比如AI答疑，它是一个很强的场景，原来静态的视频资源解决不了答疑的问题，只能去找辅导老师，而现在AI能做到，比如看一个视频的时候，老师讲到这一句话学生没听懂，以前学生是去问辅导老师，但现在可以在视频旁边加个按钮，学生可以直接点击提问，然后AI直接答疑。

　　(海豚AI学App中的“AI答疑”功能)

　　未来，海豚AI学肯定会越来越AI，越来越可交互化。

　　多知：用户对海豚AI学的反馈是什么样的？

　　杨元祖：整体来说用户对海豚AI学的认可度是超过预期的，我没有具体的数据和指标，这是一个比较感性的维度。超预期是因为毕竟原来没有办法解决，现在能有一个办法解决，哪怕这个准确率还没有到完美的状态，但它是一个从无到有的过程，这是一个非常显式的增量。

　　多知：我们发现斑马正在内测一个AI英语口语对练的功能“Hi, Zerd”，其背后是不是有游戏引擎？因为在出现一些词语时，屏幕中会弹出相应的动画形象。

　　杨元祖：是的，其实我们猿辅导很早就探索过这个事情，不是AI，而是内容角度。好多年前，大家都说老师在线上课的内容，要么用视频，要么是静态的PPT。但我们当时的看法就觉得还有其他的方法，就是一个小游戏。老师在带着你玩一个RPG(角色扮演)游戏，它是一步步往前闯关，是老师控制。

　　所以我们可能一开始就是觉得内容不一定是只有视频和课件，它应该还有非常多的游戏，我们叫互动课件。

　　我们怎么样批量生产那么多的小游戏作为上课的内容?这其实是挺难的一件事。为此，我们曾经还花很长时间去构建小游戏的生产流程，但这需要很多研发工程师，成本太高了。

　　而现在，在 AI 时代又有可能。如果是视频，AI没办法去做，因为视频点“暂停”体验太差了。但如果是游戏的话，就变成像AI一步步带着学生往前闯关，走这条路，走那条路。所以在 AI 时代这个技术的基础又有价值了，这个小游戏以前是老师带着往前闯关，那未来也可以由 AI 带着往前闯关。

　　多知：除了海豚AI学、斑马，还有哪些产品应用了大模型？

　　杨元祖：我们大部分的产品都用了大模型技术。只是它会隐藏在交互的后面，而不是说就突然多了一个聊天框，就可以聊天了。大模型对我们来讲是“技术”，不是“产品”，它应该在产品中发挥价值。

　　AI引发新的协作方式，猿力科技组建“预研团队”

　　多知：大模型应用在教育场景的难点在哪里？

　　杨元祖：任何一个大模型的应用都会面临有幻觉、准确率不高等问题，这些改变是困难的，比如准确率可以从百分之七十八十提高到百分之九十。但这些都不是最困难的，最困难的是找到一个对用户有价值且大模型可以实现的场景。

　　这件事情第一次被分到了两个人身上，以前技术要做什么事情，产品经理去了解用户的需求，然后把用户场景给抽象出来，产品经理能够判断这东西能不能做。现在我们第一次面对这样的困境——懂大模型的技术人员不知道这件事情对用户有没有价值，懂用户的产品经理认为这件事情有可能有价值，但是他没有办法判断大模型能不能实现。

　　这对于整个产品研发的团队来说是一个巨大的挑战。

　　多知：那猿力科技是怎么解决的呢？

　　杨元祖：我们觉得这是很难的，它唯一的解决方式，就是得把两个团队拉得更近。因为你让两个团队一块来思考一个问题，其实是非常难的事情。拉得更近意味着需要让产品经理来更多地去明白、去理解、去拥抱、去探索这个事情到底是否可行，同时，研发团队也需要更多地参与用户侧，到底对哪些场景、哪个技术再往前推一点点，有可能对用户产生很大的价值。这件事情有可能需要长期的沟通合作。

　　这里面还有另外一个更大的问题，比如产研只能模糊地判断它有可能实现，有可能对用户有价值，因为他对用户有没有价值这件事情也取决于实现的程度。比如准确率90%肯定有价值，80%就没有价值。所以永远都看得是模糊的。

　　此前，至少我们公司成立那么多年来，我们大部分做的事情都是确定的，大部分产品研发都是确定的。什么叫确定?比如，我们要做一个小猿口算就需要拍照识别，大部分情况我们都能判断它技术是可达的。只是我们需要花时间，花三个月、六个月去做，大部分都是确定的。

　　但现在，我们发现目标都不一定是确定的，因为这个东西它有可能怎么做都不行，也有可能怎么做都达不到用户可用的状态，所以“模糊”对一个公司来讲是一个很大的问题。

　　那我们怎么解决呢?说大家得拥抱不确定性，但这个事情是比较虚的，需要团队的学习和适应。落到实处那我们还要去组建一个新的团队，这个新的团队是构建在产品团队和技术团队之间，他们去做技术的预研。

　　这个团队不是做技术的研究，也不是产品经理去定义然后交给技术团队去开发。而是团队认为这个场景可能是有价值的，那能不能把它做出来看一看，一方面判断技术是可行的，一方面再去判断对用户是有价值的，会有一个中间状态。

　　多知：现在猿力科技已经有这样一个“预研”团队了？

　　杨元祖：已经有了，很小的团队，我们在尝试一种新的协作方式。

　　多知：看起来这是大模型和教育应用场景结合的新产物，改变了组织形态。

　　杨元祖：是的，我不知道有多少人意识到这个问题对于事情的影响面，但我认为，这非常影响大模型怎么跟具体的应用结合起来往前推进。

　　多知：对教育领域来说，哪些场景不需要“预研”？哪些场景需要？

　　杨元祖：比如口语陪练我会认为两端的不确定性都偏小。

　　AI外教也是一个可以探索的方向，我们也会做技术的预研，我们会去看到它到底能做到什么程度。但我个人会比较乐观，因为我会觉得确实有可能能够给孩子上课，但肯定不会是那么短时间内马上包装一下就能出来的，完全不是这样的。像Call Annie 类似产品不构成“课”，要变成“课”还有非常多的事情要做。

　　还有一些场景它其实两端都不确定，即“对用户有没有价值”是不确定的，“对技术能不能实现”也是不确定的，那这个事情就需要预研。

　　多知：预研团队是不是具备两者的能力，就是产品经理中懂技术的，技术中懂产品的？

　　杨元祖：对，但是，并不一定是一个人需要懂两个方面，而是这个团队的协作方式是偏向两者的。原来大部分的产品工程团队和研究团队是“线性”协作，但预研团队则是每天的工作都在一起的。

　　“大模型是教育未来发展的最大变量”

　　多知：听说过“猿辅导本质上是一个AI公司”，您怎么看？

　　杨元祖：总体来说，我们很多的产品、很多的场景都是因为有 AI 技术才有可能去构建，我们整个未来的发展也是寄托在 AI 等级越来越强的基础之上。

　　多知：“很多产品都是因为有 AI 才可能做”，包括哪些产品？

　　杨元祖：包括猿题库、小猿搜题、小猿口算，这些最核心的场景就是AI识别批改，整个产品的主流程都基于AI的基础之上的;再如斑马App、海豚AI学，核心的能力都是 AI 赋予的。

　　(猿辅导英语课程口语评测“配音小达人”板块于2021年上线)

　　多知：从猿力科技10余年的发展历程来说，在技术上有哪些重要的发展节点?

　　杨元祖：我们从 2012 年开始做猿题库，一开始我们希望能“用科技改变教育”，一开始这就是我们的 Slogan 。事实上，我们的思考方式和做事方式并不是我们有哪些技术，我们掌握了哪些技术，然后去看这些技术怎么样去改变教育，不是这样的。

　　我们经常是这样地思考问题，永远是从需求出发，然后看我们工具集里面有哪些技术解决用户的需求。这个技术不限于我们自身，甚至是全世界，很多时候技术可以直接拿来用。比如说直播、互联网或者是基础设施的发展，它其实都在一定程度上是我们直接拿过来用，然后用户的这个需求就被满足了，用户就受益了。

　　同样也会出现理论上这个事情是可行的，但是还没有一个现成的技术能直接被我们使用，所以我们需要在这上面去做额外的投入，我们需要去把我们认为可行的东西真正地落实。

　　从这个角度来看，我们确实会碰到好几个时间节点。

　　举个简单的例子，2012年我们开始做题库的时候就设定了是自适应学习，有一个推题功能，那“推题”这件事情其实有一些现成的研究结论是可以为我们所用的，比如项目反应理论等一些教育质量相关的技术可以用。但我们最初发现效果并不好，后来才发现深度学习有可能在这上面是有用的。

　　我认为关键的是我们做了一个决策开始做这件事情，然后去筹备团队，正式成立AI Lab。

　　所以，真正的节点不是做一个产品出来，而是说做出一个决策。这件事情值得我们去投入，值得我们去探索，因为它不是一个现成的技术，而是一个我们需要去探索，而且假设我们不去做，其他没有人会去做。

　　AI Lab之后的发展可能是连续的，它不是一个节点，可能是成果的展现。因为AI Lab 建立起来，我们开始做题目推荐，慢慢地我们原有的产品场景里面从视觉、语音、阅读理解等方面能够得到应用，慢慢这个事情就很顺了。

　　对于用户来讲是非常重要的场景，但是现有技术并不能立即实现，那我们就会做出关键的决策。

　　到后来，我们要开始做大模型这件事情也是一个非常重要决策。

　　多知：大模型或者生成式AI在猿力科技的战略地位是怎样的？

　　杨元祖：大模型肯定是教育解决方案接下来改进的最大的变量。假设没有大模型，我们也会一直迭代我们的产品，但相对来说是比较渐进的。但大模型理论上来说带来了全新的变量，使得我们可以重新审视教育解决方案，从这个角度说再怎么重视都不为过。

　　但是，并不是说大家天天要讨论大模型，有什么好讨论的?最需要的是一个组织的拥抱，是大家去做这方面的学习，以及资金的投入。 最核心的问题还是我们怎样去探索落地速度更快。

　　多知：速度是不是非常关键？

　　杨元祖：既关键也没有那么关键。关键的意思是不能完全不去看它，但是，也不是越快越好的，很多时候是需要找到对用户最有价值的时间节点，并不是越早推出越好。有可能越早技术还不成熟，反而会消耗用户的热情，所以就是一直得做，并不是为了追求速度而追求速度。

　　AI 所带来的机会是非常革命性的，但是真的是刚刚起步，AI对教育的改变也是刚刚起步。

　　多知：很多观点认为教育将是生成式AI最大的落地场景之一，您怎么看？

　　杨元祖：对于我们来说，一方面，我们公司本身应该就是教育是最大的业务板块，教育是我们最核心的业务，这个是毫无疑问的。另一方面，我们确实从大模型所带来的变化来判断，教育也应该是最大的。现在的大模型所具备的能力，哪怕是当前的能力，它已经可能带动巨大的变化。

　　哪怕我们不去依赖它的逻辑推理能力，就单单说自然语言沟通的能力，这件事情本身就是一个巨大的变更。比如，我们在原来教育的场景上做了 10 多年，但都不具备人机的自然语言交互能力，并不是用户没有需求，而是供给端不具备这个能力。

　　对于大模型的能力我们还在挖掘中，还没有完完全全的落地，也没有完完全全把这件事情做好，它已经能够带来巨大的变化了。

　　目前大模型对于教育行业的改变还非常初期，甚至不是在等待说这个技术再一次提升，使得产品还有更多功能，而是怎么把它用好这件事情还是在非常初期的阶段。

　　因为用好不容易，就是相当于以往的技术就一直就有的，但是要把它做出一个好的产品出来，这个过程本身是需要一定时间的。

　　多知：猿力科技对生成式AI方面还有哪些规划吗？

　　杨元祖：多模态，我觉得这个是绕不过去的。今年的OpenAI或者是说整个业界的研究人员都认为多模态是今年的重点。我会觉得多模态搞完之后大模型的拼图就完整了。

　　教育对于原生多模态的需求会远大于其他领域。

　　我举一个例子，就是自然语言的交流这件事情，原来是把自然语言转换成文字，文字再教给大模型去。但它丢失了非常多的语调信息。这件事情有可能在其他场景里，都不是那么重要。就比如说在工作场景，书面的信息就够了。但是在教育场景里面这个信息非常重要，有可能比所有其他领域都要重要，所以我们对这件事情的预期和对这件事情的投入是非常大的。

　　比如说多音字的问题，“正月”是读“zhēng yuè”，还是“zhèngyuè”，读出来很关键。还有比如学生问“答案是 5 吗?”他语速稍微慢一点，它都不能识别，不一样的语速就可能是不一样的信息。所以多模态对教育来说非常重要。

　　多知：在教育领域，AI是新进入者的机会吗？

　　杨元祖：我不确定，有一种说法，就是 AI 这一波机会其实更多的是给原有的玩家更好的工具，而不是给新进入者颠覆的机会，是因为确实它还得依赖原来的东西才能更好。所以它好像更多的还是原有玩家提升的机会，如果你不提升就落后了，对于一个新进入者，可能并没有那么友好。这是一种观点，我比较偏向这个观点。

　　但也有一些人说，对创业的公司，新进入的公司可能有一个颠覆老选手的机会。这是另外一种观点。

　　在我看来，人和资金并不一定是最重要的，重要的是场景。假设说 AI native，单单很小的一个场景就解决了所有问题，而原来那个场景又笨又重，这种情况下有可能会被颠覆。但如果这个场景能使得原有的体验做得更好，那原有的参与者做更适合。因为新入局者要把原有那部分考虑进来，进而才能再做优化。

　　END

　　本文作者：王上

商学院

Open Talk

深度|对话猿力科技CTO杨元祖：大模型为教育解决方案带来“第三种可能”

相关阅读