“去做有高增长潜力的产品。”

万字对话有道四高管:“模型即应用”的时代,到了?

2024-06-04 12:12:15发布     来源:多知    作者:冯玮  

  来源|多知

  作者|冯玮

  5月底,有道交出了2024年第一份答卷。

  2024年一季度未经审计的财务报告中:有道净收入13.9亿元,同比增长19.7%;智能学习硬件一季度收入1.8亿元,同比下降14.8%,连续第五个季度下降;数字内容服务一季度净收入5亿元,同比增长11%……

  网易有道CEO周枫曾在财报会上透露,有道将继续专注在数字内容服务、在线营销服务和AI订阅服务上。同时计划为子曰教育大模型在教育、广告等领域探索更多的应用场景。

  很快,有道又在上周对外公布多个产品的更新——AI全科学习助手“有道小P”上线独立APP,虚拟人口语教练Hi Echo儿童版和新一代知识库问答引擎QAnything。

  其中:

  AI全科学习助手“有道小P”可以在手机端便捷使用,解决学生全科学习的诉求;

  Hi Echo 3.0在功能、教学模式、虚拟人等方面全面创新,计划于6月中旬推出“儿童模式”,并新增两个全新的“语伴”角色;

  有道自研的RAG引擎QAnything在私有化部署和智能体生成方面进行提升,从单纯的文档问答进化成智能引擎——“企业AI大脑”。据介绍,目前,QAnything已经服务了20多个不同行业的上百家客户……

  它们正是有道当前的布局缩影——以大模型为基座,持续、深度布局Supper APP,从C端向B与G端延展,从线上到线下,用教育数据的积累,应对数字世界的疯狂变化。

  “有道不是市场上最大的公司,网易的文化也不是说看到一个技术风口就一定要去追的公司。”回顾有道的一路尝试,周枫在现场坦言:“我们在大模型上的做法从第一天开始,就是以应用为王。我们就是要紧紧盯着到底哪几个应用领域我们能够抓住。”

  “子曰”推出至今,有道已经基于其推出10余个应用,覆盖了翻译、作文批改、语法精讲、句子解析、体育教育、口语练习、家庭辅导等多个细分场景 ……

  AI依旧还不是有道所有业务的收入支撑。

  但却已经成为有道高增长的核心支点。

  “每天都讨论得很辛苦,很多项目干了一个月又要推倒重来,但总体来说,做得挺开心的。”周枫说道。

  在发布会后,多知也与有道进行了对话,针对GPT-4o对子曰带来的压力、大模型价格战、文生视频对教育行业的影响、智能硬件增长疲软、线下与线上的布局,有道四位高管首次对外分享了各种尝试与思考。

  以下为两场群访中的部分对话,分享者为网易有道CEO周枫、网易有道首席科学家段亦涛、网易有道高级副总裁吴迎晖、网易有道智能应用事业部负责人张艺,多知编辑整理。

  01

  “模型即应用”的时代,到了

  Q:GPT-4o对子曰带来压力了么?

  周枫:OpenAI跑的比较快,GPT-4o的出现证明实时交互对用户吸引力很大的。

  在技术端倒没有完全的壁垒,因为它本身是端到端模型技术方向,我们看完之后发现其实有道之前的翻译就是这么走过来的。

  在2018年以前的翻译系统是多个模型串联、并联组合起来的,2018年以后翻译模型就变成端到端的模型,一端进去是文字,另外一端出来时候就已经变成另外一种文字,中间没有语法、没有拆分这些东西。

  

  但我们其实除了在交互、实时性等是和对方有重叠之外,本质上子曰的长板是我们花很多时间去做的——让大模型懂得家长、孩子到底想解决什么问题,还有像孩子学习过程中的重难点、考试过程中要考察的东西、到了高中之后的规划等等。

  这些问题其实才是有道的消费者最关心的,所以我们是在把大模型应用到关键领域,也会继续坚持解决更多的问题。

  Q:最近不少大模型业务厂商都在做降价或者免费,这种趋势已经辐射到应用端了?

  周枫:我可以根据我们的观察提供一个数据,实际上大模型的成本它是下降的,基本上一年至少下降了一半。

  外部大家观察到的信息是比较多元的,可能大家会看到类似GPU涨价等等而认为大模型不可能降价。其实是下降的,而且如果下降确实达到一年一半或者更多的话,这就比摩尔定律的下降速度要更快。

  那么这个时候,对于做云端服务的公司来说,目前的降价是一个市场行为。它可能会希望降价之后能够拉更多客户,我觉得是云厂商的一个动作。

  这样的动作可能不会是互联网上第一次,也不会是最后一次。

  Q:但目前的模型训练还是很贵的,这对价格战来说会不会造成更大的压力?

  周枫:大家今年会比较关心70b模型,甚至130b的模型应用,现在不管训练还是推理都贵,所以价格能降低肯定对行业是个好事。

  我们也可以看到,现在直接卖API并不是好的商业模式,一定程度上这也是促成降价非常实际的一个动因,相信做B端的这些公司肯定也会探索出新的模式来的。

  Q:有道子曰到目前为止,区别于同类型大模型最大的差异和优势是什么?

  周枫:最大的优势就是我们自研的,可以对它根据我们的需求做任何的优化和修改。

  Q:今年大环境变化也比较大,有道对整个教育大模型赛道的速度和趋势有什么判断?

  周枫:行业发展还是比较快的。从趋势角度讲的话,我们看到全科辅导还是很大的需求,用户教育需求从来都是多元的,所以需要把各个学科都做好,这个也是我们的现在一个特色。

  后面的话应该说是C端、B端、G端都会有机会,比如Hi Echo现在也在海淀这边的学校开始试点。同时在产品形态上也会涉及到APP、硬件等等。

  从我们的尝试节奏也可以看到,端侧的大模型对教育很重要——端侧提供的离线服务有很多好处,比如响应速度更快,一些硬件做不了的事情也得以落地。

  一定程度上,大模型会取代掉原有很多AI技术。

  02

  多模态:有道的新重点

  Q:文生视频出现的时候,团队是什么感受?

  周枫:应用空间变得更大,现在教学过程中间特别耗费人力的地方是课件制作,图表、视频,有了文生视频还是可以提效的。但它的局限性也比较大,用起来发现有很多要解决的问题。

  Q:怎么理解局限性?

  周枫:比如说我要讲一个数学题,要换个坐标轴展示一下等等,让它去生成视频现在根本生成不了。目前它更擅长生成叙事性的、讲故事类的内容。

  对精确性、精准度要求高的内容还搞不定。目前它还是比较偏科的,跟最初文字大模型在数学方面的能力完全不行是一个逻辑。

  外界普遍会关心现在的大模型还缺什么,是不是到顶了。从我们角度来看,还远远没有,还有太多问题没被解决了。

  另外一个问题刚才讲到成本问题,还是太贵,多模态带来的是计算量方面非常本质的挑战,大家知道摩尔定律早就结束了,但这些东西哪里来、要怎么解决更大的计算量的问题,我们还是要相信人类的智慧。

  段亦涛:文生视频现在的角色更像艺术家,不是工程师。

  

  

  Q:有道有没有研发文生视频的想法?

  周枫:我们现在是基于整个规模的大框架下去尝试,基于自身条件去做的话还是可以做不少尝试。多模态是我们现在重点。

  Q:多模态的尝试和思路上能否再解读下?

  段亦涛:我认为多模态是AI的未来。

  从技术端来看,现在先是基于语言模型涌现了很多能力,但这些能力还流于表面,很多事情还没有做透。即使有些模型已经做得很大了,但可能只是理解了一个词而已,还不足以对齐整个现实世界。

  多模态语言模型和现实对齐的办法我们还没有很好地掌握。

  比如视觉模态是客观信号,为什么是这样分割的物体,是因为光线在这里面有客观规律,导致这个东西他就是分开的,或者说导致这个地方就是高亮的,那个地方有光源,跟现实是紧密结合的……

  现在的使用角度来讲还不够好,还有很大的空间。

  周枫:算法上会有突破,应用上会有突破。

  03

  移动端真实的AI渗透率仅1%

  Q:这次的财报中可以看到广告业务带来了很高的增长,除此之外,AI如何帮助我们赚到更多的钱?

  周枫:总体我们是在用AI去推动我们各方面业务的发展,只是不同的业务它介入的程度和深度会有一些不同。

  广告目前的确是AI参与程度比较高,目前有20%的广告素材已经是AI制作产生的。它省了很多的钱、也带了生产效率的很大提升。其实利用AI最深的可能是我们这次第一次聊到的AI订阅服务,这个比广告应该还更深一些,就像小P驱动了有道词典的收入的很大提升。

  我们的课程业务、硬件业务也与AI的关系很深,另外还有个很重要的方向是AI作文批改。

  2024年Q1比2023年Q4作文批改量上升了大约70%上下,每个季度都在快速上升。

  Q:为什么在这个时候,AI作文实现了很大提升?

  周枫:其实就是现在把AI作文跑通了。

  我们这个AI批改的产品其实五年前就有,核心区别第一个是大模型能力进来之后能力的大幅度提升;然后是模型和人的分工找到了更好的比重和方法。

  其实我们现在的AI作文批改是人和机器同时做,总体是机器为主。

  最后还有商业模式,它作为课程的增值服务是希望用户用了这个功能之后,更喜欢这个课程,确实为提高续费率带来了帮助。

  Q:能否再展开解读下“跑通”?

  周枫:所谓跑通,必须解决供应问题、营销问题和经济模型问题。

  Q:提到经济模型,今年的财报中首次提到AI订阅的概念,有道内部对它是怎样理解的?

  张艺:AI订阅这个事算比较新的概念,大家去年老问一个问题AI怎么落地,我觉得AI订阅应该是AI落地非常直观的一个体现。

  AI订阅的这几件事情,第一是教育,第二是营销,第三是效率,第四个是娱乐。效率换一句话就是生产力。

  

  比如词典翻译一直在做很多生产力相关的能力提升,所以也直接为我们的这次订阅的增长带来了非常大的提升。

  Q:AI订阅产品的渗透率如何?

  张艺:AI订阅这件事本身也是在提升自己的壁垒,这个和之前大家一些广告或者别的一些商业模式不太一样,可以让之前普通工具逐步变成更加强大工具。

  但实际上,在真实的行业里,AI用户渗透是非常低的,大家觉得好像大家都在用AI,那可能是因为我们住在这个环境里面,真实的可能移动端真正用户AI渗透率只有1%。

  未来半年或者未来一年渗透率有非常大的空间,这是必然趋势。

  Q:在有道的AI订阅产品中,会先跑出一个Super APP么?

  张艺:站在企业的角度,如果想要务实地判断,我觉得目前单纯靠AI赚钱的还不多。那么怎么通过AI赚钱、怎么通过AI找到健康的模式,并且为C端提供AI服务,从有道的角度来说,AI会员订阅应该是一种不错的模式。

  现在已经有一些企业在这上面尝到甜头,我们也是比较早开始尝试的企业之一。

  Q:小P会是有道的第一个Super APP么?

  周枫:超级APP这个事情本身如何定义,现在还没有标准化,有人觉得要日活1000万、有人觉得要日活1亿,没有定论。

  至少目前我们还是希望小P能够有越来越多人用起来。

  Q:小P老师当用户达到一定量级之后,付费动作上如何考虑?

  周枫:小P现在就有付费和免费的业务,基础业务基础工作都会是免费的。

  但我们也认为AI订阅服务是AI大模型目前最好的商业模式,所以我们基本上都会有付费订阅的这种尝试。

  Q:现在市面上也有不少AI助手出现,他们都在结合语音交互和AI能力提供免费的口语教练功能。但有道的虚拟人老师已经开始收费,它的差异化想如何建立?

  张艺:首先大家从我们的迭代可以看到,在整个口语助教这个行业我们还是非常自信的,它现在还是在AI口语教练的第一梯队。

  其次从C端来看,降价或者免费本身对于市场繁荣是一个非常好的事情。在这个过程中,我们的Hi Echo也在做很多的创新和升级,比如最近和雅思的合作等等。

  我们认为产品质量在提高的过程中本身就在给用户提供价值层面的创新和帮助。所以我们认为用AI去把这个产品的能力和服务做得更好才是有价值的。

  Q:小P老师和Echo未来有没有融合的可能?

  枫:肯定是可以的。

  我们目前对这两款产品的设计很像有道词典和有道翻译,用户对产品的第一印象其实就是这款产品的内核。

  现在从定位来说,Hi Echo是语言学习、英语学习,小P是全科学习助手。我们希望用户既能感受到共通之处,又能感受到定位的区别。

  04

  儿童也有了虚拟人口语教练

  Q:有道已经推出了搭载大模型的词典笔,但目前可能依旧有一定量级的用户对大模型本身并不敏感,相对更在意价格和性价比。这一点有道是如何思考的?

  吴迎晖:是的,市场上从去年开始出现了大量低价的词典笔产品,包括我们自己也推出了S6,它的销量也很不错。

  我们观察发现,用户目前对词典笔本身的认知还是还是更倾向于第一场景,就是查词翻译的场景。

  

  

  X6Pro是我们推出的第一款搭载大模型的词典笔,从去年到现在数据也很好,这个好不仅反映在销量上,也反映在搭载的AI功能的渗透率和使用率也在变高。

  这也印证了用户对搭载AI功能词典笔的接受度在变高。

  价格战确实会影响大家对它的判断,这个趋势也很明显。但大模型的能力让学习硬件成为学习助手本身,它的机会和空间也一样极大。

  我们今年会推出词典笔新品,它也会搭载更多的AI能力以及将AI能力更彻底地运用到关键场景里。

  我们也会在前面提到的第一场景之外,拓展属于它的第二场景。

  Q:前面提到了关于端侧大模型的落地,这对于有道的AI学习机有哪些影响和可能性?

  吴迎晖:端侧模型上的机会是非常巨大的。

  虽然目前我们的学习机产品、包括小P还是依赖于云端。但在更多的学生场景尤其是校园环境下,端侧将有更大的发挥空间。

  除了离线操作的要求之外,端侧还能应对更多场景的变化,大模型和神经网络能够提供便利,比如上下文相关性,以及提供问答交互等能力的机会巨大。

  而且,我可以提前预告一下,我们今年推出的新品将会在这方面有所突破。

  Q:此次Hi Echo面向低龄用户群体,有哪些特别的设计吗?

  张艺:这次儿童模式的升级变化还是比较大的。

  坦率说之前Hi Echo的1.0、2.0版本更偏成人一些,真正到小孩手里太严肃了,聊的东西也比较难,体验过程少了些趣味性的东西,成人可能可以听20分钟,但如果不好玩的话孩子2分钟也待不住。

  这次推出新的形象本身就下了功夫,技术方案和之前Echo技术方案不一样,虚拟形象本身也是小孩子的角色,也会有高兴、悲伤或者有手舞足蹈的动作,小朋友捕捉起来非常明显的。

  在体验的过程中,孩子们会得到我们提供的适配选题,Hi Echo则会作为旁观的老师,只在孩子寻求帮助时出现。

  其他时间都交给孩子和虚拟的小朋友自己聊天。说白了越往低龄走,很多东西会更加偏游戏化一些。

  另外我们希望还原和鼓励小孩子日常聊天的场景,不像教科书里面这么标准英式美式发音,让孩子想到什么说什么就好。

  我们会有很多迭代,预计6月中旬正式上线。

  Q:对于低龄用户,在社交上会有一些专门设计么?

  张艺:软件上面是有这样考虑的,大家会发现小朋友也有规模化效应,如果大家都用,比如这个班级老师都推荐孩子去练,就会产生整个班都在用的现象。

  所以我觉得非常有机会在软件上面做规模化产品,我们也在尝试中。

  Q:有道的听力宝在社交上的尝试也有很多。

  吴迎晖:听力宝是让小孩以聊天的方式去互动交流。

  这个过程中会遵循两个原则,第一个原则是家长比较期待的,通过社交来推动孩子的学习动力。所以我们基于社交做了比较多尝试,像学习营就是其中之一。

  第二个原则是我们发现很多孩子还是挺孤独的、需要社交,也有主动沟通的意愿,在社交功能的帮助下,让孩子更愿意开口分享自己。

  社交这件事情我们今年会在我们的某一款新品里面去做这方面的尝试,具体是哪个现在还不能说。

  Q:有道内部怎么看今年硬件市场的发展?

  周枫:我觉得大家也都需要探索,比如学习平板、学习机全行业都还在探索的过程,从只装课过渡到AI产品;用户也在回归理性,开始关注自己的需求到底是什么,以及什么产品能解决它们。

  很多企业都有好的想法,也想把自己的各种思考装到学习机里,探索是多元的。谁现在销量大或者小,都不是绝对性的。另外整个行业也在趋于理性,以前有不少厂商愿意花钱去冲销量,现在也少了很多。

  不能形成用户口碑的产品,冲量都只能是暂时的,所以短期可以不要太在乎学习平板的销量。

  我们还是更喜欢有道的词典笔产品,确实帮用户解决了一些问题,也帮助我们在用户端建立了信任。

  05

  线下业务:多团队、多模式同步探索

  Q:Q1财报中提到线下课程业务已经进入多个城市,具体布局思路是怎样的?

  周枫:线下目前是有多个团队在探索,我们其实是非常喜欢线上课程的,我们也喜欢线上形态。因为科技公司本身擅长的就是做数字化,数字化肯定在线上会更好做,所以我们肯定还是会以线上为主。

  那么线下的部分,是我们去做探索的时候发现说有一些方面家长、学生对线下非常在意。就像小一点的孩子还是更适合面对面、人与人之间的直接接触;又或者是一些高年级的孩子在学习一些内容的时候,他们的家长也会对当地的机构更容易产生信任。

  目前线下也是有很多形态,比如在北京的朝阳公园南门进去,有个有道的科创门店,这也是我们在北京最大的门店,我们的一些编程、机器人相关的产品都会在那边。

  面对高年级的孩子,我们还会提供一种线上线下融合的方式,线上是我们一些核心的内容,线下是根据家长需求由老师给出的个性化的指导。

  Q:目前在线下的探索节奏是怎样的?是自营还是合作?

  周枫:门店现在是我们自己开为主。

  节奏上,线下会比较慢一些,开店周期也会比较长,我们会耐心去尝试,逐渐应该会越来越多。

  目前我们在郑州、南京都已经有线上线下融合的门店,也在做一些创新的模式,还在探索中。

  Q:线下门店有没有AI大模型的参与?

  周枫:会有一些内容融入大模型和AI的部分。

  ……

  群访环节,周枫对多家媒体也分享了现在每天的工作重点——课程和AI,它们甚至直接切割了周枫每天的大块精力。

  “除了课程之外,有道所有的东西都在都围绕AI来做,广告是这样、硬件是这样、APP是这样、B端和G端都是这样……”

  “去做有高增长潜力的产品,这是我们擅长的。”

  相关阅读:

  有道新业务崛起,“AI订阅”业务销售额5000万 | 财报会

  END

  本文作者:冯玮