文|大力正手 教育行业研究者
编者按:
本文系多知网约稿。当前,不完全统计国内有超过80个基础大模型,对于大模型来说,参与开发的毕竟是少数企业,中小企业更多的是使用者。但是,到现在真正应用大模型的商业化并不突出。本文作者从几个角度来解释大模型应用商业化进展缓慢的原因,并认为技术本质上是一种手段,而满足用户需求才是真正追求的目标。
自2022年底ChatGPT发布后,截止6月份,国内企业已经发布了约80个基础大模型,打着AI旗号的产品更数不胜数。但实际上大模型的商业化一直存问题,可以说,并没有几家企业在大模型领域真正产生大额收入,其收入可能仅占估值的1/100,绝大部分都是靠着融资以及创始人自有资金将企业往前推进。文章将从几个角度来解释大模型应用的商业化进展缓慢的原因。
01
大模型还不足够好,小概率但可能是大风险
当你问早期ChatGPT3.5“林黛玉为什么会倒拔垂杨柳”,他回答说“因为林黛玉悲伤过度,倒拔垂杨柳缓解悲伤情绪”;早期的文心一言更是会回答一些匪夷所思的答案。这就是模型幻觉——一本正经胡说八道。但当GPT-4出来后,再问他“林黛玉为什么会倒拔垂杨柳”,他会告诉你“林黛玉是红楼梦的人物,倒拔垂杨柳是水浒传的情节,两个不能放在一起”。更精准的回答,正是模型幻觉的减少,这也意味着大模型正在越来越好。
然而,尽管大规模模型的性能正在改善,但他们依旧存在缺陷。在商业应用中,我们必须从小概率风险的角度去考虑。尽管GPT-4的错误可能相对较小,但在某些关键领域,如航空和医疗,即使只有一次的错误,也可能带来严重后果。因此,我们发现大模型最先被应用于容错率较高的行业,如聊天、游戏、社交等,因为在这些领域,偶尔的错误不会带来严重的影响。另一种情况,大模型作为辅助决策的存在,如办公场景中的会议摘要等,这也就意味着,在最终的产品或者内容触达用户之前,肯定有人的参与,来作为剔除小概率风险的保障。
02
大模型还不够稳,宕机了企业惹不起
GPT-4是目前最先进的大型人工智能模型,其优越的逻辑推理能力引领着业界的发展趋势,国内的研发也在不断向GPT-3.5靠近。然而,对于中国的C端用户而言,OpenAI的账户使用门槛较高,需要海外的邮箱、手机号和银行账户,这使得只有少部分人能够获取到优质的GPT-4服务。对于国内的B端企业希望使用GPT,一方面受限于国内法规限制,一方面open ai不定期对亚太地区特别是中国大陆进行封号,使得B端企业很难获得稳定的api接口。虽然可以通过微软云服务的方式接入,但也存在着一定的不确定性。
在商用领域,稳定性是至关重要的。就像游戏体验中,最让人破防的的往往是突然的宕机,而这在ChatGPT这样的世界级产品中也出现过多次。对于依赖GPT-3.5或4作为底层模型的企业,用户会对任何宕机行为产生抱怨,但他们不会关心问题的来源,只会感到服务的中断并把愤怒发泄到企业。通常,企业会选择备用模型以应对核心模型的突然问题,然而目前在商用层面特别是国内,还没有能真正匹敌GPT-4的模型。这意味着,即使备用模型能保证稳定性,其效果和用户体验却可能大大低于以前,这是所有企业都不愿意看到的。
03
大模型还不够便宜,模型之外还有成本
对于基础大模型的开发,这显然不是所有企业都能参与其中的,其训练成本极其高昂。对于大多数人来说,更多地是从使用者的角度与大模型打交道。尽管对于采用大模型的企业来说,API的价格已经大幅降低,比如2023年3月份ChatGPT API的价格比2022年底下滑了90%,而在2023年6月份,输入端的价格再次降低了25%。即使如此,这种新型的计算方式相较于传统的运算方式依然更加昂贵。据路透社报道,谷歌的母公司Alphabet的董事长John Hennessy表示,与大型语言模型进行交互的成本可能是进行标准关键词搜索的10倍。所以,虽然大模型的使用成本已经在不断下降,但其价格依然不菲。
另外,仅仅将大模型接入到特定的领域,可能并不能达到最佳的效果。因此,在接入API并将其投入商用之前,企业还需要在诸多方面付出额外的成本。这包括数据准备和预处理的成本、模型训练和调优的成本、部署和运维的成本、模型更新和迭代的成本,以及法规合规的成本。所有这些因素都使得应用大模型的总体成本依然很高。
以科大讯飞的学习机T20为例,由于其搭载了星火大模型,其价格比前一代的T10高出2000元。据业内人士透露,这额外的2000元其实并没有覆盖大模型的成本。考虑到市面上一台普通的学习机,其硬件制造和版权购买的总成本也仅在1000-1500元左右,这就更加凸显了大模型在商业应用中的高昂成本。
04
靠大模型创收,难,很难,特别难
商业得以运转,核心是收益能否超越成本。目前的商业环境已经不再青睐通过烧钱抢占市场或者策略性亏损的策略,而是更倾向于自我造血的企业。然而大模型领域的企业自我造血能力均欠佳。
以目前的头部大模型企业为例。OpenAI是目前最知名的AI大模型公司,虽然他们已经筹集了超过100亿美元的资金,并且公司估值达到了290亿美元,但是他们预计在2023年的收入只有2亿美元。另一个例子是Hugging Face,作为全球最大的AI/ML社区和平台,同时也是最重要的大模型基础设施之一,他们的估值是20亿美元,但growjo对其年收入预估仅0.3亿美元。另一家独角兽公司Adept AI,他们是AI助手(大模型应用)的开发者,虽然他们筹集了4.1亿美元的资金,公司估值达到了10亿美元,但growjo对其年收入预估只有0.04亿美元,可以说几乎还没有商业化。
国内的各大模型公司,例如百度、阿里、腾讯、华为等,虽在大模型领域有所布局,但并未从中获取实质性的丰厚收益。此外,大模型领域的中小型独立企业,其收入可能仅为公司估值的百分之一。尤其对于直面C端用户的产品,大公司在没有全面考虑的策略前,往往谨慎行事,不轻易推向市场。因此,像文心一言、通义千问、星火大模型等产品,都需要用户申请才能使用,而非直接面向公众。对于中小型公司,虽然它们能迅速推出产品,但由于资金等限制,产品往往处于冷启动,推广困难,因此大模型领域的小公司用户数通常较少。
大模型的确是一项优秀的技术,但它当前的价值更多地体现在"锦上添花",而不是"雪中送炭"。也就是说,大模型带来的边际价值,并未能满足市场的刚需。从商业模式上看,大部分的产品都是以原产品的增值服务的方式提供,而非推出独立产品。如多邻国的涵盖大模型AI能力的增值订阅服务,售价30美元/月;Quizlet的增值服务AI导师Q-chat,订阅费用为3.99美元/月。
大模型的上游企业收取中游企业的接入费,而中游企业则通过向下游用户收费来提供基于大模型的产品。最终,是用户的需求驱动了整个市场。但是,为什么用户不愿意为大模型付费呢?
首先,AI领域的发展和普及需要时间。许多领域,包括专业领域如midjourney和GEN2,甚至包括热门产品如ChatGPT,都还没有得到广泛的了解。其次,模型的成熟度对用户的接受程度有重要影响。如果用户接触到的产品不够成熟,他们可能无法充分体验到大模型的能力,这可能直接降低他们对大模型的评价和付费意愿。最后,付费方式和费用也是影响用户付费意愿的重要因素。如果付费方式复杂或费用过高,原有路径依赖直接阻碍了用户付费。
05
技术是佐料,需求才是主菜
教育信息化来说,一般情况下,购买方往往是学校或教育局,而真正使用这些产品的却是老师。只有深入了解教师在教学过程中面临的实际问题,推出的信息化产品才能真正提升教学效率。过于追求大屏幕或快速反应等技术特性,往往只是企业自我陶醉。同理,此前线下培训为何受欢迎?原因在于,面对面的教学效果通常更好,而且家长能把孩子交给老师,从而得到休息的时间。相较而言,尽管在线教育在某种程度上解决了学习问题,但家长仍需监督孩子在家的学习,家长并没有获得整块的休息时间。
识别用户需求并不简单,特别是在应用大模型技术的过程中。可能与大模型签约的并非实际的用户,或者用户根本无法表达出自己的实际需求。例如,在使用大模型实现学生答疑的时候,可能会以为学生只关注学习相关的问题,但实际上,除了提问,许多学生更渴望的是交谈的机会。有时候,学生说出的十句话中,可能有九句是想与老师闲聊,但如果问学生,学生说,“我就是想问问题”。
因此企业必须深入理解用户,寻找用户真正的痛点,而不是让技术变成一种噱头。技术本质上是一种手段,而满足用户需求才是真正追求的目标。
当然,大模型商用落实到实践的时候,还有更多的问题。我们也将在之后的文章中,逐一展开。
相关阅读:
普通教育从业者也能看得懂的GPT原理:知其厉害,知其所以厉害
长远看GPT等大模型对教育的影响
(本文仅代表作者个人观点,供读者参考。)