来源|多知
作者|王上
近日,AI语言学习平台Speak在官方博客中宣布完成最新一轮7800万美元融资后,投后估10亿美元,成为一家AI“独角兽”公司。Speak在6个月前刚完成一轮2000万美元的融资,当时估值是5亿美元,仅半年时间估值翻倍。
Accel 领投了此轮融资,此前的投资者包括 OpenAI Startup Fund、Khosla Ventures 和 Y Combinator 等亦参与其中。迄今为止, Speak总融资额1.62 亿美元。
多个教育行业创业者向多知分析称,Speak新一轮融资对于语言学习领域来说是一个好消息,有望拉动行业进一步发展。Speak受投资者青睐有多方面的原因,其中,OpenAI从2022年开始投资Speak,帮助其超AI口语方向快速发展。
OpenAI不只是公司的财务投资者,Speak的整套技术体系也建立在OpenAI的AI模型和最新前沿语音技术之上。OpenAI创始人Sam Altman曾多次提到“对 AI 将对教育产生的影响尤为兴奋”。
Speak由 Andrew Hsu 和 Connor Zwick 于 2016 年在美国创立,目标是能让人开口说英语,最初采用真人录制的视频课程授课,主要针对韩国市场。在大模型出现后,Speak重构产品功能,主打以特定场景为核心的口语练习和以GPT技术支撑的角色扮演,并拓展到如日本、德国、法国、巴西、墨西哥等国家。
大模型的到来,Speak可以为用户提供更准确的实时反馈、提升用户的语言学习体验。可以说,Speak融入大模型后,让学习者以低成本拥有一对一的个性化语言学习老师,且基于学习者的情况生成个性化课程,达到口语的流利性。
目前,Speak以 to C为主,今年也拓展了to B业务。
根据官方披露,今年,Speak创建了超过2500万个个性化课程。到目前为止,用户已经用Speak进行超过10亿句练习。
Speak 企业级业务 Speak for Business 可以练习特定的商务对话,例如与供应商和客户的讨论。 目前,Speak for Business 拥有超过 200 个客户,员工采用率为 85%。
Speak 联合创始人兼首席执行官 Connor Zwick曾对OpenAI方面解释,“Speak是装在口袋里的AI语言老师”,此次融资,他还在官方博客中透露了下一年的计划,他说:“2025 年, Speak 计划推广到更多国家。”此外, 2025 年,Speak将语言范围扩大到英语以外的领域,目前已经支持8种语言。
Connor Zwick 表示,Speak的价值主张是教人们如何用语言交流,同时,Speak潜在的市场总和大约有15亿人。
Speak的发展路径值得教育科技领域关注,VisionFlow创始人刘夜对多知分析:“第一,Speak是第一个最早做AI口语针对韩国刚需人群的产品,它是线下口语培训班的延伸,填补了AI口语场景的空白;第二,Speak最早跑通了商业闭环,年ARR(Annual Recurring Revenue,经常性收入)达5000万美元;第三,前期OpenAI投资亦是助力。”
在一位不愿具名的教育行业创业者对多知说,Speak因为有OpenAI Startup Fund 等投资方的加持,资金充沛,本地化课程做得非常出色,课程内容可以根据运营区域进行定制,且Speak在线上线下运营花了很多功夫。
在刘夜看来,从Speak的C端产品体验来说,其实还有很长路要走。这场战斗还远远没有结束,未来肯定会出来比Speak更擅长做用户体验的公司冒出来,甚至有可能反超。
01
第一波拥抱AI技术的教育企业,并跑通商业模型
Speak 瞄准口语对练场景,是第一波拥抱GenAI技术的教育科技企业,其希望通过 AI 讲师让用户像和真人教师对话一样帮助学习者进行口语练习,再基于 AI 提供的发音、语法、词汇等方面实时反馈不断完善语言学习。
据了解,Speak跑通了商业模式,尽管Speak并未公布活跃用户数量,但联合创始人& CTO Andrew Hsu 提到,Speak应用的下载量已超过 1000 万次,每位用户每天的使用时间约为 10-20 分钟。另据“投资实习所”预测,Speak的年ARR为5000万美元,每年增长率达100%。
Speak在产品和运营方面有其独到之处:
在产品方面,Speak注重细节。首先,Speak根据用户的测试,生成一套符合用户水平和兴趣点的课程。课程主要分为视频课程、口语练习、角色扮演。会先播放一段真人录制的视频给用户观看,详细讲解一些基础的语法和用法。然后是口语练习,可以实时给出反馈和评分,完成后进入角色扮演环节,这集成了 GPT-4的技术能力。
与任意聊不同,Speak口语练习提供了特定的场景,比如交新朋友、在耐克商店、在咖啡店、在课堂上等学习场景(不同国家场景有所不同),使学习者能够通过模拟日常环境进行交互,对话还会给出提示,这种单一的学习路线让学习者有的放矢。
在这种高频对话的练习下,Speak称,用户使用第一周的平均说话量就能达到1000多句。
今年10月,在OpenAI 的Realtime API提供的技术支持下,Speak重构的产品,最新功能之一 Live Roleplays(实时角色扮演)正式推出。它以语言电话的形式让用户可以实时与AI沟通,系统可以根据用户的熟练程度自动调整 AI 语音的句型和词汇量。此外,该功能还会显示学习目标和语言提示,让学习过程不卡壳。
Live Roleplays使应用程序能够处理来自用户的语音输入并使用 GPT-4o 生成响应,它承诺通过跳过通常涉及音频处理的几个步骤来减少响应延迟。
Speak在融资后会将引入更多学习机制,但不会牺牲学习效果。Speak CEO表示:“当需要在游戏化、用户参与度以及有效性之间进行取舍时,将 100% 选择学习有效性。”
运营方面,在不同国家有不同的课程方案,也非常重视用户运营。多知观察到,在用户注册Speak之后,会不定期发出各种促销、调研等相关邮件推送,唤醒沉睡用户,甚至试图将转化付费用户。
Speak没有免费模式,付费才可以使用,在开启订阅后有 7 天免费试用期。订阅选项的价格约为每月 20 美元或每年 99 美元,这比线下口语学习便宜得多。
当前,Speak 有75人,两个创始人均为“技术天才”,其中CEO Connor Zwick 对语言学习领域有多年的积累。
Connor Zwick中学时就开始学习编程,在高中时就创建了语音学习应用 Flashcards Plus,通过把语音单词和短语制作成电子学习卡片,让用户反复练习学习语言,这款产品全球有500万用户,2013 年被Chegg收购,Connor 因此获得进入哈佛大学学习的机会。
Speak 联合创始人兼首席技术官Andrew Hsu为华裔,在美国长大,拥有华盛顿大学的神经生物学、生物化学和化学学位。后来他在斯坦福大学攻读神经科学博士学位,但 19岁时退学,加入了 Thiel Fellowship( PayPal联合创始人Peter Thiel创办,旨在为23岁以下的学生提供两年总计10万美元的资助,并提供创业指导和其他资源,但要求创业者必须辍学一两年),在那里他遇到了 Zwick。
02
“15亿用户的大市场”
Speak填补了口语对练的空白,以此为切口,未来在语言学习方面有更多的可能性。
在Connor Zwick看来,Speak的总目标市场达到15亿用户。另外,根据咨询公司 HolonIQ 测算,全球有约20亿人在学习新语言(不单指英语),线上、线下的语言学习消费支出约600亿美元。
语言学习市场可能会容得下多家独角兽公司,当前,全球已经有多个项目瞄准语言学习。比如,美国上市公司多邻国,当前月活跃用户过亿。2024年第三季度多邻国付费用户同比增长48%,达到860万。
多邻国创办于2011年,采用游戏化学习的方式,有连胜机制等催学方式增强用户粘性,多邻国App以语言学习为起点,后又拓展了音乐、数学品类。此外,多邻国还有考试类产品——多邻国英语测试。
多邻国亦是第一波拥抱GenAI的企业,在功能上,Speak与多邻国殊途同归。多邻国在GPT-4的加持下开发了 “Explain My Answer”和“Roleplay”等功能,这两项与Speak的对话练习和角色扮演也有相似之处。今年,多邻国还推出了视频通话与多邻国大冒险功能,Speak最新推出的Live Roleplays与多邻国的视频通话也类似。
全球市场上包括国内还有更多的AI口语项目,越来越多的创业者进入“AI+语言学习”领域,比如,ELSA Speak、TalkAI、Talkit、TalkMe、AI外教等,但是各家的产品有一些差异化。对于下一步来说,各家将比拼技术的融合和产品的体验。
此外,在免费的一些对话产品中,也有口语对练的功能,如 ChatGPT、Call Annie、豆包等,但是,这些产品不是专门的教育产品,都是任意聊,而这对很多学习者来说不知道如何聊得顺畅,也不知道自己的薄弱之处,更不知道下一步如何提升。
总体而言,如Speak这种专门针对学习者的语言学习产品有底层教研的能力,这是他们独特的优势。
Speak新一轮融资有望使其在竞争中抢得先机,加速成长。而对于其他企业来说,“依然有机会反超,这场战斗远远没有结束。”