来源|多知
作者|王上
12月3日,谷歌旗下最火爆得大模型产品NotebookLM团队负责人宣布离职创业的消息引发关注。而其背后的AI播客领域正在持续走红。
NotebookLM原本是AI云笔记软件,让其出圈的是其今年10月推出的AI播客功能,仅需一个链接或文档,它几分钟就能转成像说相声一样的男女英语对谈,俗称“AI播客”。AI大佬Andrej Karpathy曾称赞NotebookLM“点亮了LLM的新交互范式”。
在很多网友看来,“NotebookLM是一款非常适合学习的AI应用。”
到现在,根据NotebookLM团队负责人Raiza Martin透露,NotebookLM已经有数百万用户。
虽然NotebookLM团队离职创业,但是,NotebookLM这款产品将继续在谷歌发挥作用。根据techradar报道,NotebookLM即将被集成到手机中的谷歌大模型Gemini中。
与此同时,AI播客越来越火,语音 AI 初创公司ElevenLabs近日推出了一项类似于NotebookLM的AI播客功能;在中国也有一款类似应用,名为“PodLM”,可以将URL、文本或文档转化为中文播客。
可以看到,在文生文、文生图之后,AI音频领域开始火爆,而这将极大方便内容创作者、营销人员和教育工作者等。对于传统音频类的平台来说,机遇与挑战并存。
对教育领域而言,AI教育播客可以支持多样化的学习风格并提高学习效率;多语言 AI 播客将是语言习得和练习的新方法;还可以把课本上的内容提炼成播客给孩子做熏听。
01
AI音频的价值被持续挖掘
12月3日,NotebookLM团队负责人Raiza Martin自爆将离职引发热议,这背后则是对AI音频领域的关注。
Raiza Martin在自己的社交媒体上发布:
“在谷歌干了 5.5 年,今天是我的 Last day。领导见证 NotebookLM 从一个想法,演变为服务数百万人的产品,这是令人一生难忘的经历。
而最棒的一点是,我在战壕中找到了创业旅途上的联合创始人们。”
和Raiza Martin一起离职创业的还有 NotebookLM 设计师 Jason Spielman和核心工程师 Stephen Hughes。
Raiza Martin新的创业项目还未揭晓,但根据她回复的信息看到,依然是大模型相关方向。
NotebookLM于2023年7月推出,最初是一款AI云笔记软件,基于用户上传的文档内容(包括Google文档、幻灯片、PDF、文本文件、网页链接等),可以生成长文本摘要、多语言会话、提纲、常见问题解答、学习指南等内容。
NotebookLM原本在AI笔记方面比较平淡,在今年10月推出AI播客功能后大火,用它可以对论文、书籍、故事等转化成AI短音频。
AI音频的价值正在被持续挖掘。
曾在特斯拉、OpenAI任职,现在正创办AI原生学校的AI大神Andrej Karpathy 曾这样总结:NotebookLM 消除了人们享用大模型的两大障碍。
第一,聊天有门槛。跟 Chatbot 聊天还得掌握一些技巧,不停地提问、追问。
有了 NotebookLM,自动生成的播客中,自然会有一方替你扮演提问、引导的角色,用户只要负责听就可以了。
第二,阅读不是件容易的事情。听播客比看文字轻松多了。
可以说,NotebookLM是ChatGPT之外的另一种AI范式。
02
人人可以做AI播客的时代来了
当前,做AI音频的企业也多了起来,可以说,人人可以做AI播客的时代来了。
初创公司ElevenLabs被视为NotebookLM最大的对手。
一周前,AI初创公司ElevenLabs推出了一项类似于NotebookLM的功能,可让用户上传不同类型的内容来创建播客。
该功能名为 GenFM,可在该公司的 ElevenLabs Reader iOS 应用程序中使用。目前,GenFM 支持 32 种语言,包括英语、印地语、葡萄牙语、中文、西班牙语、法语、德语、日语等。
要使用 GenFM,用户首先要上传 YouTube 视频、文本或文档。然后,可以应用自动挑选两个声音来创建播客。该公司指出,有十几种声音可供选择。
值得注意的是,当应用程序准备GenFM生成的播客时,用户还可以添加一些“嗯”和“啊”等语气词,甚至可以添加笑声和呼吸等元素,强调人类真实对话的状态。
ElevenLabs 成立于2022年,核心团队主要包括来自谷歌、微软、亚马逊等知名科技公司的前员工,他们在人工智能领域具有深厚的专业知识和实践经验。公司目前拥有约40名远程办公员工,分布在全球各地,并计划到2025年底将团队扩大至100人。
2024年1月,ElevenLabs在最新一轮融资中成功筹集了8000万美元,使其估值急速飙升至11亿美元,正式跻身独角兽行列,并入选福布斯AI 50强。ElevenLab得投资方包括Andreessen Horowitz、Nat Friedman、Daniel Gross共、红杉资本、Smash Capital、SV Angel、BroadLight Capital以及Credo Ventures等。
在中国,也有一款AI播客生成平台——PodLM.ai,它能够将文本、文档或网址内容转换为播客音频。它官网上说是“NotebookLM的替代品”,据了解,这是由独立开发者idoubi开发的。目前还在比较早期的阶段,使用上还不算流畅,但优点在于支持中文。
一个有关“听”的新领域被打开了。