AI音频的价值被持续挖掘。

谷歌NotebookLM带火AI播客,人人可学口语、听课本内容

2024-12-04 23:23:24发布     来源:多知    作者:王上  

  来源|多知

  作者|王上

  12月3日,谷歌旗下最火爆得大模型产品NotebookLM团队负责人宣布离职创业的消息引发关注。而其背后的AI播客领域正在持续走红。

  NotebookLM原本是AI云笔记软件,让其出圈的是其今年10月推出的AI播客功能,仅需一个链接或文档,它几分钟就能转成像说相声一样的男女英语对谈,俗称“AI播客”。AI大佬Andrej Karpathy曾称赞NotebookLM“点亮了LLM的新交互范式”。

  在很多网友看来,“NotebookLM是一款非常适合学习的AI应用。”

  

  到现在,根据NotebookLM团队负责人Raiza Martin透露,NotebookLM已经有数百万用户。

  虽然NotebookLM团队离职创业,但是,NotebookLM这款产品将继续在谷歌发挥作用。根据techradar报道,NotebookLM即将被集成到手机中的谷歌大模型Gemini中。

  与此同时,AI播客越来越火,语音 AI 初创公司ElevenLabs近日推出了一项类似于NotebookLM的AI播客功能;在中国也有一款类似应用,名为“PodLM”,可以将URL、文本或文档转化为中文播客。

  可以看到,在文生文、文生图之后,AI音频领域开始火爆,而这将极大方便内容创作者、营销人员和教育工作者等。对于传统音频类的平台来说,机遇与挑战并存。

  对教育领域而言,AI教育播客可以支持多样化的学习风格并提高学习效率;多语言 AI 播客将是语言习得和练习的新方法;还可以把课本上的内容提炼成播客给孩子做熏听。

  

  

  

  01

  AI音频的价值被持续挖掘

  12月3日,NotebookLM团队负责人Raiza Martin自爆将离职引发热议,这背后则是对AI音频领域的关注。

  Raiza Martin在自己的社交媒体上发布:

  “在谷歌干了 5.5 年,今天是我的 Last day。领导见证 NotebookLM 从一个想法,演变为服务数百万人的产品,这是令人一生难忘的经历。

  而最棒的一点是,我在战壕中找到了创业旅途上的联合创始人们。”

  

  和Raiza Martin一起离职创业的还有 NotebookLM 设计师 Jason Spielman和核心工程师 Stephen Hughes。

  Raiza Martin新的创业项目还未揭晓,但根据她回复的信息看到,依然是大模型相关方向。

  NotebookLM于2023年7月推出,最初是一款AI云笔记软件,基于用户上传的文档内容(包括Google文档、幻灯片、PDF、文本文件、网页链接等),可以生成长文本摘要、多语言会话、提纲、常见问题解答、学习指南等内容。

  NotebookLM原本在AI笔记方面比较平淡,在今年10月推出AI播客功能后大火,用它可以对论文、书籍、故事等转化成AI短音频。

  AI音频的价值正在被持续挖掘。

  曾在特斯拉、OpenAI任职,现在正创办AI原生学校的AI大神Andrej Karpathy 曾这样总结:NotebookLM 消除了人们享用大模型的两大障碍。

  第一,聊天有门槛。跟 Chatbot 聊天还得掌握一些技巧,不停地提问、追问。

  有了 NotebookLM,自动生成的播客中,自然会有一方替你扮演提问、引导的角色,用户只要负责听就可以了。

  第二,阅读不是件容易的事情。听播客比看文字轻松多了。

  可以说,NotebookLM是ChatGPT之外的另一种AI范式。

  02

  人人可以做AI播客的时代来了

  当前,做AI音频的企业也多了起来,可以说,人人可以做AI播客的时代来了。

  初创公司ElevenLabs被视为NotebookLM最大的对手。

  一周前,AI初创公司ElevenLabs推出了一项类似于NotebookLM的功能,可让用户上传不同类型的内容来创建播客。

  该功能名为 GenFM,可在该公司的 ElevenLabs Reader iOS 应用程序中使用。目前,GenFM 支持 32 种语言,包括英语、印地语、葡萄牙语、中文、西班牙语、法语、德语、日语等。

  要使用 GenFM,用户首先要上传 YouTube 视频、文本或文档。然后,可以应用自动挑选两个声音来创建播客。该公司指出,有十几种声音可供选择。

  值得注意的是,当应用程序准备GenFM生成的播客时,用户还可以添加一些“嗯”和“啊”等语气词,甚至可以添加笑声和呼吸等元素,强调人类真实对话的状态。

  

  ElevenLabs 成立于2022年,核心团队主要包括来自谷歌、微软、亚马逊等知名科技公司的前员工,他们在人工智能领域具有深厚的专业知识和实践经验。公司目前拥有约40名远程办公员工,分布在全球各地,并计划到2025年底将团队扩大至100人。

  2024年1月,ElevenLabs在最新一轮融资中成功筹集了8000万美元,使其估值急速飙升至11亿美元,正式跻身独角兽行列,并入选福布斯AI 50强。ElevenLab得投资方包括Andreessen Horowitz、Nat Friedman、Daniel Gross共、红杉资本、Smash Capital、SV Angel、BroadLight Capital以及Credo Ventures等。

  在中国,也有一款AI播客生成平台——PodLM.ai,它能够将文本、文档或网址内容转换为播客音频。它官网上说是“NotebookLM的替代品”,据了解,这是由独立开发者idoubi开发的。目前还在比较早期的阶段,使用上还不算流畅,但优点在于支持中文。

  

  一个有关“听”的新领域被打开了。