内测探索的伙伴包括教育企业,如VIPKID。

出门问问大模型和CoPilot产品矩阵来了,李志飞:未来十年All in AGI

2023-04-22 11:10:40发布     来源:多知网    作者:Penny  

  来源|多知网

  作者|Penny

  图片来源|出门问问

  第一代AI创业公司出门问问继续加码AI。

  4月20日,出门问问宣布内测探索大模型「序列猴子」,出门问问创始人、CEO李志飞看来,大模型的最好工作,是做人类的CoPilot/助理,因此发布了CoPilot产品矩阵,包含了四款AIGC产品,分别为AI写作平台“奇妙文”、AI绘画平台“言之画”、AI配音平台“魔音工坊”、数字人视频与直播平台“奇妙元”。

  发布会上,李志飞提到,出门问问面向C端的升级版语音助手魔法小问,面向B端的企业专属大模型的内测探索。当前,内测的领域包括汽车、教育、律所等。

  出门问问成立于2012年,为全球的消费者、企业提供人工智能产品和服务。其中包括智能手表TicWatch系列、AI真无线智能耳机TicPods系列等。在此次发布会之前,出门问问就已经探索大模型,且做了多个AIGC产品,如魔音工坊、奇妙元。

  李志飞为国内第一代AI创业选手,他是科班出身,可谓是AGI(通用人工智能)的“信徒”。他是美国约翰霍普金斯大学计算机系博士,前Google总部科学家,自然语言处理及人工智能专家。

  在ChatGPT横空出世之后,李志飞第一时间拜访了美国的OpenAI、Google等公司,试图揭开大模型的奥秘。很快,全国处于言必谈“ChatGPT”,每天有密集的信息,所有企业几乎达成了共识——不能错过这波浪潮。

  这四五个月以来,李志飞的心态已经发生变化。李志飞接受腾讯科技等媒体采访时谈到,从最初要做中国的OpenAI,到现在认为“完全复制OpenAI非常难”。

  这一变化是因为李志飞看到国内的供给侧太多了,想法的转变直接决定了这次发布会的内容:在出门问问基础上,一方面做大模型底层能力,另一方面做基于大模型的各种应用,且连接公司已有业务。

  对于未来,李志飞称要坚持长期主义,他在朋友圈提到:“未来十年,不忘初心,All in AGI。”

  01

  大模型“序列猴子”来了,内测领域包括教育

  出门问问大模型“序列猴子”是一款具备多模态生成能力的大语言模型,模型以语言为核心,涵盖“知识、对话、数学、逻辑、推理、规划”六个维度,能够同时支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。

  不过,当前的“序列猴子”大模型主要是文本形式,未来会实现多模态。

  2021年6月,出门问问曾推出过大模型UCLAI,但当时因为缺乏学术研究,且陷入商业模式的窘迫。2022年10月,出门问问重拾大模型的研发。

  据李志飞介绍,“序列猴子”这个名字的灵感,来源于数学家埃米尔·波雷尔在20世纪初提出了“无限猴子”定理,即只要给予无限时间,一只猴子几乎必然能够打出任何文字,比如莎士比亚的《哈姆雷特》,而如果喂给机器猴子海量的文本序列,通过大规模算力去训练它,就能练就有智能的“序列猴子”,而大模型是一个序列模型。

  李志飞称,“序列猴子”在训练过程中已经展现出了“涌现”能力,目前正处于“顿悟”阶段,未来提升的速度会越来越快。

  在针对个人应用方面,李志飞现场演示,比如回答“湖南和湖北哪一个省会的人口更多?”、“天猫背后的公司的创始人本科毕业于哪个学校?”等问题,可以应对自如。

  在B端,李志飞透露,“序列猴子”企业专属大模型已在首批汽车、教育、律所、金融、运营商、旅行、传媒、设计、智能硬件、医疗十大行业内测探索伙伴,企业方包括中国移动、中国工商银行、中国一汽红旗、春秋航空、VIPKID等。

  发布会上,VIPKID 创始人米雯娟以视频的形式出现在发布会上,提到将会和出门问问一起探索 “AI+ 教育”的新可能。

  对于国内与海外大模型的差距,李志飞说,“国内模型水平大概处于FLAN阶段,比GPT4晚16个月。”FLAN是谷歌在2022年1月发布的模型。

  对于自家的大模型,李志飞很有信心,他说:“如果说GPT-4是100分,我们的目前是50分,市面上有的模型可能是33分。”

  

  (出门问问官网截图)

  02

  未来CoPilot/助理将无处不在

  李志飞认为,未来,个人与企业专属的CoPilot将无处不在。为此,出门问问推出了CoPilot产品矩阵。

  1)奇妙文:AI写作助理

  发布会上第一个亮相的CoPilot产品是“奇妙文”AI写作助理,AI写作能力覆盖了职场办公、市场营销、新媒体和创意写作四大内容创作场景,可以帮助用户在撰写年终总结、客服话术、剧本、广告文案等内容时,提供灵感和创意方向。

  “奇妙文”有八大AI编辑功能,分别为风格转化、要点提取、校对纠错、续写、改写、扩写、缩写、翻译,“奇妙文”还能在写作中自动生成图片。

  2)言之画:AI绘画助理

  “言之画”是AI绘画平台,服务于设计师、插画师。“言之画”支持二次元、蒸汽朋克、插画等8种创作风格。用户只需输入文字,“言之画”就能一次性生成8张光影逼真、细节丰富的2K高分辨率图像。

  除了以文生图,它还拥有以图生图、动图生成、个性头像生成等AI绘图能力。对于企业用户,“言之画”还支持专属模型定制,能够根据企业风格定义模型风格,并且支持多人协作生产。

  3)魔音工坊:AI配音助理

  面向AI配音场景,出门问问推出了新一代AI配音产品“魔音工坊”。“魔音工坊”(海外版DupDub)已经开放了超1000种音色、超2000种声音风格以及超20种方言和外语。

  “魔音工坊”搭载了大模型AI写作功能,可以进行AI写作、AI配音和剪辑等多个场景,在它的辅助下,用户可以完成影视解说、有声书、在线教育、新闻播报等集文案与配音于一体的内容创作。

  目前,“魔音工坊”已经与微信读书、少年得到、大众等多个行业的头部企业达成了合作。

  4)奇妙元:AI数字分身

  在文字、图像、声音等生成能力基础上,出门问问还退出了AI数字形象创作及直播平台“奇妙元”。

  据介绍,“奇妙元”平台现有超100款数字人、超1000款3D数字资产、超1000种声音。凭借多模态生成技术,“奇妙元”平台目前共支持图片建模(2D数字人)、视频建模(2.5D数字人)、3D建模 (3D数字人)三种不同形式的数字人生成。

  形象克隆功能,仅需一段5分钟的真人视频素材,即可1:1复刻用户的形象神态,为用户打造声音一致、动作自然的数字人分身。

  此外,出门问问还升级语音助手,发布会上推出“魔法小问”,李志飞称,这款智能语音助手可以理解为是“Siri与ChatGPT的综合体”。

  根据介绍,“魔法小问”可以帮助用户查百科信息、查天气、查餐厅、查酒店,还能与用户对话聊天。在现场演示中,比如向“魔法小问”提问“这附近有哪些好吃的川菜馆”时,它能按照远近距离、评分星数列出附近推荐的川菜餐厅。

  出门问问早在2014年就发布了首款语音助手“小问助手”;2015年,更新“小问秘书”;2017年,推出了全场景VPA,并在2019年进行升级,这一次的“魔法小问”可谓是更智能。

  随着新老选手加入“大模型”的竞赛,这个领域越来越卷了,但是,最后成功者可能是少数,各家未来的发展值得关注。