孩子可以发挥想象力基于AI创作绘本。

小度新物种:添添AI平板机器人来了

2024-04-16 18:26:03发布     来源:多知    作者:徐晶晶  

  来源|多知

  作者|徐晶晶

  “截至目前,小度自主品牌设备服务了4600万个家庭,同时小度AI智能助手广泛搭载在超7亿台智能设备上(小度“大脑”DUEROS累计激活设备7亿台)。”

  在今日举行的Create 2024百度AI开发者大会上,小度科技CEO李莹披露了小度的成绩单。

  小度系列产品还有哪些创新的可能性?

  在这次大会上,小度正式发布了一个“AI伙伴”——添添AI平板机器人。目前该产品已上线各大电商平台,预售尝鲜价为3699元。

  情感陪伴、影音娱乐、AI健身和AI轻办公,是添添AI平板机器人的四个核心场景。其中,在情感陪伴里,AI数字人陪伴儿童、AI绘画场景值得关注。

  团队内部称其为“小度AI的集大成者”。

  李莹则笃定,未来小度将会成为人人都能拥有的AI伙伴,“它是有用的,更是有灵魂的”。

  01

  可以随人转动、有丰富表情的平板机器人

  这次发布的添添AI平板机器人,既是AI平板,又是品质音箱。从外形上看,半球形的音箱底座上,用支架支撑着一个可以旋转的12.1英寸平板。

  关于添添AI平板机器人的硬件定义,小度科技信息娱乐业务部总经理贾振超分析:

  “我们过去一直思考,有着一个家庭生活好伙伴属性的硬件载体,到底该拥有哪些特点,应该定义哪些必须的功能。

  答案是,首先它得是一个高品质的平板,得拥有高清画质的护眼类大屏,要有普通平板所没有的震撼音效,用这一系列的硬件特性来满足用户在追剧、音乐、轻办公等场景上的需求。

  其次,用户的家庭出行、办公等场合的使用也需要覆盖。因此我们定义了平板、音箱、机器人三种形态,随意切换,走到哪儿用到哪儿,而且体验度超级棒。

  最后,为了进一步的提升用户的体验,我们让机身拥有了近乎可360度自由旋转的能力,加上前置的双高清摄像头,配上小度的人脸跟踪和智能跟随算法,为追剧、视频通话、家庭安防和家庭看护带来远超市场上其他竞品的体验。”

  

  (注:添添AI平板机器人可以实现人脸追随,水平360°面部智能追随。这意味着,用户在借助添添AI平板机器人视频通话、远程会议时,能时刻保持居中。据透露,智能跟随准确率为98.8%。)

  李莹表示,对比以前的小度智能音箱,添添AI平板机器人更加聪明、更加能干、更懂用户。

  更加聪明,体现在语音交互上,用户可以更加自由地与其交流,借助大模型,其可以实现深度的多轮对话交互,甚至还能预测用户的意图,并且动发起后续的追问。“不会像以前的智能音箱一样很容易把天聊死了。”李莹说。

  以下是大会现场展示的一段用户的真实录音:

  用户:今天我在公园看到一只超可爱的小狗。

  小度:看到可爱的小狗,总能让人心情愉快。它是什么品种的呢?

  用户:我也不认识,它穿了一件超人的背心,在跟主人跑步,好萌啊。

  小度:啊,原来是这样,看到小狗跑步,是不是觉得它很有活力呢?

  用户:对,我很喜欢小狗的。

  小度:喜欢小狗是很多人的天性,他们总能给我们带来快乐和陪伴。你喜欢什么品种的小狗呢?

  用户:我喜欢哈士奇。

  小度:哈士奇以独特的蓝色眼睛和丰富的表情而闻名。你是不是也觉得它们特别可爱,有打算养一只吗?

  用户:有点担心它拆家呢,还在犹豫中。

  小度:哈哈,它确实让人又爱又恨。

  在大会现场,百度创始人、董事长兼CEO李彦宏现场演示了添添AI平板机器人的功能。

  他通过多轮对话让小度制定日程:“小度,帮我安排一下日程。今天活动结束之后,我会和张总一起晚餐。之后,在酒店有个管理层的会议,大概要一个半小时,希望十点之前结束。明天早晨我准备晨跑,看看天气怎么样,然后上午八点有个早会,请帮我安排好这些日程。”

  

  小度随即清晰利落地给出了回复:“根据您的需求,小度给您制定最优的日程安排如下:您与张总晚餐安排在18点至19点30分。结束后,在20点参加管理层会议,21点30分左右结束。明早六点闹钟将提醒您起床去晨跑,跑步时长控制在1个小时以内,确保明早八点早会不迟到。明早天气阴转多云,气温25度,建议穿着轻便透气的服装,并准备轻薄长袖应对天气变化。”

  其实,李彦宏下达的指令需求非常复杂,涉及预估用时、跨天日程安排、闹钟设置、天气查询、根据天气提供着装建议等。但是这款机器人都能够理解这些指令,并且能够做出合理的安排和提醒。

  更加能干,体现在:

  为满足不同用户的不同需求,添添AI平板机器人能够灵活调用各种专业的智能体。这意味着,“现在小度不是一个人在为你服务,而是身后站着一群智能体的医生、老师、律师、国学大师、星座达人、健身教练等等。用户需要哪一位数字人,就可以请哪一位出来”。

  全新换脑的小度可以成为用户的AI闺蜜、AI教练、AI家教、AI健康顾问、AI管家等等。

  李莹特别强调,就小度AI家教来说,其并非提供简单的搜题、批改作业,而是针对孩子学习的全场景,用AI诊断帮助孩子规划个性化的学习路径,涵盖课前的预习,课中的练习,还有课后的复习。

  更懂用户则体现在,“过去小度都是以助手的身份帮助用户完成各种任务。全新升级的小度,不但能干更多的事儿,也更懂你,能够记住跟你生活在一起的点点点滴滴,变得更有人情味,为我们提供情绪价值。”

  以下是一个例子:

  用户:小度小度,早上好。

  小度:早上好。

  用户:夏天马上来了,我必须要减肥了,以后晚上只吃水果,给我推荐几款减肥水果吧。

  小度:其实你喜欢吃的火龙果、苹果、菠萝就很适合,还有猕猴桃、圣女果、葡萄柚、蓝莓,这些也是很好的选择。

  用户:那你帮我定个日程,每天晚上提醒我吃水果,并且每天不重样。

  小度:好的,那我就在每天晚上六点提醒你吃不重样的水果。

  用户:好的,谢谢你,来点音乐听听。

  小度:好呢,让我们随着元气满满的节奏一起迎接夏天吧(音乐起)……

  02

  情感陪伴:孩子可以用想象力基于AI创作绘本

  在分论坛上,贾振超系统梳理了添添AI平板机器人的四个核心场景:情感陪伴、影音娱乐、AI健身和AI轻办公。

  在情感陪伴方面,贾振超详细介绍了几个功能:

  1.超级表情。

  基于大模型,机器人可以理解用户的喜怒哀乐。作为一个AI伙伴,现在的小度不仅特别会聊天,其声音也更拟人化,而且还有很多丰富的表情:你开心,它朝你做个鬼脸;你过生日,机器人会放烟花、吹气球;你表扬它,它还能给你比心。

  

  据小度首席研发架构师黄荣升透露,其表情互动准确率超过90%。

  2.AI数字人。

  团队基于大模型训练对话聊天能力,赋予每个数字人不同的人设,匹配的音色,尤其是面向儿童人群为数字人定制一系列可爱形象。

  

  贾振超透露,内测用户中,有家长反馈,家里的小朋友会将烦恼一件一件倾诉给屏幕里的数字人。

  

  3.儿童成长的AI绘画场景功能。

  这包括AI魔画(孩子寥寥几笔的画,AI可以将其展开成一幅美妙画作)、AI绘画导师(指导孩子绘画并点评)、AI绘本(孩子可以基于想象力制作绘本)三个功能。

  据黄荣升介绍,AI绘画导师功能里,简笔画Caption(给图片加说明文字)为85.2%,“我们自己内部评测,这个成绩比全球SOTA大模型效果还好。”

  据透露,接下来,团队还会在添添AI平板机器人上研发面向孩子的AI音乐创造功能,进一步挖掘孩子在艺术方面的创作力。

  4.小度星球。

  黄荣升判断:“大模型时代有两个趋势。其一,对话LUI交互成为趋势,让交互门槛进一步降低。其二,会产生新的用户入口级的流量红利。门槛的降低,使‘一老一小’两个群体使用大模型的频次变高。”

  他透露,“目前小度是最大的自然语言对话流量平台。”

  

  因此,在添添AI平板机器人上,还有一款角色扮演类的应用——小度星球。这个应用开发周期仅用了两周时间,但其流量大,该应用在小度平台上活跃用户超过百万,语音交互调用次数超过千万,超出了内部的预期。且效果好,平均对话轮数相比上一代的最好的技术提升五倍。

  在影音娱乐方面,据介绍,影音娱乐是小度设备最大的用户场景。利用文心大模型和多模态大模型,小度在文本理解、视觉理解、记忆和推荐方面,有了很大进步。

  例如,要求小度播放下饭神剧时,小度会立即为用户播放爱看的剧。当用户问及(剧里正在吃的)这个面有什么特点时,小度会说:“猪脚面是广东一带传统风味小吃,属于月菜系,你家附近也有,可以尝尝。”

  这段对话的难点包括:能播放下饭神剧,指向的是小度可以记住用户的历史喜好;剧情图片中的面,小度可以识别出来;猪脚面的特点,通过搜索和大模型得到答案。

  值得一提的是,该机器人还有音乐场景的“情绪歌词”功能。在一首歌播放过程中,添添AI平板机器人可以识别歌词情绪意图,生成匹配歌词视频,让用户拥有沉浸画面感。

  在AI健身方面,该机器人内置AI健身课、AI教练、AI虚拟试衣、健康饮食功能等。

  在AI轻办公方面,包括上文提到的AI日程(AI日程也已上线小度App,可实现跨端使用)、AI笔记、图文翻译、老照片修复等功能。

  贾振超称添添AI平板机器人为“小度AI的集大成者”。

  李莹则坚信,“小度将会成为人人都能拥有的AI伙伴,它是有用的,更是有灵魂的。”

  03

  小度完成了一次具有里程碑意义的“换脑革命”,迎来“最强大脑”

  这一切都源于小度拥有了全新的大脑。

  据介绍,添添AI平板机器人搭载的是全球首个AI原生操作系统——DUEROS X。

  李莹强调了它的革新意义:“DUEROS X彻底颠覆了传统的人适应系统的陈旧模式。我们真正做到了端到端地连接用户的需求和任务。这个创新极大地拓展了操作系统的边界。在AI时代,我们认为DUEROS X无疑会成为引领行业发展的重要标志。可以说,小度完成了一次具有里程碑意义的‘换脑革命’,这是小度在大模型时代的一次质的飞跃。我们将迎来小度的‘最强大脑’。”

  据介绍,小度这一次“换脑革命”是DUEROS X基于文心大模型实现的全面重构。

  在模型层,基于MOE模型路由的架构,它能够灵活调度不同的模型以解决不同难度的问题,更高效,更经济,也会更精准。另外还有一个特色,其有长短的个性化的记忆的存储提取和理解的能力,它能够清楚地记住历史的内容和用户的个性化偏好。“用户用得越多,小度就会越懂用户。”

  在交互层,小度的多模态感知的技术应用,让DUEROS X产生了更加发丰富的感知力。不论拥护通过语音、文字还是手势表情来跟小度沟通,它都能够准确地理解用户的意图,并且给出恰当的回应。同时小度也有拟人化的呈现,让它的表情和形象更加生动有趣,声音也更自然和灵动,甚至能通过它的动作来表达出它的情绪和个性。

  在生态层,小度本身已经拥有了1.1万个语音技能。通过文心智能体的生态开发出来的应用,都能够无缝接入到小度,极大扩展了DUEROS X的生态宽度。这些应用不仅仅具备专业的知识和技能,在小度上还可以根据用户的喜好和需求进行个性化的定制,提供贴心便捷的服务。

  “正是通过对模型层、交互层、生态层的重构,DUEROS X作为全新的AI native OS,支撑小度完成了全面的换脑,为我们带来前所未有的智能体验。我们坚定认为DUEROS X是小度软硬一体智能化的立身之本,也是小度脱离存量竞争的秘钥。”李莹说道。

  END

  本文作者:徐晶晶