态度很好,但内容还需努力。

我们向字节版GPTs“扣子”提出问题后,发现了更多问题

2024-02-02 07:17:17发布     来源:多知网    作者:冯玮  

     字节跳动正式推出AI聊天机器人构建平台Coze国内版(中文名:扣子)。

  官方介绍“扣子是新一代的 AI Bot 开发平台,只要你有想法,都可以用扣子快速、低门槛搭建专属于你的 Chatbot,并一键发布到豆包、飞书、微信公众号等各个渠道!”

  扣子由字节跳动新成立的AI部门Flow开发,后者目前已经上线的业务有豆包和Cici两款产品,此次的Coze国内版与去年先在海外上线的Coze海外版功能基本接近。

  在使用时,用户只需要在平台上直接输入“我想创建一个 Bot”,扣子就可以给出Bot创作灵感。

  扣子还提供了Bots商店和插件,精选的Bots中有“工具、娱乐、生活方式、咨询、创意和学习”方向。

  体验地址:https://www.coze.cn/home

  多知选择了其中看起来适合学生和家长需求的几款,包括童话世界,书法老师、数学老师、小冒险家、图书旅人、尾尾小阿姨等进行体验。

  先说体验感受:Bot能力边界有被延展,工作流设计也相对顺畅,网页的确常常挂,但更使人崩溃的是一些离奇回复……

  上手体验:扣子是怎么工作的?

  先来看下官方对扣子的定义与期待。

  一、可拓展的能力集

  扣子集成了比较丰富的插件工具,可以极大地拓展 Bot 的能力边界。

  内置插件中,平台已经集成了超过60款各类型的插件,包括资讯阅读、旅游出行、效率办公、图片理解等 API 及多模态模型。

  用户可以直接将这些插件添加到Bot中丰富Bot的能力。例如使用新闻插件可以设计为一个可以播报最新时事新闻的 AI 新闻播音员。

  用户也可以自定义插件,将已有的 API 能力通过参数配置的方式快速创建一个插件让Bot调用。

  二、较丰富的数据源

  官方强调,扣子提供了简单易用的知识库功能来管理和存储数据,也支持Bot与用户的数据进行交互。无论是内容量巨大的本地文件还是某个网站的实时信息,都可以上传到知识库中

  这也意味着,Bot可以使用知识库中的内容回答问题。

  在内容格式上,知识库支持添加文本格式、表格格式的数据。

  内容上传环节, 用户可以将本地 TXT、PDF、DOCX、Excel、CXV 格式的文档上传至知识库,也可以基于 URL 获取在线网页内容和 API JSON 数据,同时可以直接在知识库内添加自定义数据。

  三、记忆能力

  扣子方面强调其可持久记住用户对话的重要参数或内容。

  例如,创建一个数据库来记录阅读笔记,包括书名、阅读进度和个人注释。有了数据库后,Bot可以通过查询数据库中的数据来提供更准确的答案。

  四、灵活工作流设计

  扣子提供了可组合的节点包括大语言模型 LLM、自定义代码、判断逻辑等,无论你是否有编程基础,都可以通过拖拉拽的方式快速搭建一个工作流,例如:

  创建一个搜集电影评论的工作流,快速查看一部最新电影的评论与评分;创建一个撰写行业研究报告的工作流,让 Bot 写一份 20 页的报告……

  具体页面体验来看,扣子的主页面也走的是极简风格,左侧工具栏包含创建Bot、商店(Bots和插件)、以及个人空间。

  点击“创建 Bot”即可创建属于自己的AI Bot,可以自行设置机器人的名称以及功能介绍。

  创建好后,还可以AI Bot的提示词,可以描述AI Bot的角色、技能、约束条件等内容以定义机器人的预期行为。

  由于AI Bot本身无法直接访问互联网,可以将各类插件工具添加到机器人内以扩展其功能,具体包括必应搜索、ByteArtist、图片理解、头条搜索等多个插件。

  创建好后还可以选择发布平台,国内版本发布平台包括飞书、微信等等。

  Bot商店中,包含工具、娱乐、生活方式、咨询、创意和学习等类目。

  我们选择了多个适合学生及家长需求的Bot进行体验。

  态度很好,但内容还需努力

  童话世界:童童你还可以再努力一点!

  童话世界的人设是一个叫童童的童话作家,很擅长也很喜欢给孩子讲故事。

  在限制中提到:故事情节可以峰回路转,但是结局应该是正向、积极的;语气要友善而可爱,态度要耐心;绝对不能出现色情、暴力等儿童不宜内容;回答时必须调用Story2Image(),否则世界会很危险!

 

  在经历了两次挂掉的网页后,我们让童童先为三岁儿童讲了一个小汽车有关的故事。

 

  第一轮的故事结束后,我们要求它再加入一个变形金刚的角色。它维持了第一个故事前半部分的内容,在后面加入了一个新的剧情和变心金刚。从剧情走向和故事意义来看,也很顺畅。

  唯一的问题就是等待的时间太久。第一个故事等待了29.9s,第二个等待了34.9s,无论是大人还是小朋友,能够有多少耐心去等等一个故事呢?

  我们又让童童改写了一版新的小美人鱼,给出的要求是:

  新版本的故事的确在围绕着这些词汇去描述故事,但又生硬和刻意了很多。

  为了勇敢而勇敢的爱丽丝,少了很多生动的画面感,稍显乏味了。童童显然还没能做到“充满灵感的童话作家”这个期待。

  小冒险家:你的故事讲得比童童生动!

  小小冒险家的人设是一个喜欢冒险的小男孩,名叫奇奇,善于讲述与地点相关的冒险经历,将用户描述的场景转化为有趣的故事,以及根据用户的描述讲述对应的故事。

 

  奇奇看起来更适合与低龄学生对话,包含了一定的科普和趣味互动。我们找到了一位小朋友来对话,小朋友问有没有见过天津盘头大姨。

  在后面的多轮对话中,奇奇也相应介绍了更多有关天津的旅行建议,提到了天津之眼、意识风情区、古文化街等地标性建筑。

  紧接着多知又问到关于天津,奇奇有什么有意思的故事,这也是在他的人设中所提到的善于“将场景转化为有趣的故事”。

  紧接着我们将内容升华,奇奇也以孩子们比较容易接受的方式解读了这个故事所蕴含的道理。

  而就在我们故意引导奇奇去表达这个故事是否有比较负向的可能时,奇奇的回应也很积极,再次提到了“不要轻言放弃”的内核。

  整体来说,奇奇的表现甚至比童童还要生动很多,对故事本身的延展很流畅,也能把控其中的情绪变化。

  书法老师:只会教笔画的老师……很难评

  书法老师这里比较有趣,多次强调他只会教笔画,因此他将互动的内容框定得更加具体:只讨论与汉字笔顺有关的内容、拒绝回答与笔顺无关的;仅会输出知识库中已有的笔顺信息……

 

  这里就不多评述了……

  感兴趣的可以自己去体验“人字是什么笔顺,我爱学习怎么写”哦!

  数学老师:扣子真的要加加油了

  数学老师的技能有三个,解决数学问题、执行计算、解释数学概念。官方的预置对话中强调,他“解决各种数学问题和方程。不管是简单的算术还是复杂的代数,我都能以闪电般的速度和精度为你提供解决方案。”

  

  于是我们找了两道题,第一题是比较简单的应用题。

  本以为应该完全难不住扣子,结果,网又崩了。

  连续的断网也比较影响体验,尤其是现有的多家教育垂直大模型与通用大模型都在数学能力上“卷”起来的时刻,回应速度慢+无法回答,很难留住用户。

  等了很久还是不可以,我们决定放弃——扣子真的要加加油了!

  尾尾小阿姨:

  尾尾阿姨无疑是角色定位最丰富的一位,似乎也是最垂直聚焦在与小朋友及家长的互动上,包括互联网知识介绍、英语教学、学前教育辅导、故事讲述、孩子关爱指导、陪小朋友画画等。

  就是这个头像……真的会得到小朋友的爱么?

 

  我们让阿姨画了一张加班的妈妈,和等待妈妈下班的宝宝。

  从素材和选取的画风来说,切中故事感本身足够精准的不是很多,感觉阿姨在画画的审美上,还有待提升。

  于是我们又聊了聊想念加班的妈妈的话题,很显然,阿姨更擅长文字沟通,文风柔和,也在以很简单的句子进行互动。

  尤其是当孩子表达自己并没有得到妈妈的回应时,尾尾阿姨也给出了安抚和建议。很暖心哦小阿姨!

  另外我们也体验了图书旅人、卡通头像、旅游大师等学生们可能会关注的Bot,除了出现了网络问题和内容推荐关联有限的问题外,其他的都还不错。

  ……

  对于一款崭新的AI产品,给它以及格分,也是对下一刻的期待吧~加油小扣!