来源|多知
作者|冯玮
上个月,星火大模型推出刚满一周年。
经历了从无到有的拓荒,科大讯飞董事长刘庆峰认为当前讯飞在做的事情无外乎以下两个方面:国内的大模型底座能力到底怎么样?大模型究竟如何应用落地?
讯飞的答案也出现在昨天下午,科大讯飞在北京发布讯飞星火大模型V4.0及相关落地应用,其中:
讯飞星火V4.0七个核心能力全面提升、全面对标GPT-4 Turbo、星火APP/Desk升级并发布“个人空间”、首次推出星火智能批阅机、AI学习机升级1对1答疑辅导功能、语音大模型发布74个语种/方言免切换对话……
首次出现的智能批阅机意味着批改作业已真正进入AI时代,而AI学习机中全新的AI 1对1 答疑辅导功能,被官方强调已“实现了超拟人效果”。
此刻的讯飞,更像是一个缩影。
大模型软硬结合、端侧落地的赛程,已经开始。
01
七个核心能力提升:对标GPT-4 Turbo
在刘庆峰看来,从去年5月6日的讯飞星火V1.0到此刻的讯飞星火V4.0的发布,星火最令团队自豪的,是讯飞星火大模型基于全国产算力平台训练得出。
据了解,讯飞已与华为联合软硬件一体化,科大讯飞提供了大量的算子库和算法资源,联合在安徽发布了中国首个国产万卡算力集群。
这是中国第一个能训千亿以上浮点参数大模型的硬件平台。在这个硬件平台上,讯飞星火是中国第一个基于国产算力训练出来的全民开放的大模型。
基于此,此次的讯飞星火V4.0已经可以对标GPT-4 Turbo。
具体数据来说,讯飞星火V4.0在文本生成(80.2%)、语言理解(82.3%)、知识问答(85.7%)、逻辑推理(82.2%)、数学能力(86.5%)这五项能力上已经超越了GPT-4.0 Turbo,在代码能力(81.2%)、多模态能力(78.4%)上仍然有进步空间。
“代码能力是我们非常关注的能力之一,因为它涉及未来的产业信息化和信息产业化的核心,而ChatGPT去年2月份通过谷歌二级程序员测试,当时的GPT-3.5用这个测试集只获得了60多分,GPT-4 Turbo今年1月份测试大概在80分,现在到86分,也在快速迭代和进步。”
“我们预计在今年8月份,讯飞星火会达到现在86分以上的水平。”刘庆峰表示。
现场的演示中对“复杂指令”、“空间推理”、“多模理解”等进行了展示,刘庆峰在现场同时介绍了星火大模型在学习和获取知识方面以及长文本能力方面的提升。
例如,讯飞研究院院长刘聪在现场为星火展示了四张图片,并要求星火Desk就这4张图片编写一段儿童故事。
讯飞星火V4.0可以按照图片内容的条理清晰地编写出一段流畅自然的儿童故事。
故事里包含了图片中的各种元素,生成的故事也有着不错的可读性,让人可以直观清晰地获取到想要了解的内容。
星火此次还了推出内容溯源功能,当用户向星火提问并得到回答后,还会得到这样回答的原因及参考了什么文献的哪段内容。
在刘聪询问“西游记中,悟空一共被念了几次紧箍咒”的问题,星火就会在给出答案的同时、罗列对应文本的摘要以及原著中的对应内容。
“这样当我们没有时间看全文的时候,只要去核实它的溯源就行了,这使得大模型的’幻觉’得到极大的降低。”刘庆峰强调。
而在大模型落地到教育场景来看,此次有两个重要的更新。
02
批改作业进入AI时代
“我们一方面提升大模型底座能力,一方面进一步提升多模态能力,尤其是面向教育复杂场景的图文识别效果,使我们能够给学校的老师和孩子们做得更多。”
刘庆峰介绍了其进校最新产品“星火智能批阅机”。
据介绍,智能批阅机具有智能批改、学情分析、个性作业三个特质。可以帮助老师进行批改减负、减少对学生学情的统计的分析,方便老师在作业讲评时进行分层辅导等等。
“这个批阅机可以自动批改,把老师批改消耗的精力释放出来,让老师只看那些他应该看的错误点,批阅机通过批改自动地找出全班学习情况,给出分析,给出每个孩子学习路径的规划,而且能够软硬件一体化。”刘庆峰解读。
现场演示环节,刘聪介绍整个机型包含了扫描、打印、触屏操作等等配置。
老师拿到学生作业后放到扫描机进行整体逐张扫描,一分钟可以扫描90份作业,适合老师在课间快速操作。
扫描后屏幕上会显示已批阅和批阅中、以及不同学科的内容。
老师随时可以打开已经批阅完成的作业内容,正错误的部分会进行画圈的批改痕迹。刘聪表示,一份比较乱的作业,包括很多涂改痕迹、草稿痕迹等,目前均不会影响批改效果。
系统中内置了中高考同样的批阅技术和数据,因此批改语文作文也将得到与学习机等产品同样的批改痕迹,包括批注、错误字词句的批注,点评、好词好句划线等等。
同时结尾有整体的教师评语和提升建议。
这些批改结果可以直接打印到作业之中,老师只需要选择“留痕打印”即可——“这些批改模拟了真人笔记,基本上和老师平时的批改效果一模一样。”刘聪表示。
除了对学生端的智能批改外,智能批阅机还可以对批改数据进行整合分析,自动生成班级共性问题和个性辅导建议,同时为老师提供讲评建议,如重点讲评哪几道题目等等。
之前在C端学生机上会出现的知识图谱,也出现在了智能批阅机上,更好地呈现了学生的知识薄弱项。
智能批阅机会根据薄弱项内容给老师推送适合的内容,涉及到错因分析、知识巩固和变式拓展,以及每个个体学生的学情报告和个性化作业等等。
老师只需要打印出来就可以给学生以更个性化的帮助。
“我们为老师节省了批改过程中的无效、低效、重复时间,就可以有时间分析孩子的状态,老师就可以腾出时间来关注孩子的心理健康,关注人的全面成长。”刘庆峰表示。
据介绍,星火智能批阅机试题解析准确率>99%,支持语文、数学、英语多学科多题型智能批改,支持涂改液、便利贴、褶皱的作业原卷留痕、乱序打印。
数据显示,使用星火智能批阅机后,每班人工批改时间可从90分钟缩短至5分钟,学情统计分析从每班60分钟缩短至1分钟。
批改减负,科大讯飞通过AI技术迈出了全新一步。
03
AI学习机升级,上线超拟人答题辅导
去年5月6号科大讯飞推出星火大模型1.0版本后,大模型的各个能力都在快速提升,“每个月都会有一项重要升级”,以文本写作中的高考作文来看,今天星火大模型写出来的东西,已经从最初的不错到给人以触动,再到惊喜和感动的水平,刘庆峰表示。
AI学习机同样在快速升级中。
此次基于星火V4.0在语义理解、多轮交互、图文能力的升级,学习机的学习流程也有了四个更新:
首先,采用多模态启发式讲解方式,结合讲解、试题信息圈画和重点内容板书等手段,直观地引导孩子一步步解答问题。
其次,该功能支持自由问个性化解答,孩子们可以通过画线、语音、写字或公式等多种方式进行回答和提问,满足不同孩子的学习需求和习惯。
再者,师生互动探究式学习增加了画图讲解和板书回答的方式。
最后,超拟人引导式伴学功能则通过亲切、有趣的学习氛围,激发孩子的学习兴趣和动力。
演示环节,刘聪演示了多轮提问。
针对英语学科的题目,学生在学习机扫描识别后,点击对应问题的答疑辅导,会得到题目大意、理解时态用法、推敲主被动语态逐层讲解的引导作答。
自主学习过程中,用户还可以通过画线、语音、写字或公式等多种方式进行提问和回答。
学习机会在得到答案后进行总结回顾。
讯飞提供的数据显示,相比较传统解题视频学习,AI答疑辅导的学习方式让孩子的学习完成率提高到90%,错题解决率提升到93%……升级后的AI答疑辅导更注重引导孩子的主动思考和发问,不再直接给出答案。
另据讯飞官方透露,7月5日暑期发布会上将推出新产品。
04
“我的地盘儿”:AI助手+个人空间
回到日常学习、生活中,大模型如何更好用?面对不同的人群、不同的需求,又如何真正做到个性化?
讯飞这次交出了“AI助手”。
AI助手目前能够基于用户画像进行个性化表达,基于使用历史进行记忆学习,基于个人资料进行增强学习。
在构建用户个人画像时,人设风格可以自己选定,也可以根据对话和使用历史动态完善,进而形成个性化的表达风格;AI助手再结合个人资料,就可以生成个性化和针对性内容。
也是说,只要数据足够,大人、小孩儿都能有自己的AI助手了。
但这还不够。
刘庆峰介绍,讯飞的星火APP/Desk也同步全新升级,并引入了“个人空间”的概念——这是讯飞首次提出“个人空间”。
在这里,用户可以上传自己的工作、学习、生活、健康等各类资料,形成每个人的专属知识库,再结合人设,让大模型生成更个性化内容。
刘聪现场演示“个人空间”效果,当他上传了女儿写的小作文并选取符合女儿风格的AI人设标签后,星火生成了一篇活泼可爱、更个性化的文章。
而当他上传了讯飞翻译机的产品海报、用户短视频、相关录音后,星火也可以根据这些多模态信息生成产品培训文档,还可以对生成的信息进行多模态溯源。
此外,讯飞星火首批上线14个智能体,面向特定场景推出专属助手。
“让我们的通用人工智能从通用助手变成更懂你的AI助手”,刘庆峰最后说道。