“追赶OpenAI首先需要一套科学系统的大模型评测体系。”

刚刚:讯飞星火交卷,“大模型学习机”有什么不一样?

2023-05-06 18:05:47发布     来源:多知网    作者:冯玮  

  来源|多知网

  作者|冯玮

  图片来源|科大讯飞

  刚刚,科大讯飞举行了星火认知大模型成果发布会。

  科大讯飞董事长刘庆峰介绍,讯飞星火认知大模型是科大讯飞自主研发的基于深度学习算法的认知智能大模型,其具备跨领域多任务上类人的理解和生成能力,可以模拟人类大脑对自然语言的理解和生成过程,实现对语音、图像、文本等多种信息形态的理解和处理。

  基于此,此次科大讯飞整理出通用人工智能的七大维度能力:文本生成、逻辑推理、语言理解、数学能力、代码能力、知识问答、多模态能力。

  科大讯飞演示了星火认知大模型的写发言稿、邮件、营销方案、英文写作效果,结果相当出色,可实现语音一句话生成,还能中英文互译,甚至能用小红书的文风来写作。

  作为星火落地教育场景的尝试,科大讯飞推出了首款搭载大模型的AI学习机T20系列。

  01

  星火背后的“7个维度”

  刘庆峰在发布会上解读,2022年年底起认知大模型的技术在全球引起了人工智能全新浪潮——各行各业都在拥抱巨大的变革和巨大的机会,传统意义上通过重时长、人力的商业模式将被根本性的颠覆。

  “这一次人工智能在历史上的意义,不亚于PC或者互联网的诞生。”

  此次认知大模型主要特点在于:通过多种类型的数据送到一个统一的认知智能的大模型中去学习和训练,最终可以在通用领域给大家非常惊喜的能力表现。

  各种类型的文本来源也是多样的,可以是文字、语音、图像或者视频等多种风格:“关键问题是通过这样一个统一的单模型学习之后,我们就会发现我们的系统会具备了像人类一样的触类旁通,在多领域的智慧涌现的令人惊喜的表现”,刘庆峰说道。

  

  据了解,基于ChatGPT一开始发布的48个任务方向和科大讯飞人工智能开放平台上实名认证开发者团队对人工智能在未来的各种应用领域的需求,科大讯飞最终提出当前通用人工智能特别令人关注的7个维度。

  即:文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力7个方面。

  刘庆峰强调,“任意的设备都可以像人一样能听会说、能理解会思考,将极大推动万物互联、大家公认的IT产业发展的第六次浪潮”;“同时也会带来终端数量和产业规模10倍以上的提升”……

  刘庆峰在现场就几个传统行业进行了迭代分析,其中:

  “在传统的手工编程行业,新的技术升级将会大幅提升现在软件产业的研发和生产效率,也会使得今天只要有创意有想象的每个人都可以在数字经济时代提出他的设想,不用再会编程,也不用要有资源去组合一个编程的团队,后台的大模型会直接帮他的程序实现,然后运行,然后进行商业推广。”

  “像自媒体,今天每个人都会成为作家,每个人都会进行商业模式创新一样,在未来在信息产业在数字经济中,人人都可能会创业,它的创意和灵感将会更多地变成产业的福利,我觉得会带来整个产业生态的重大的变革和重塑”刘庆峰说道。

  这一次认知大模型本质上是一次对话式的通用智慧的涌现,刘庆峰认为语音和语言的核心能力是一个基础条件:

  “科大讯飞是中国的国家队,在2014年我们就推出了讯飞超脑计划,明确提出要让机器像人一样具备能理解会思考的能力。在去年的1月份,我们的年度大会上就正式宣布了讯飞超脑2030计划,我们就是要让未来的讯飞超脑2030计划中间懂知识会学习。”

  

  据了解,2022年12月15日,科大讯飞正式启动认知智能大模型的专项攻关,官方称其为“1+N专项攻关”。

  1:为通用的认知智能的大模型。

  N:是把大模型在各个领域的落地,包括教育、办公、汽车、人机交互以及医疗等众多领域,也是科大讯飞此次发布通用模型和行业产品的一个非常重要的试点。

  随着认知大模型在全球引发的关注和产业浪潮,非常多的科研机构和企业单位都在开始进行认知大模型的研究和产业化的相关工作,有些公司已经推出了阶段性的成果。

  基于此,刘庆峰坦言:“如果我们要让这次智慧涌现的认知智能是真的解决社会刚需,而不是简单的做一个PR去做宣传的话,我们就要建立一套实实在在的脚踏实地又科学系统的评测体系。”

  “用这一套科学系统的评测体系来告诉我们我们的技术到底到了什么程度了,下一个发展应该往哪边走,告诉我们到底我们距离实用是不是已经达标了,还是应该还有哪些工作要去做”——刘庆峰强调,无论是对OpenAI致敬学习、又或是想快速赶超并超越的时候,首先需要一套科学系统的评测体系。

  

  基于此,科大讯飞对“科学系统的评测体系”的落地也在2022年12月15日同时启动。

  据了解,科大讯飞此前和中国科技大学共同承建的认知智能的全国重点实验室,牵头设计通用人工智能的7个重要的方向,和一整套的细化测试方法与基本模块方向。

  同时,科大讯飞与中国科学院人工智能产学研创新联盟以及长三角人工智能产业链联盟,一个侧重在产学研源头技术,一个侧重的产业链的应用落地。

  02

  现场展示:星火交卷

  “现在我们给出了7大类,一共481个细分的任务类型来来进行我们对整个通用认知智能大模型的评测,今天我们就会围绕着这7个主要方向给大家来展示我们讯飞星火大模型到底已经达到什么程度,以及它下一步的落地情况。”刘庆峰解读并在现场演示了几个实时对话案例。

  

  多风格多任务的长文本的生产能力,刘庆峰解读,讯飞星火可以写发言稿、写邮件、写新闻通稿、营销方案等,拥有各方面的文本生成能力。

  用星火给大家写一个欢迎稿:

  

  用星火给小朋友们讲故事,可以由家长随机选几个词由星火重新编辑:

  

  让星火以小红书的风格写一篇翻译机4.0新品的品宣文案,强化“小姐姐们必备神器”:

  

  在语言理解能力中,刘庆峰强调星火关注多层次跨语种的语言能力。

  其中包含如中英文各个层次每个单词和语法时态等等的检查,甚至是能够到情感分析到后台的深度理解。

  “英文的这样一个语法句式以及关键单词的纠错能力,我们已经做在业界最强了,所以它不仅可以赋能,在我们讯飞的学习产品中,我想对每一个现在的商务人士或者工作人员对海外做交流这个功能都是非常有用的。”

  星火对英文语法纠错:

  

  星火对中文模棱两可的汉语进行理解和解读,例如:

  俗话说,男子汉大丈夫要宁死不屈;但俗话又说男子汉大丈夫要能屈能伸,这两种意思如何理解?差别在什么地方?

  

  如果有个小伙子和他女朋友吵架了,他应该是宁死不屈还是能屈能伸?

  

  对“一分钟”的理解和使用,也各有不同:

  

  “因为语言理解是将来我们的认知大模型,就要用各种插件和工具最核心的一项能力。这个能力中根据我们刚才说的测试体系中,481项测试维度中有119项详细任务跟语言理解有关。根据我们现在测试结果,我也非常自豪的告诉大家,在国内可测的现有系统中我们是明显遥遥领先的,那么跟切断GDP相比还有细微的差别,但我们还在持续提升的过程中”,刘庆峰解读。

  在知识问答部分,刘庆峰表示通常把它定义成叫泛领域的开放式的知识问答。

  菠菜和豆腐能不能一起吃:

  

  家中老人突然晕倒,如何判断是不是中风:

  

  在这个部分,刘庆峰特别强调,星火只把讯飞医疗专业系统中的一部分通用能力简单放上来,并没有专门发布讯飞医疗版的专用的医疗大模型。

  “是因为医疗要更加严肃更加谨慎,还有很多医疗的相关的法规。我们会下一步把这些专专业能力从跟医疗机构合作中逐步放到通用的大模型中,希望将来让每一个老人在居家的过程中,每一个家长每一个年轻的父母亲都能够通过我们的星火模型,能够成为每个人的健康的顾问,每个人的健康助手不仅要成为医生的诊疗助理,还要成为每个人的健康助手。”刘庆峰解读。

  另据了解,医疗专业模型,大约在今年的1024期间正式发出。

  回归到星火模型上,在数学问题中提出,某个公司的股票昨天涨了10%,今天又跌了10%,请问到底是涨了还是跌了?

  

  花坛里面有3种花,一共有88朵,其中月季花的数量是菊花的4倍,牡丹花的数量是菊花的5倍少2朵。那么请问花坛里一共有多少朵牡丹?

  

  “按照刚才的测试体系来说,大概有16个类别的详细任务,但这16个类别的详细任务中,我们在国内可测到的同类系统中,不仅是领先是遥遥领先,现在已经超过ChatGPT了”,刘庆峰解读:“当然我们自己也还在快速更新的过程中,在下一个版本中还会继续前进,所以我相信在这些领域中都会成为星火,会源源不断的给大家带来惊喜的方面。”

  中文方面:

  跟女朋友吵架了有什么办法解决?

  

  发布会现场,刘庆峰同时介绍了纯大型技术的待攻克缺陷:

  

  刘庆峰表示,讯飞星火大模型将在:

  6月9日前,将开启实时问答,升级多轮对话能力;

  8月15日前,再次提升代码能力以及多模态交互能力;

  10月24日前,星火大模型将对标ChatGPT,在中文能力上超过ChatGPT,在英文能力上与ChatGPT相当。

  

  发布会现场,刘庆峰介绍由科大讯飞推出的、全球首款搭载大模型的AI学习机。

  03

  星火落地教育:AI学习机

  今年2月,多知曾报道称科大讯飞低调推出AI学习机T20 Pro,官方定价8999元,活动价8799元——这也是科大讯飞学习机系列中价位最高的一款。

  

  彼时多知观察发现,最新机型T20 Pro较过往产品的核心不同在于:对不同学龄段、不同孩子差异化学习需求进行分层。

  但在此次的发布会上,刘庆峰宣布T20系列在语数英主学科上进行了大模型应用落地——首批上线了中英文作文类人批改(学习机端)和生成(家长端)、数学个性化精准学类人互动辅学、英语类人口语陪练功能。

  即,T20系列可实现像真人老师一样的互动式辅学,为3-18岁孩子提供真正的智能化、个性化精准学习体验,进而提升学习效率和学业水平。

  具体来看:

  搭载认知大模型的科大讯飞AI学习机T20系列,作文理解和评语生成能力进化式提升,行业内首次实现中英文作文的类人批改。

  科大讯飞官方介绍,T20系列会像真人老师一样,“以精细化的批改反馈、个性化的点评指导以及人性化的学习体验帮助孩子提升写作水平。

  批改作文时,它会像真人老师一样对文章精细勾画点评。

  进而实现3阶(基础批改、高阶批改、提升建议)7级(规范字词、技法识别、结构分析、内容理解、语言表现、写作建议、优化参考)的层层批改。

  第一个阶段:基础批改主要针对字词句的错误识别和修改。

  目前市面上其他学习机大多只做到基础批改,搭载认知大模型的科大讯飞AI学习机T20系列可以找出的错误类型更全、数量更多,还能自动关联知识卡片,帮助学生学习和巩固薄弱知识点。

  第二阶段:高阶批改,根据写作要求,深度理解文章内容,从布局、审题立意、行文表达等语义角度,对作文结构、内容、语言进行深度批改。

  第三阶段的提升建议,是科大讯飞AI学习机T20系列搭载大模型后的专有批改功能。

  在这个环节,学习机会以引导式提问、启发式评语,引导孩子主动思考、找出错因,训练写作思路;同时,通过AI技术实时生成优化参考内容和推荐范文,帮学生积累写作素材,提升写作技巧。

  

  孩子在学习机端完成作文批改后,家长可在手机端”讯飞AI 学“APP上查看完整批改报告,准确掌握孩子写作学情。

  家长还可对学习机上批改的作文一键优化,让孩子通过对比优化前后的作文,提高对写作要求的理解能力。

  在理科知识上,科大讯飞AI学习机T20系列数学AI精准学功能升级,推出了“分层知识图谱”,分别以夯实基础、突破进阶、拓展拔高为目标。

  根据教材知识点和本地化考情大数据,生成基础、进阶、拔高三级难度的知识图谱。

  孩子可以根据AI推荐的难度目标学习,也可按照自身的能力阶段和所处的学习阶段,选择适合自己的层级进行精准学习,高效提升。

  通过认知大模型的能力,每个分层都实现了类人互动辅学,对学生进行深度点拨、引导、解析。

  

  科大讯飞AI学习机T20系列通过“思路点拨-解题视频-试题解析-举一反三-一题多解-大招总结”首次一一对应实现了数学知识点学习 “知识记忆-对照应用-理解分析-变式应用-能力拓展-素养内化” 的科学链路,“类人老师”全链路互动式精准辅导,让孩子逐级进阶。

  在口语练习部分,搭载星火认知大模型后,科大讯飞AI学习机T20系列行业首推类人“口语陪练”功能——官方称“它像是孩子的24小时1对1 口语聊天语伴,可以随时随地与孩子免费畅聊练口语。”

  据介绍,“AI语伴”采用科大讯飞服务于全国中高考英语听力、口语考试的同源测评、翻译技术,孩子直接说中文也能翻译成英文并让孩子跟着读。对话过程中会实时评价发音水平,并给予及时反馈、指导。

  2019年科大讯飞行业首发“个性化精准学”系统,最核心的功能是知识图谱找弱项和“测-学-练”系统。

  相较于市面上同类型产品,目前科大讯飞特有的本地化的考点考频大数据,同章节的知识图谱除了课本原有的知识点外,还有本地常考的延展问题,知识点更完整细致。

  同时,知识点之间有清晰的逻辑结构,可以溯源并预测知识点掌握情况,科大讯飞的智能推荐算法可推荐最优学习路径;另外科大讯飞精准学还能满足小节、单元、备考等全场景精准学习需求。

  支持主、客观全题型的作答和分析,综合评估知识点掌握程度。

  

  T20 Pro在内容层面的多个功能,都在凸显“AI”的效用,例如“AI同步精准学”、“AI考试”、“AI错题本”、“AI学习计划”等。

  不过刘庆峰也曾强调,在智能教育硬件的发展过程中,科大讯飞会坚持两个关键方向。

  第一,技术不能解决所有问题。

  “在用人工智能学习机推动教学的过程中,绝不能认为只是一个技术就能够解决所有问题。它一定是在教育理念的指引下,跟教研的力量,跟内容资源结合起来,这是一个系统性创新的过程”,刘庆峰指出。

  第二,AI是帮助老师、学生,而不是替代老师。

  “一定要考虑跟老师之间的协同,人工智能是帮助老师推动教学,而不是代替老师的,因为教学是个长期的问题,而且在这个过程中,跟着教育理念,其实教育的评价方式会改变,一定将来的评价之后的成就导向要多元化,然后教学内容要进行改革,这都是一个系统性工程。”刘庆峰强调。

  刘庆峰所勾勒的是,每个老师都有AI教学助手,每个学生都有AI学习伴侣:“我认为将来应该是人手一个,这才是趋势,它就跟书包一样,应该是每个孩子都有这样一个电子书包,然后又能够护眼,随时随地陪伴。”

  如今,科大讯飞AI学习机T20系列行业首次搭载认知大模型,不仅仅是一次产品创新,更是科大讯飞人工智能技术在教育领域应用的又一重大突破。

  END

  本文作者:冯玮