在更多的人看到人工智能技术的进展时,也有一些疑惑:比如,为什么没能实现“绝杀”?

AI技术客:高考机器人为啥以1分之差没能完虐人类?

2017-06-12 08:53:11发布     来源:多知网    作者:若弦  

  导语:一场高考机器人和状元的PK赛,让不少人觉得人工智能牛逼的不要不要的。不过,很多人看到人工智能技术的进展时,也有一些疑惑,比如为什么没能实现“绝杀”?一位科技圈AI程序猿围观后,分析推测了几点关于高考机器人的秘密。

  几天前,学霸君的高考机器人Aidam6位高考状元的场外PK又让人工智能在教育领域掀起一个小高潮。最后Aidam取得134分的成绩,以1分的微弱劣势负于高考状元(高考状元平均分135分)。有点遗憾,人工智能没有在高考这一年度盛事上再现AlphaGo完虐人类的场面。

  高考机器人为什么没有实现完虐?

  其实在技术层面上,高考机器人是可以拿到满分实现完虐的。那它为什么没有拿到满分?从既有的新闻报道来看,初步推测,Aidam解题分三步:

  读题并翻译成形式化语言;相当于翻译成内部逻辑语言;

  根据已有规则,使用内部逻辑语言完成解题过程;

  将解题过程或结果翻译回来;

  众所周知,数学是逻辑体系最为完备的学科,题解过程中的所有逻辑均可从基本的定理和公理推导出来,因此只要读题正确的话,解题应该没有问题,即b步骤应该不是失分的原因。最大的失分原因,恐怕是计算机没有理解题目的意思,或者有所偏差。目前有一点不太确认,就是Aidam是从图片中读取题目,还是人工录入的方式读题。

  如果Aidam是以图片的形式读题,那么读题的过程可以分解为两个过程:光学字符识别(OCR)将题目图片转化为文字,另外就是使用NLP技术理解题目的意思。OCR技术,简单来说,就是使用计算机识别图片中的文本,目前广泛应用于拍照答题和计算机视觉的其他应用。对于标准化的打印体,OCR识别的准确率非常高。因此,如果是识别试卷上的数学题,机器的识别度应该不存在问题。

  所以,恐怕最大的问题是NLP技术有待提升。NLP技术,即自然语言处理(Natural Language Processing),指使用计算机技术和人工智能技术理解、处理人类语言的技术,目前在智能客服、聊天机器人、新闻机器人等众多领域广泛应用。

  与此相同,另一个机器人AI-MATHS失分的原因也是读不懂题目。确实,自然语言处理(NLP)被誉为人工智能皇冠上的明珠,确实有非常大的难度。

  机器人只能考数学吗?是不是可以高考6门科目统统虐一遍?

  很多人可能会问,为什么挑战的是数学,其它科目是否也可以?

  首先,选择数学肯定是有原因的。数学逻辑完备,对于计算机来说是最容易推理的。在题库类的产品中,最先整理出来的也是数学科目。

  那挑战其它科目是否也OK?学霸君的采访中说目前在数学、理综和英语方面已经都有把握,不过语文还需要探索。

  早在2013年开始,日本机器人Torobo-kun开始参加日本高考,据说物理成绩不错,但其他科目较差。今年由于理解题意太困难而放弃了参加。其实,我觉得只要有足够的训练材料,语文也是可以解决的。语文除了题意更加难懂外,相对于其他学科的额外难度,主要在与主观题较多、较抽象上面。

  事实上,机器的阅读能力已经有很大提升,在阅读理解测试上目前微软能够达到76%的正确率。至于主观题,也是可以尝试解决的。目前学界已经有很多利用循环神经网络(RNN)来写古诗的,其效果看起来还不错,甚至还可以写藏头诗。摘录2首作诗机器人的作品:

  海棠花红霞淡艳媚妆水,万朵千峰映碧垂,一夜东风吹雨过,满城春色在天辉。

  镜照影金精映,钗头角黍青,白发红袖下,明月满庭清。

  这两首诗的标题是人自由选定的词汇,诗的内容由作诗机器人完成。另外,国外还有很多人利用该技术作曲。

  Ai-maths与Aidam有什么不同?

  准星机器人AI-MATHS最终得分105Aidam得分134,两个机器人本身是否有高下之分?

  从报道上看,成都准星云学科技有限公司推出的AI-MATHS与Aidam还是有一定区别的。由于AI-MATHS训练样本较少,并且是在断网的情况下答题,因此虽然AI-MATHS分数较低,但在相同情况下,AI-MATHS能力未必低于Aidam。准星技术的设计初衷是在断网的情况下,人工智能对于生活和学习的帮助,目前已经开始帮助参加高考阅卷工作。

  所以,可能不用太久,虐完理科状元,高考机器人就可以完虐文科状元。想象一下,机器人和人类PK写天马行空的高考作文,一起吟诗作赋还是很好玩的。人工智能技术突破的速度很快,可以实现的场景也将越来越多。未来,在教育领域的应用还会有更多更有意思的东西出现。

  本文系独家投稿,作者若弦,AI程序猿一枚。