来源|多知网
作者|Penny
美国人工智能初创公司Anthropic推出新AI模型Claude 3炸裂刷屏。
新一代的Claude 3分为三个版本,分别为 Haiku、Sonnet、Opus 三款模型。从模型尺寸来看,网友戏称模型的中杯、大杯、超大杯。
全球网友纷纷评测,有人感叹“ChatGPT的时代已经过去了”,有人期待GPT-5能早点出炉,还有人预测AGI 时代即将来临。
大风大浪之下,对于普通人来说,更多的是借助大模型解决学习、生活或职场中的难题。Claude 3具体怎么用在教育领域?从全球网友的评测中我们看到了几个应用小案例。
可以说,教育或者学习的方式将更加多样化,个性化的学习不再遥远。甚至,跨领域跨专业,只要愿意尝试,说不定就能实现。
01
智商更高,推理能力好
博主Maxim Lott提到,Claude 3在通过智商测试方面击败了其他人工智能,这是第一个得分超过100分的 AI。这印证Anthropic所说的Claude 3更擅长推理、数学能力,这对教育领域来说是一个重大进步。
Maxim Lott测试了这样一道题目:
Claude 3回复说正确答案是A,并给出了详细的解答过程。
(博主给出的详细报告:https://www.maximumtruth.org/p/ais-ranked-by-iq-ai-passes-100-iq)
也有一些博主实测得出结论,Claude 3比其他大模型在数学、物理、化学方面的能力更强。并且,在文科方面,Claude 3能做到知之为知之,不知为不知。
02
视频转文字:学知识方式更多了,效率更高了!
看学术视频效率低?Claude3可以轻松将2个小时13分钟的视频转化成博客文章。
来看看转录的情况:
(博主AILAB发布的视频)
这个对于教育行业来说太方便了,如果有学生漏掉老师课程,老师发给学生录课视频,学生如不想逐帧去看视频了,可以直接让Claude3提取文字信息。
视频转文字功能还能进阶!比如结合一些工具,Memo AI是一款AI音视频转译工具,可以将YouTube、播客等视频和音频转录成文字,并支持90多种语言之间的翻译。
看起来Claude3替代了Memo AI的部分功能,但Memo AI的使用体验不一样,比如可以直接转化双语字幕。Memo AI最新版还可以将Youtube、播客、学习视频的内容生成思维导图,方便更好地吸收知识要点。
此前,Memo AI支持有微软、谷歌、Open AI、火山、DeepL等翻译平台。就在 Claude 3出来后,Memo AI已支持 Claude3翻译视频字幕。
Memo AI 称,测试上下文输入翻译时,字幕合并情况极少出现,而且翻译质量也不错。
可以说,Memo AI与大模型结合将开辟学习外语的新途径,可轻松做外语字幕,看外语文稿。
03
编写代码:小白也可以有自己的应用
博主Janet打算做一个小插件实现如下功能:在 HTML 页面中选择任意文字后发送到 notion。ChatGPT4无法最终帮实现功能的闭环,而Claude3 Opus做到了。
04
制作单词卡:可以按格式给出结果
博主Janet尝试使用Claude3 对比GPT4在单词卡制作方面的情况,得出结论:Claude3在音标和例句补全方面会优于GPT4,但仍旧未能完整返回所有词汇内容。
博主Janet给的 prompt,共71 个单词。
生成的具体结果:
可以看到,Claude3按照格式要求,完美返回所有词汇内容。
博主Janet关于单词卡制作的测试显示了Claude3翻译能力强大,且可以给出带表格的文本,图片转表格运用自如,这特别适合英语教学制作课件。
Claude 3 擅长从图像中提取文本还被其他博主提到。
该博主从图像中提取文本,GPT-4提取失败了,Claude 3 成功了,且排版有序。
对比一下在微信中使用图片提取文字功能:
可以看到,与Claude 3 相比,微信提取文字格式有点乱,需要自己复制下来重新编辑一下,不是很方便。
05
超长文本处理能力:还帮总结成附件
Claude 3 具有超长文本的处理能力,200k的对话长度,能够单次处理大概超过15万英文单词。
Anthropic提到,为了有效地处理长上下文提示,模型需要强大的回忆能力。“大海捞针”(NIAH)评估衡量模型从大量数据中准确回忆信息的能力。Claude 3通过在每个提示中使用 30 个随机针/问题对之一并在不同的众包文档库上进行测试,增强了该基准的稳健性。Claude 3 Opus 不仅实现了近乎完美的召回率,超过 99% 的准确率,而且在某些情况下,它甚至通过识别“针”这句话似乎是人类人为插入到原文中来识别评估本身的局限性。
对此,有博主评论,这是“有趣的故事”和“恐怖的恐怖片”之间的微妙界限。
一个小细节,翻译的内容可以直接形成一个附件,不用滚动很长的屏幕了。
可以看到,提炼文本、总结文本,Claude 3 都能应对,这也是一个比较常见的学习场景。比如,一篇论文的核心思想是什么?Claude 3可以帮忙总结。
06
未来已来?
Claude 3太强大了,甚至有博主提到,该模型似乎有足够的意识,它知道自己正在接受测试。这不禁让人瑟瑟发抖。
Claude 3的到来,正在撼动GPT-4的霸主地位。对于用户来说,对AI工具的忠诚度或许取决于谁更好用。
无论如何,Claude 3将大模型的竞争推向了更高的维度,这场AI革命才刚刚开始。