给教育领域又提供了一种新选择。

DeepSeek超越ChatGPT占据App Store榜首,深度思考模式匹配学习场景

2025-01-27 14:08:47发布     来源:多知    作者:王上  

  来源|多知

  作者|王上

  1月27日,DeepSeek在美区苹果App Store免费榜从昨日的第六位飚升至第一位,超越ChatGPT。同时,苹果App Store中国区免费榜显示,DeepSeek亦站上首位。

  

  DeepSeek“有深度思考的过程,有细腻的回答”。这给教育领域又提供了一种新选择。

  近日,中国AI公司DeepSeek发布的R1模型(DeepSeek R1)刚刚第7天,热度飙升。

  1月24日,在专业大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一;而其竞技场得分达到1357分,略超OpenAI o1的1352分。在中国市场,DeepSeek超越了豆包。

  华尔街知名风投A16Z创始人马克·安德森在社交媒体发言称,DeepSeek R1是其见过的最令人惊叹,最令人印象深刻的突破之一,并且是开源的,是给世界的礼物。

  OpenAI前政策主管、Anthropic联合创始人杰克·克拉克表示,其认为DeepSeek“雇佣了一批高深莫测的奇才”,还认为中国制造的大模型“将和无人机、电动汽车一样,成为不容忽视的力量。

  图灵奖得主、 Meta 的首席人工智能科学家杨立昆(Yann LeCun)说,他认为,开源模式代码正在超越闭源模式。“DeepSeek 的成功带来的最大启示是保持 AI 模型开源的重要性,这样每个人都能从中受益。”

  DeepSeek之所以收到追捧主要归因于其高性价比、技术创新和开源特性。

  DeepSeek-R1在数学、编程和推理等关键领域的表现优异,能力接近OpenAI o1,非常适合教育领域。

  多知体验发现,“深度思考(R1)”这个功能非常重要,其思考过程能让学习者看到知识的关联性,引领学习者有思辨能力,从而培养自主学习的习惯,同时,其给出的解答细致入微,考虑周到。

  “我们为什么能看到流星?”“太阳能为什么能发电?”“下雨后为什么能看到彩虹?”这些科学小常识轻松拿捏,点击“深度思考(R1)”按钮,会给出详细的回答过程。

  

  以“我们为什么能看到流星?”为例,DeepSeek 思考过程解释了流星的形成过程,还有为什么在特定时间才能看到,甚至还有怎么观测到流星。

  一个非常简单的Prompt,就能看到它思考是方方面面的。可以说,DeepSeek 使用易上手,对于小白用户很友好。回答多维度思考,甚至还给出了补充说明,答用户所问,也答用户所未想到的地方。

  对于教师或者家长来说,出试卷,出作业不在话下。对于老师或家长来说,AI大模型出题效率高,节省时间,且能保障题目质量与多样性。

  

  以三年级数学思维题目设计为例,DeepSeek 给出了涉及到不同知识点的10道题目,甚至,它还思考了“几道”对于三年级来说比较合适。

  再上一些难度。

  多知给到了DeepSeek 一道超高难度的高考真题。

  

  多知发现,DeepSeek思考了长达4分钟,最终却无法解答,多知就此询问了资深科技老师小新老师,他说这是因为前期识别不准确 ,而无法正确解答。

  

  “用大模型解题的第一步是识别,不能直接让它去解答题目,否则会出现识别错误。这是一个用户习惯的问题,图片上传一定要记住,先让它识别题目,再解答。”小新老师说。

  数学、物理、化学等题目,多符号,识别容易出现问题,所以用户上传图片要多问一个步骤,先让它显示图片内容。

  

  重新识别题目后,给出的正确答案如下:

  

  由此看到,大模型的图片识别能力需要进一步提升。

  多知又给出了一道高考真题。

  

  DeepSeek给出了详细的思考过程,会用多种方法去思考,会反复检查,甚至还会自我纠错,最后才给出答案。

  

  据了解,DeepSeek创始人梁文峰此前在接受媒体采访时透露,团队成员都是来自Top高校的毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人,没有什么高深莫测的奇才。

  公开报道中,DeepSeek团队最大特点是名校、年轻,即使是团队Leader级别,年纪也多在35岁以下。不到140人的团队,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,工作时间都不长。

  据报道,梁文锋选人理念是“看能力,不看经验” ,“选人的标准一直都是热爱和好奇心”。此前,媒体报道的“雷军千万年薪招揽95后AI天才少女”罗福莉就来自DeepSeek团队。