DeepSeek超越ChatGPT占据App Store榜首，深度思考模式匹配学习场景

2025-01-27 14:08:47发布来源：多知作者：王上

　　来源|多知

　　作者|王上

　　1月27日，DeepSeek在美区苹果App Store免费榜从昨日的第六位飚升至第一位，超越ChatGPT。同时，苹果App Store中国区免费榜显示，DeepSeek亦站上首位。

　　DeepSeek“有深度思考的过程，有细腻的回答”。这给教育领域又提供了一种新选择。

　　近日，中国AI公司DeepSeek发布的R1模型(DeepSeek R1)刚刚第7天，热度飙升。

　　1月24日，在专业大模型排名Arena上，DeepSeek-R1基准测试已经升至全类别大模型第三，其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一;而其竞技场得分达到1357分，略超OpenAI o1的1352分。在中国市场，DeepSeek超越了豆包。

　　华尔街知名风投A16Z创始人马克·安德森在社交媒体发言称，DeepSeek R1是其见过的最令人惊叹，最令人印象深刻的突破之一，并且是开源的，是给世界的礼物。

　　OpenAI前政策主管、Anthropic联合创始人杰克·克拉克表示，其认为DeepSeek“雇佣了一批高深莫测的奇才”，还认为中国制造的大模型“将和无人机、电动汽车一样，成为不容忽视的力量。

　　图灵奖得主、 Meta 的首席人工智能科学家杨立昆(Yann LeCun)说，他认为，开源模式代码正在超越闭源模式。“DeepSeek 的成功带来的最大启示是保持 AI 模型开源的重要性，这样每个人都能从中受益。”

　　DeepSeek之所以收到追捧主要归因于其高性价比、技术创新和开源特性。

　　DeepSeek-R1在数学、编程和推理等关键领域的表现优异，能力接近OpenAI o1，非常适合教育领域。

　　多知体验发现，“深度思考(R1)”这个功能非常重要，其思考过程能让学习者看到知识的关联性，引领学习者有思辨能力，从而培养自主学习的习惯，同时，其给出的解答细致入微，考虑周到。

　　“我们为什么能看到流星?”“太阳能为什么能发电?”“下雨后为什么能看到彩虹?”这些科学小常识轻松拿捏，点击“深度思考(R1)”按钮，会给出详细的回答过程。

　　以“我们为什么能看到流星?”为例，DeepSeek 思考过程解释了流星的形成过程，还有为什么在特定时间才能看到，甚至还有怎么观测到流星。

　　一个非常简单的Prompt，就能看到它思考是方方面面的。可以说，DeepSeek 使用易上手，对于小白用户很友好。回答多维度思考，甚至还给出了补充说明，答用户所问，也答用户所未想到的地方。

　　对于教师或者家长来说，出试卷，出作业不在话下。对于老师或家长来说，AI大模型出题效率高，节省时间，且能保障题目质量与多样性。

　　以三年级数学思维题目设计为例，DeepSeek 给出了涉及到不同知识点的10道题目，甚至，它还思考了“几道”对于三年级来说比较合适。

　　再上一些难度。

　　多知给到了DeepSeek 一道超高难度的高考真题。

　　多知发现，DeepSeek思考了长达4分钟，最终却无法解答，多知就此询问了资深科技老师小新老师，他说这是因为前期识别不准确，而无法正确解答。

　　“用大模型解题的第一步是识别，不能直接让它去解答题目，否则会出现识别错误。这是一个用户习惯的问题，图片上传一定要记住，先让它识别题目，再解答。”小新老师说。

　　数学、物理、化学等题目，多符号，识别容易出现问题，所以用户上传图片要多问一个步骤，先让它显示图片内容。

　　重新识别题目后，给出的正确答案如下：

　　由此看到，大模型的图片识别能力需要进一步提升。

　　多知又给出了一道高考真题。

　　DeepSeek给出了详细的思考过程，会用多种方法去思考，会反复检查，甚至还会自我纠错，最后才给出答案。

　　据了解，DeepSeek创始人梁文峰此前在接受媒体采访时透露，团队成员都是来自Top高校的毕业生、没毕业的博四、博五实习生，还有一些毕业才几年的年轻人，没有什么高深莫测的奇才。

　　公开报道中，DeepSeek团队最大特点是名校、年轻，即使是团队Leader级别，年纪也多在35岁以下。不到140人的团队，工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校，工作时间都不长。

　　据报道，梁文锋选人理念是“看能力，不看经验” ，“选人的标准一直都是热爱和好奇心”。此前，媒体报道的“雷军千万年薪招揽95后AI天才少女”罗福莉就来自DeepSeek团队。