未来,学习或者教学的“黑匣子”将被打开。

前脚OpenAI,后脚谷歌,“个性化教育、因材施教”正从理想走向现实

2024-05-15 12:40:57发布     来源:多知    作者:王上  

  来源|多知

  作者|王上

  被OpenAI抢先一天开发布会之后,谷歌I/O大会召开,也推出了最新多模态AI产品。双方的产品中都有教育场景的应用案例。从中可以看到,“个性化教育、因材施教”正从理想走向现实。

  GPT-4o的最大特点是多模态实时交互,OpenAI给出了用GPT-4o解方程式的演示。此外,在其官方放出的视频中,还有可汗学院创始人和他的儿子用GPT-4o解数学题,GPT-4o也能看图说话,用语音边引导边解析。家长们纷纷表示:这正是我想给孩子使用的!

  谷歌多个产品展示了教育案例,如推出了 LearnLM,这是针对学习进行“微调”的AI模型系列。谷歌表示,LearnLM模型是利用“对话方式”辅导学生学习。LearnLM 融合了Search、Gemini 和YouTube,在案例中,演示人员发给LearnLM一段教学视频,它可以给到学生视频中的要点,且是分步骤予以解答,不直接给答案。

  

  谷歌表示,LearnLM 可以帮助教师发现新的想法、内容和活动,或者找到适合特定学生群体需求的材料。

  谷歌的NotebookLM中,推出了“音频概述”,也提到了教育案例,把教学材料输入后,可以得到语音解答。

  此外,谷歌将在未来几个月内在 Gemini 推出教师智能体。

  对标OpenAI的GPT-4o,谷歌DeepMind首次对外公布了「AI智能体」新项目——Astra。像人类一样,对复杂、动态的世界做出理解和响应。未来,这也有望能在教育场景中应用。

  以前“文生图”可能不足以解决很多教育问题,比如在汉语语境中,包含多音字,发音不同字面意思就不同。因此,多模态更适合教育场景。多模态的形式可以还原甚至超越线下教学场景。

  在围观了GPT-4o和谷歌I/O大会后,多知对话了多个教育行业从业人员,他们皆表示,正在学习、交流,并会做进一步研究。

  “教育+AI”创业者又一次站在机遇与挑战并存的路口上。

  01

  “个性化教育真的来了”

  如果说“个性化教育、因材施教、有教无类”是教育人追求的“圣杯”,那么GPT-4o的出现以及谷歌的新产品让目标更加接近了。

  多个教育从业者告诉多知:“个性化教育是真的到来了。”

  从演示可以看到,GPT-4o语音交互的能力得到极大的突破,且具有多模态和情绪识别的能力。这让个性化学习、因材施教成为可能。

  在GPT-4o之前,多模态是分散的,而今,GPT-4o是一个大一统的多模态,仅一个模型即可读、听、写,类似真人。

  对于学生来说,可以随时随地问GPT-4o,它相当于一个个性化的AI老师,可以分步骤地解答,直到学生真正理解;可以分析学生的学习习惯和偏好,推荐最适合的学习材料和练习题,帮助学生更有效地学习;GPT-4o还可以检测学生作业的答案是否正确,并给出详细的解释和改进建议,帮助学生了解自身的学习状况和进步方向。

  对于老师来说,能够自动批改作业和考试,提供即时反馈,减轻教师的工作负担;可以根据学生的进度来分配相应的教学资源。

  有教育科技公司CTO从业者告诉多知:“OpenAI的发布会非常惊艳,仅‘实时语音交互’对教育来说就有很多可以应用的场景。”

  有网友脑洞打开:“如果GPT-4o能够在讲述历史变迁的时候,在地图上进行标注、生成新地图,那么基本开始接近真人辅导场景了。目前可以生成表格,但生成数据图、地理图还没有打通。”

  在职业教育领域创业的从业者大海提到,“GPT-4o跟之前不同,现在不仅仅是问答知识点,而是包含语音、表情、语气等方面。”

  教育科技行业投资人Ada认为:“GPT-4o拟人化能力更强了,能够有跟真人交互的感觉,还能识别人的情绪。不过,核心的智能解题和逻辑推理能力有多大提高,还是需要观察。”

  谷歌的LearnLM 和NotebookLM都可以进行个性化学习和教学。

  为了帮助学生和教师,在NotebookLM中,谷歌设计了一个“音频概述”的功能。它使用 Gemini 1.5 Pro 获取源材料并生成个性化的交互式音频对话。

  示例中,演示人员把材料输入,语音助手用篮球的原理生动有趣地讲解牛顿力学定律。

  

  演示人员说自己的儿子第一次看到这个功能时,惊掉下巴,并感叹:“第一次感受到学习可以不是死板的,牛顿力学定律居然可以通过篮球来学习!”

  谷歌认为:“这就是多模态的机会。很快,用户将能够混合格式和匹配输入和输出。”

  从OpenAI放出的视频邀请可汗学院和谷歌各个产品展示教育案例来看,教育将是多模态应用的重要场景。

  

  未来,诸如可汗学院、多邻国这样的教育产品或将与GPT-4o结合的更为紧密。不论是解答学科知识,还是口语训练等场景,都将有更大的想象空间。

  可以说,OpenAI和谷歌的新产品让因材施教的进程极大加快了。

  谷歌表示,LearnLM已经在 Google 的多个平台上可用,且正在通过Google Classroom(帮助老师在课堂上布置任务并收集及时反馈的程序)的试点项目来使用 LearnLM。

  未来,学习或者教学的“黑匣子”将被打开。

  02

  “教育创业者有奔头了”

  作为全新的多模态大模型,GPT-4o和谷歌新产品的出现,成为教育科技行业新的希望。

  职业教育CEO Leo告诉多知:“一个技术冲出来了,就有一堆多样化的创新了,教育创业者有奔头了。AI技术加速了,达到个阈值,应该门槛降低了,效果更好了,会有更多的人入局。”

  此前,技术能力可能需要专业的人才、专业知识以及更高的成本才能实现。

  而现在,创业者可以借助大模型以较低的成本获得这些先进的技术,构建产品的底层能力。不需从头构建复杂的算法或模型,只需要在具备良好的技术能力前提下,想清楚如何和实际应用场景结合。

  资深教育从业者Jack向多知分析称,解决方案型的教育AI产品,如果接入GPT-4o能力,那么可以带来产品体验和竞争力的革命性提升。

  随着人工智能技术的不断进步和成熟,对于新入局的创业者来说,迎来一个新的机遇。

  猎豹移动董事长兼CEO、猎户星空董事长傅盛5月14日在短视频中评价:“OpenAI的发布会给产品道路指明了方向,这类的产品会更多的出现。从另一个角度来说,连OpenAI这样技术狂奔的公司都开始做应用了,更说明人工智能领域做应用更有前途。我不同意有人说‘这次又摧毁一批创业者’,正相反。我认为,OpenAI的语音助手把整个行业的水准提高了,更多的开发者可以基于GPT-4o做出更好的应用。”

  傅盛强调:“每一个创业者都应该去好好地做人工智能应用,大模型的能力当然会不断地迭代,但最终能够把大模型用好的还是应用。”

  每一次技术的变迁,都会带来新的产品变革,都会催生新的创业潮。

  实际上,在教育领域已经有很多创业者瞄准AI产品,也有一些年轻人开始投身于“教育+AI应用”的创业大潮中。

  一个令人振奋的新时代正在到来。

  相关阅读:

  教育+AI更进一步!GPT-4o多模态实时交互,可解答数学题、实时翻译、模拟面试

  END

  本文作者:王上