来源|多知网
作者|冯玮
北京时间2月16日凌晨,Open AI用60s的文生视频定调世界的频率——接下来的10天里,没有任何一个新话题或新技术的热度抵得过Sora。
海外AI视频创作者拥挤在网路上:
有振奋吧,Open AI最大竞争对手Runway的创始人Cristóbal Valenzuela在第一时间于X上回应:“游戏开始了”。
有恐惧吧,风险基金Lightspeed India(曾领投Stability AI和Pika)的合伙人Hemant Mohapatra评价:“事情不会再像以前一样了。它生成的视频质量如此之高,以至于现有的视频生成公司将感受到直接的威胁。”
有戏谑吧,Stability AI的CEO Emad Mostaque在转发Sora效果的帖子时笑称“软件消灭世界,AI消灭软件,Open AI消灭AI,除非……”
国内从业者同样沉浸在这独属于数字世界的狂欢和激烈的讨论里,那些已知与未知,“天空”之上与“天空”之下……
伴随第二波视频的释出,Sora宇宙继续螺旋上升。
| A surreal scene unfolds as a giant, translucent jellyfish floats gracefully through a deserted cityscape at dusk. The scene is shot on 35mm film
“精灵已经从瓶子里出来了。”
一发不可收。
多知与多位教育科技从业者进行了对话,他们之中,有连续创业者、在线英语CEO、AIGC创业者、AI创作者及投资人……
我们试图从他们的视角去感受Sora在教育科技行业所触及到的纹理,以及比想象中更长远的涟漪。
从喜欢什么就推荐什么,到喜欢什么就生成什么
教育科技公司AI学习产品负责人大帝:我们之前一直在关注Pika、Runway等等,整体看下来都是微动画,但Sora的不同之处首先在于时间能有1分钟,其次是画面效果有明显的镜头感、有明显的动作。
我们当时看到就在那抖音做对比:抖音是你喜欢看什么、它就给你推什么;将来的文生视频就是你喜欢看什么,它就给你生成什么。
你的偏好是由AI来生成定制的,这真的很令人激动。
那么假如把这个偏好收缩到教育领域会发生什么?
首先是在制作的角度。
视频课程的生产成本可能会降低,比如传统的录播课、动画课一些环节成本很高,平均每分钟可以达到几万块。
Sora如果可以批量化生产视频的话,也就可以很快生产出很多内容。
在Stable diffusion里有个很典型的case,是通过Lora定义目标形象,以ControlNet可以定义骨架。
那么在Sora里面的话,将来也完全有可能会可以定制决策和骨架,最终按照这个结构去生产负荷角色的动画内容或者视频。
这意味着未来更大的需求应该是在优秀的脚本和编剧上,对相关人才能力的要求也会更复合,比如编剧+教研+prompt,再稍微会一点剪辑……那就是一个人就可以cover住做一个课的能力。
|a red panda and a toucan are best friends taking a stroll through santorini during the blue hour
另外一个就是1V1师生的互动过程中,可能会形成三个递进的步骤。
第一步,将来的老师想讲好一个知识点,就可以从文本生成多模态的方式去给学生讲解。
但是讲得好不一定学生听得下去甚至能听懂。
第二步,你喜欢什么,老师就用你喜欢的方式或者你更容易理解的方式,给你讲明白。
那这个时候更好的解决方案是孩子喜欢看什么就给什么,比如孩子喜欢奥特曼,那就用奥特曼生成视频去给孩子举例子讲解一道物理或是数学题。
第三步,到了未来有可能像Apple Vision Pro等产品普及了或者更好的AR产品出来了,我们在这个场景下可以实时地、以场景式的形态给到学生用户。
当然这些都只是假设,但我会觉得按照这个节奏进展的话也许有个几年就能实现了。
很令人期待。
和当初ChatGPT横空出世的时候感觉一样。
等到“所说即所得”的那天,就只剩下电的成本了
某不愿具名的职业教育公司CEO,金:Sora对于教育领域的影响首先是课程内容的讲解方式。
以前可能是PPT+人,以后是PPT+人+AIGC视频,对于学生来说更直观了。
比如以前讲地理,可能国家地理杂志的纪录片就是很好的补充材料,但这个视频内容所需要耗费的拍摄、剪辑等成本很高。
Sora出现后,意味着文字生成自己独特的视频作为主体或参考,那“讲”的这个部分的资源就会极大地丰富起来。
相似地,语文、英语、政治、生物等学科也就都可以了。
|cat in glasses in a 1960s spy movie
从这个角度来看,Sora成为了教学过程中的生产工具——它解决了以前需要视频素材但是没有太多能力去生产的困难,也它让生产素材得以延伸并提高了生产效率。
一举多得。
从渗透的内容层面来看,Sora最首先可能改变的就是英语类的视频动画制作;然后是各个学科中的文科;最后Sora懂得物理世界后,理科也就可以了。
即:
1、动画场景,不要求细节,有基本逻辑;
2、真实场景;
3、真实场景,且能理解物理世界;
4、全息场景。
啥时候到“所说即所得”的时候,就只剩下电的成本了。
与虚拟老师隔空对话
英语趣配音、AI外教APP创始人/CEO谭美红:Sora的新闻出来的时候,我是一大早看到的。超级兴奋,兴奋到直接把我震惊清醒了。
这无疑是一项足够颠覆的技术,对于原来受限于技术或成本特别高没法生产优质内容的团队是巨大利好。
而给我自己比较直观的感受在三个方面。
1、这或许会更有利于生产自有版权的内容,但也有可能效果不达预期,需验证的时间周期也会很长。
2、Sora普及后,行业里AI互动课(录播课)中的“动画制作”部分很有可能成为最早被冲击的一部分。
3、未来或许还会有这样的一种虚拟人形态,它可以应用Sora的视频呈现技术,应用微软小冰或者其他语音产品的对话能力。用户佩戴类似Vision Pro的头显设备,那么,虚拟老师可以直接在3D时空中和我们对话聊天……
这个场景想到还是挺酷的。
目前我们计划的是缩短研发的时间周期,毕竟现在Sora还没有开放对外接口,如果开放的话我想立马用它来生产内容!
AI动画,被撬起的第一块砖?
AI从业者,海深:能颠覆的行业和职业很多,比如宣传片、投流短视频、动画内容等等。
动画制作的效率和节奏无疑会大大提升,比如AI 生成需要的各种视频原画人物形象,设计师在这个基础上做调整,可以节省大量的创作时间。
相应地,动画制作的投入成本会下降。
如果是AI互动课程内容来说,虽然动画部分省力了,但对教研侧的要求可能会变得更高,人力上的参与度也会再上一个台阶。
智能硬件从业者,暄子:倒也不需要太担心Sora真的对动画市场带来多少影响。
内容和创意当然是一方面,另一方面我觉得可以参考下Open AI的另一个产品DallE2,这款文本生成图像系统到现在也还不能够做出具体的、特定的场景角色。
这也导致DallE2到现在也不是很多项目执行时的第一选择,前段时间还有一些具有破坏性的错误信息的讨论。
总之,这些技术还需要飞一会儿。不需要现在就谈Sora色变。
天马行空的视频化
动画从业者,文道:Sora刚出来的时候,其实我是有点儿困惑的。
不仔细看的话,甚至无法分别它是否是实拍,相较于Pika或Runway等AI生成软件在动态表现和稳定性上有了足够大的飞跃。
第二批视频给我带来的震撼远远超过第一批。
你看到小白龙在呼出白气时,眼睛和嘴角的细微牵扯了么?还有那对在蓝色时刻漫步于圣托里尼岛的小熊猫和巨嘴鸟,它们同频起伏的样子,是我所在的AI动画影视制作领域完全不敢想的程度……
|Close-up of a majestic white dragon with pearlescent, silver-edged scales, icy blue eyes, elegant ivory horns, and misty breath. Focus on detailed facial features and textured scales, set against a softly blurred background
海豚在沙滩上骑自行车最让人兴奋。
这意味着Sora可以基于物理规律去生成不可思议的荒诞的画面,虽然它依旧有这样、那样的问题,但不可否认的是,接下来任何一个孩子的任何一种想象,只需要几句话就可以被生成。
孩子的天马行空,可以视频化了。
这当然会比孩子和一台机器只靠语音互动更加有趣和生动。
孩子们甚至可以自己制作喜欢的视频,根据自己编写的文字去生成属于自己的动画片。
要知道,论创造力,没人比得过孩子们。
对于真正做动画的成年人来说,工作流的变化已经是必然。
过往,制作一段AI互动动画的流程前中后期泾渭分明,前期的内容脚本、中期拍摄或建模、后期制作缺一不可,现在后期阶段就可以自动生成不少新的素材甚至反哺内容涉设计。
工作流的压缩,会带来新的工具需求,Sora是开端,长远来看它也会是工具之一。
等3D领域也感到恐惧的那天
AR领域创业者,子硕:要理性地乐观,不要盲目吹捧,毕竟大家现在都没人用过Sora呢。
大家还只是看了一些官方的演示视频而已,我觉得需要祛魅。
不过这个方向肯定是大家都努力的,“文字、图片、视频、音频、3D内容”,这五个模态资产的AI生产,长期来说一定是解放大家生产力的。
现在我们看AI生产文字、图片、音频相对比较成熟了,视频在未来几年里有Sora的驱动只会越来越好,作为XR从业者,我们认为这会对AI生产3D资产非常利好,视频之后的最后一个山头,就是3D内容了。
从去年开始,AI生产3D的论文、项目就呈现井喷似发展,这对于XR方向是非常非常利好的,也是我期待的。
不过Sora的出现,还是为解放生产力开了个好头,互动课程的内容制作是非常费时费力的,如果AI生产视频更成熟,那一定会降低很多成本。
AR从业者,阿P:其实去年就开始试用国内外的文生视频和图生视频工具了,好用的几乎没有。
也因为旧有的这些都不太行,才让视频生成行业体验到被OpenAI支配的恐惧了,哈哈。
但这是好事情,期待3D市场也有被引爆的一天。我们前几天还在讨论一个公式:Sora+XR+3D+GPT=?
不敢想象到时候的学生们是在怎样的环境里学习!
如枪终结了弓箭的时代
思证教育联合创始人、原好未来战略投资总监,周海峰:影响是革命性的。
现在教育行业的教研和课件都要依赖于专业老师,配套制作也需要动画专业人才和脚本拍摄剪辑等人才,而Sora不断迭代后很可能让每个知识点的讲解快速生成【教学】视频,这对于机构来说是革命性的。
很可能机构都会不存在。
以终为始看,可能OpenAI就是最大的应用,未来在教研能力之上要比拼AI的应用能力,【应用Sora就看谁生成的准确】。
【从细分行业而言,也会诞生了很多新的创业机会】,不分大小公司,都有跑出来的机会,【中后台的课程与产品很可能都会拉齐,最后比拼的是运营能力以及前端市场流量。】
教育行业未来一两年非常可能会发生颠覆性变化。
现在的心情:兴奋,紧迫!
世界模拟器?AI小老师!
自媒体人,双引号:OpenAI指出Sora是“世界的模拟器”,即打开物理世界的一条有效的、更通畅的道路。
这是一个能够模拟复杂世界动态的AI,这是一个可以“反映”虚拟世界或现实世界的系统——就像科幻电影《头号玩家》中那样,带上VR装置,就能沉浸在詹姆斯·哈利德创造的虚拟世界“绿洲”中,玩家与虚拟世界的互动场景被不断延展。
而在教育场景下,情景化学习、跨学科学习、主题性学习、项目式学习和学科实践,都与教学中创设情境有关。
Sora作为一种视频生成工具,具有创设情境的天然优势。
比如有了Sora,老师只需要几句话就可以生成自己的短视频内容并给出学生个性化对话评价报告,甚至可以使用被学生喜欢的IP形象和互动形态。
不费老师,太棒。