据了解,本联合项目组中的腾讯混元大模型团队,正在持续研究和探索多模态技术。

腾讯联合清华、港科大推出图生视频大模型“Follow Your Click”:一键点,万物动?

2024-03-15 18:51:59发布     来源:多知网    作者:Mint  

  多知网3月15日消息,腾讯联合清华、港科大推出全新图生视频模型“Follow-Your-Click”,目前已经上架 GitHub(代码四月公开),同时还发表了一篇研究论文。

  

  这款图生视频模型主要功能包括局部动画生成和多对象动画,支持多种动作表达,如头部调整、翅膀拍动等。

  Follow-Your-Click 可以通过用户的点击和简短动作提示生成局部图像动画。

  

  用户只需点击对应区域,加上少量提示词,就可以让图片中原本静态的区域动起来,一键转换成视频,比如让物体微笑、跳舞或飘动。

  除了能够控制单个对象的动画,这个框架还支持同时对多个对象进行动画处理,增加了动画的复杂性和丰富性。用户可以通过简单的点击和短语提示轻松地指定希望动画化的区域和动作类型,无需复杂的操作或详细描述。

  这款模型在带来更加便捷的交互同时,也让图片“一键点,万物动”成为现实。

  当前图生视频大模型中,一般的生成方法不仅需要用户在提示词中描述运动区域,还需要提供运动指令的详细描述,过程较为复杂。从生成的效果来看,现有图像生成视频技术在移动图像的指定部分上缺乏控制,生成的视频往往需要移动整个场景,而不是图像上的某一个区域,精准度和灵活性上有所欠缺。

  据了解,本联合项目组中的腾讯混元大模型团队,正在持续研究和探索多模态技术。

  另附:

  论文链接:[2403.08268] Follow-Your-Click: Open-domain Regional Image Animation via Short Prompts

  主页:Follow-Your-Click

  Github:GitHub - mayuelala/FollowYourClick: [arXiv 2024] Follow-Your-Click: This repo is the official implementation of "Follow-Your-Click: Open-domain Regional Image Animation via Short Prompts"