多知网3月11日消息,有道智云平台今日官宣“小采样数字人平台”,基于智能化、个性化积累,用户可以在平台直接创建自己的虚拟形象,适配短视频制作、视频翻译等需求。
据介绍,这些虚拟形象可以模仿真人表情动作、在多种场景下自然交流,同时支持照片说话和唱歌功能,静态照片与图像均可以通过语音或旋律更生动地表达。
官方推文介绍了几个功能:
在视频翻译为例,该功能融合人工智能、自然语言处理和数字形象合成技术,可以将视频内容转换成多语言版本,包括产品宣传片、互动直播等等。
以形象克隆为例,该功能可以对真实人物进行一比一的深度复制,包括视觉上的面部特征、身形轮廓,动态表现的动作习惯、微妙表情,以及声音质感和语气节奏等。
以歌声合成为例,区别于语音合成技术(TTS),有道小采样数字人采用的是原创歌声合成技术,能够满足说话、高难度歌曲演绎等需求。用户上传一张照片和一段声音(日常聊天内容或歌唱音频等均可),10分钟后即可生成。
目前平台talk.youdao.com已经免费开放。(多知网 Mint)