【通义万相新模型发布,数字人生成效率大飞跃】⑴阿里宣布开源多模态视频生成模型通义万相Wan2.2-S2V。⑵该模型仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、肢体动作流畅的数字人视频。⑶据介绍,Wan2.2-S2V的单次生成视频时长可达分钟级别,显著提升了数字人直播、影视制作和AI教育等行业的视频创作效率。⑷该模型可驱动多种类型的图片,包括真人、卡通、动物和数字人,并支持肖像、半身、全身等多种画幅。⑸除了音频驱动,Wan2.2-S2V还支持文本控制,通过输入提示词可以对视频画面进行更精细的控制,使视频主体的运动和背景变化更加丰富。⑹此次开源有望推动数字人技术和相关行业的快速发展。
【通义万相新模型发布,数字人生成效率大飞跃】⑴阿里宣布开源多模态视频生成模型通义万相Wan2.2-S2V。⑵该模型仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、肢体动作流畅的数字人视频。⑶据介绍,Wan2.2-S2V的单次生成视频时长可达分钟级别,显著提升了数字人直播、影视制作和AI教育等行业的视频创作效率。⑷该模型可驱动多种类型的图片,包括真人、卡通、动物和数字人,并支持肖像、半身、全身等多种画幅。⑸除了音频驱动,Wan2.2-S2V还支持文本控制,通过输入提示词可以对视频画面进行更精细的控制,使视频主体的运动和背景变化更加丰富。⑹此次开源有望推动数字人技术和相关行业的快速发展。