谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

谷歌发布了一个新的视频框架:

只需要一张你的头像、一段讲话录音,就能得到一个本人栩栩如生的演讲视频。

视频时长可变,目前看到的示例最高为 10s。

可以看到,无论是口型还是面部表情,它都非常自然。

如果输入图像囊括整个上半身,它也能配合丰富的手势:

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

网友看完就表示:

有了它,以后咱开线上视频会议再也不需要整理好发型、穿好衣服再去了。

嗯,拍一张肖像,录好演讲音频就可以(手动狗头)

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

用声音控制肖像生成视频

这个框架名叫VLOGGER。

它主要基于扩散模型,并包含两部分:

一个是随机的人体到 3D 运动(human-to-3d-motion)扩散模型。

另一个是用于增强文本到图像模型的新扩散架构。

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

其中,前者负责将音频波形作为输入,生成人物的身体控制动作,包括眼神、表情和手势、身体整体姿势等等。

后者则是一个时间维度的图像到图像模型,用于扩展大型图像扩散模型,使用刚刚预测的动作来生成相应的帧。

为了使结果符合特定的人物形象,VLOGGER 还将参数图像的 pose 图作为输入。

VLOGGER 的训练是在一个超大的数据集(名叫 MENTOR)上完成的。

有多大?全长 2200 小时,共包含 80 万个人物视频。

其中,测试集的视频时长也有 120 小时长,共计 4000 个人物。

谷歌介绍,VLOGGER 最突出的表现是具备多样性:

如下图所示,最后的像素图颜色越深(红)的部分,代表动作越丰富。

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

而和业内此前的同类方法相比,VLOGGER 最大的优势则体现在不需要对每个人进行训练、也不依赖于面部检测和裁剪,并且生成的视频很完整(既包括面部和唇部,也包括肢体动作)等等。

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

具体来看,如下表所示:

Face Reenactment 方法无法用音频和文本来控制此类视频生成。

Audio-to-motion 倒是可以音频生成,方式也是将音频编码为 3D 人脸动作,不过它生成的效果不够逼真。

Lip sync 可以处理不同主题的视频,但只能模拟嘴部动作。

对比起来,后面的两种方法 SadTaker 和 Styletalk 表现最接近谷歌 VLOGGER,但也败在了不能进行身体控制上,并且也不能进一步编辑视频。

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

说到视频编辑,如下图所示,VLOGGER 模型的应用之一就是这个,它可以一键让人物闭嘴、闭眼、只闭左眼或者全程睁眼:

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

另一个应用则是视频翻译

例如将原视频的英语讲话改成口型一致的西班牙语。

网友吐槽

最后,” 老规矩 “,谷歌没有发布模型,现在能看的只有更多效果还有论文。

嗯,吐槽也是不少的:

画质模型、口型抽风对不上、看起来还是很机器人等等。

因此,有人毫不犹豫打上差评:

这就是谷歌的水准吗?

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

有点对不起 “VLOGGER” 这个名字了。

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

——和 OpenAI 的 Sora 对比,网友的说法确实也不是没有道理。。

大家觉得呢?

更多效果:

https://enriccorona.github.io/vlogger/

完整论文:

https://enriccorona.github.io/vlogger/paper.pdf

以上就是谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频的详细内容,更多请关注【创想鸟】其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/2423670.html

(0)
上一篇 2025年3月3日 04:52:56
下一篇 2025年3月3日 04:53:22

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • 黄金回收价钱具有更好的保值效果?

      现在许多金店都有黄金回收的功能,市场每天都有黄金回收价格的参考。交易黄金时,许多商店可以比较并选择价格最高的商店。为什么大家都说黄金回收价钱行情值得关注呢,回收黄金就看这个,实际上是因为这个含金量的问题,在黄金回收店里面的话也会检测含金…

    2025年5月24日
    1600
  • 美白牙贴效果持续多久

    美白牙贴是很流行的一种美白产品,它主要是用来牙齿美白的,可以起到很不错的美白效果,深受人们喜欢。但是美白牙贴的美白效果不是永久的,一般过了两三个月就会失效,所以之后还是需要进行美白护理的。 美白牙贴效果持续多久 美白效果持续约2-3个月。每…

    2025年5月23日
    302.7K00
  • 黄金首饰的保值效果怎么样

      现在很多人在选购黄金首饰的时候,除了要求外表美观大方,还会考虑首饰本身的价值,是否有保值的空间。有的人会问:黄金首饰的保值效果怎么样?今天小编就和大家介绍两款时尚但保值空间很低的黄金首饰。   1、镂空款式   很多人在选择黄金首饰的时…

    2025年5月20日
    1900
  • 雪蛤副作用那么强为何还吃

    雪蛤是现在很多人都知道的一款食物,雪蛤具有很高的营养价值,但是也会有副作用,并不是人人都适合吃雪蛤。那么,雪蛤副作用那么强为何还吃呢?如果你感兴趣的话,可以看看趣丁网带来的介绍哦! 雪蛤副作用那么强为何还吃 雪蛤性味咸平,不燥不火,含有大量…

    2025年5月19日
    663.2K00
  • 黄金回收什么价,黄金首饰保值效果怎么样?

    目前在国内,基本上有三种类型的黄金世界:一个是珠宝中金黄金的商店,他们也有金条,另一种是在银行投资纪念金条,第三个是从上海黄金交易所的金条。那么,知道是否这些黄金首饰可以把这个值会保留吗?相关推荐:黄金回收什么价,项链断了怎么处理?黄金回收…

    2025年5月18日
    1500
  • 黄金首饰回收的保值效果如何?

          黄金首饰回收的保值效果如何?目前,当许多人选择和购买黄金珠宝时,他们不仅会要求一个美丽和优雅的外观,还会考虑珠宝本身的价值和是否有保存其价值的空间。  有些人会问:黄金珠宝在保值方面有多有效?今天,我想介绍两件时尚的黄金首饰,它…

    2025年5月17日
    1800
  • 肩宽背厚打瘦肩针能解决问题吗

    肩宽背厚打瘦肩针能解决问题吗是大家都会问的,毕竟随着夏季的来临很多友友都穿上了仙气飘飘的小裙子,但一些因为上半身比较壮,然而又不想运动的友友,想快点瘦下来所以呢便想着去打瘦肩针,下面小编就和大家加一起看看打瘦肩针背会薄吗。 肩宽背厚打瘦肩针…

    2025年5月16日
    133.3K00
  • 什么样的灭蚊灯效果最好

    灭蚊灯是生活中比较常见的一种家用电器,它使用起来比较方便,只需要插电打开就可以了,并且可以起到很不错的灭蚊效果,很多人都会经常用灭蚊灯,尤其是夏季。灭蚊灯的样式有很多,不同灭蚊灯有不同使用效果,下面具体来看看吧! 什么样的灭蚊灯效果最好 市…

    2025年5月12日
    553.9K00
  • 每天只练刘畊宏能减肥吗

    随着全面健身潮的兴起,越来越多的人加入到减肥大军中,而在诸多减肥的方法中,最为火爆的便要数刘畊宏健身操了,于是每天只练刘畊宏能减肥吗成了很多友友都好奇的,下面小编就和大家一起看看跟着刘畊宏一个月瘦多少。 每天只练刘畊宏能减肥吗 每天只练刘畊…

    2025年5月8日
    454.0K00
  • swooie教程全套

    Swooie 是一款创建交互式视频和图片故事的网络平台,提供一系列教程,涵盖以下内容:初学者指导:介绍界面和基本操作创建和编辑项目:添加文本、图像、视频等元素高级技巧:视频编辑、动画效果和交互创建项目管理:团队协作和项目发布 Swooie …

    2025年5月2日
    000

发表回复

登录后才能评论