你可能在社交媒体上看到过逼真的AI视频。那个雪地里堆雪人的风暴兵?海浪中滑行的独角兽,以及在北极光下狂嗨的企鹅?统统来自谷歌Veo3—...

你可能在社交媒体上看到过逼真的AI视频。那个雪地里堆雪人的风暴兵?海浪中滑行的独角兽,以及在北极光下狂嗨的企鹅?统统来自谷歌Veo 3——我们猜。
如果你能想象,你就能创造,这令人无比兴奋,但同样令人不安——无论是对创意产业的冲击,还是对假消息和事实核查的影响。
快速概览:只需输入你想看到的画面,谷歌现在就能生成一段院线级别的视频片段,包含真实的声音和音效,这点让它区别于其他模型。
作为一个从未具备过导演技能的人,我惊讶地发现,只需在电脑上敲几行字,就能生成过去需要好莱坞特效团队才能完成的画面。
5月30日谷歌在英国推出这项技术后,我们在《地铁报》制作了以下三段视频来测试新技术。
**1. 办公室白日梦**
我们首先想通过展示伦敦人对《地铁报》的真实看法来鼓舞团队士气。我们输入了以下提示:
"从远景镜头开始。阳光明媚的晴天。安静的街道。镜头推近聚集在伦敦肯辛顿高街的人群,周围环绕着宏伟的建筑,包括一家全食超市。人群年轻、时尚且充满期待。一辆红色伦敦公交车驶入画面,车门打开。一只棕色的Lakeland Patterdale梗犬从车上跳下,兴奋地吠叫,扑进一位高个子、古铜色皮肤、鬈发、短须、穿着海军三件套西装的帅小伙怀里。一位端着一摞《地铁报》的高挑女子从车上走出。她将报纸分发给欢呼雀跃的人群,大家立即兴致勃勃地阅读起来。他们异口同声高喊:‘地铁万岁!’"
乍一看还挺真实(对吧?)
但你不需要福尔摩斯的观察力就能发现公交车通常不会从前挡风玻璃开门,商店招牌上写着"Whole Foobs",或是编辑下车后立刻把狗甩手扔开。
我们设想的多元、时尚的伦敦人群体全都是穿着衬衫的年轻白人小伙。众所周知AI会带有训练数据集的偏见,这可能与此有关。
在尝试通过增加细节来优化提示后,我们仍然没有得到多元的人群,但"地铁万岁"的发音变成了"live"押韵"drive"。
**2. 帕森百货外的破坏狂欢**
这段视频不会引发任何骚乱(图片:谷歌)
我想测试生成可能被传播为假消息的画面有多容易——例如看上去真实的视频引发紧张局势。所以我要求视频看起来像手机拍摄的,就像大多数公共事件目击视频一样。
镜头应该像手机摄像头拍摄,略微晃动。画面是典型的英国高街,包括博姿、Primark和乐购。一位戴巴拉克拉夫帽的年轻人冲入画面,抡着锤子砸碎所有店铺玻璃,高喊"你们要为此付出代价"。一位提着购物袋的女子试图阻止他,却被推到一旁。
考虑到最近影响英国各地的骚乱,我想制作一段可能在社交媒体上引发愤怒反应、关于治安问题的病毒视频。
这次测试中,我觉得没人会被骗到。
视频返回时没有声音(这是很多视频都遇到的问题,后面我会提到),施暴者的巴拉克拉夫帽在挥锤时从脸上脱落,明显是AI生成的痕迹。
画面以光泽、高分辨率呈现,完全不像颗粒感强烈的用户生成内容。
**3. 闯入地狱之口**
在撰写关于土库曼斯坦"地狱之门"火山口终于熄灭的文章后,这个想法浮现在脑海中,可能是一个极富电影感的背景。
暮色降临时的土库曼斯坦"地狱之门"达瓦扎火山口。火山口内火焰照亮黑暗的天空。一位四十岁左右的女子,穿着防护服但披散着头发,凝视着深邃的火焰。她说:"他们说这个火山口很快就会熄灭。熄灭前,我要将火焰带回家。"然后她爬过边缘。
这是我最喜欢也是最成功的提示,虽然我没有详细描述。我没看到任何明显的AI缺陷(可能是因为只涉及一个人物,制作起来相对简单),特效甚至可以媲美好莱坞大片。
我不该为此沾沾自喜,毕竟我根本没费什么力气就创造了它。但这也证明这项技术能开启想象的新途径,难怪Veo会火出圈。
**谷歌如何看待这项技术的未来?**
我们问谷歌,考虑到AI已经以惊人的速度发展(连数手指都做不到的AI现在被调侃都显得过时),他们如何看待这项技术的未来。
谷歌DeepMind创意总监马蒂厄·洛林告诉《地铁报》:"我们已经看到Veo 3被用于从制作社交平台短视频,到把内部笑话做成动态表情包,再到快速可视化酷炫概念。自Gemini上线以来,这些一直是主要应用场景。"
**目前生成视频的恼人之处**
现在制作视频的麻烦在于你无法编辑——我不能要求它修改片段,比如让爱狗人士编辑别扔他家狗。它会直接生成全新片段。
洛林先生表示:"我们正在努力增加更容易调整和打磨提示或生成视频的功能。目前,你需要通过修改措辞来尝试生成理想的视频,这需要反复试验,但也充满乐趣!"
谷歌目前正测试根据图片生成视频的功能,这是AI视频领域最受期待同时也是最令人担忧的可能。
如果你上传一张真人的照片,就能制作出极具说服力的深度伪造视频,具备散播假消息的潜力。但也有正当理由这么做。
Reddit创始人亚历克斯·奥汉尼亚最近在推特上分享了一段用另一款AI软件Midjourney制作的视频,他上传了母亲搂住自己的照片,要求生成视频。他解释说母亲20年前就去世,家里买不起摄像机,他没有任何动态影像留存,于是制作了这段简短视频更好地还原照片前后的情景。
**如何用谷歌Veo 3制作视频?**
目前只有订阅用户(每月18.99英镑)才能使用。
获得访问权限后,只需在谷歌的ChatGPT竞争对手Gemini输入提示,或使用更专业的AI filmmaking工具Flow,允许在片段中使用特定角色等一致元素。
用户每天可制作三次视频,防止服务器过载。
制作影片时,只需写一段描述你想展示画面的文字,详细说明风格、镜头运用、主体和台词。谷歌在此提供了成功提示的技巧列表。
**音频问题说明**
谷歌在Flow上警告用户,音频仍是实验功能,因此视频"可能没有声音"(如果出现这种情况,不是你的扬声器坏了)。
他们表示较长的文本片段更能准确生成语音,未成年人内容会被静音处理,并可触发字幕。
"我们正在改进"他们说。
**你能在影院看到这种技术吗?**
AI撼动电影产业只是时间问题,就像它撼动其他行业一样。
你已经能根据上传的信息生成任何主题的逼真播客,我不会对很快能在家中制作任意主题的长篇电影感到意外,根本不用再登录迪士尼+或网飞——当然质量可能良莠不齐,上传畅销小说手稿还可能引发版权纠纷。
洛林先生表示:"就这项技术的未来而言,和所有突破性技术一样,我们仍在了解AI在电影制作中的全部潜力。我们视这些工具为助力,帮助新一代导演更容易讲述他们的故事。通过向 filmmakers 提供Flow的早期访问权限,我们能更好地理解技术如何最好地支持并融入他们的创作流程——这些见解已被融入Flow。
Veo 3在质量上迈出巨大步伐,包含更真实的呈现、4K分辨率、极其逼真的物理效果和音效。作为任何强大的创意工具,它需要勤加练习——你的提示越详细,视频效果越好。想要最大化利用Veo 3,就要把提示看作学习AI语言的过程——越流畅、越具描述性的表达,视频效果就越好。"
本文来自作者[ybkkj号]投稿,不代表ybkkj号 - 深度新闻解读、社会动态、热门事件追踪立场,如若转载,请注明出处:https://ybkkj.com.cn/ybkp/202510-2023.html
评论列表(4条)
我是ybkkj号 - 深度新闻解读、社会动态、热门事件追踪的签约作者“ybkkj号”!
希望本篇文章《谷歌新AI视频工具试用报告创意与风险并存》能对你有所帮助!
本站[ybkkj号 - 深度新闻解读、社会动态、热门事件追踪]内容主要涵盖:ybkkj号,生活百科,小常识,生活小窍门,百科大全,经验网
本文概览:你可能在社交媒体上看到过逼真的AI视频。那个雪地里堆雪人的风暴兵?海浪中滑行的独角兽,以及在北极光下狂嗨的企鹅?统统来自谷歌Veo3—...