深度造假的视频越来越可怕了

由:约翰·多诺万|

男人把脸”width=
如果技乐动-软件术继续沿着目前的轨道发展,将不可能检测出人工智能辅助的深度造假视频。羽创意/盖蒂图片社

在其发展的这个阶段,一些不可否认的令人毛骨悚然的东西仍然存在于“深度造假”(deepfakes)中。“深度造假”指的是在他人帮助下制作和操纵的虚假视频,这个标签涵盖了所有内容,但具乐动体育网站5.0有误导性人工智能(人工智能)和深度,机器学习。

它不仅仅是由这些越来越复杂的软件程序制作出来的奇怪的、一点一点的、不完全正确的视频。虽然,是的,他们可能会让人不安。而且,改变原始照片和视频也不仅仅是一个道德困境。不过这绝对是捅了马蜂窝。

大多数情况下,它是指我们正在迅速接近一个点,在这个点上,我们可能无法相信自己的眼睛。那张照片是对拍摄对象的真实描绘吗?这是视频吗?你的脸和你的身材相配吗?这句话和你的脸很配吗?

可那家伙真的像这样跳舞吗?

广告

深度造假背后的计算机科学

据报道,早在2017年末,Reddit用户乐动体育网站5.0Deepfakes知道你的文化基因揭牌了一些换脸色情视频——它就像听起来一样悲哀和蹩脚;一个人的脸,通常是公众人物的脸,叠加在另一个人的头上——深度造假狂潮开始了。

不久之后,Deepfakes推出了一款名为“FakeApp”的应用程序,人们对它大加赞赏。乐动体育网站5.0从那以后,各种各样的表情包和其他节目——有些有趣,有些令人毛骨悚然,有些更糟——被制作出来。它们包括尼古拉斯凯奇艾米·亚当斯的脸(在《超人》电影中扮演露易丝·莱恩)和一个伟大的BuzzFeed生产特色喜剧演员乔丹·皮尔饰演美国前总统巴拉克·奥乐动体育网站5.0巴马,他在一个有点不受欢迎的视频中警告说,这项技术可能还有一些更邪恶的用途(视频以fauxama的一句台词结尾,“保持清醒,笨蛋!”)。乐动-软件

最新的深度造假视频是由一个冒充汤姆·克鲁斯的TikToker制作的。三段视频惊人的真实,其中克鲁斯正在打高尔夫球。乐动体育网站5.0视频是由Chris Ume创建乐动体育网站5.0他是来自比利时的视觉特效专家。

用来制作这些视频背后的程序的计算机科学可能极其复杂,比简单的深度造假要复杂得多。复杂的算法和计算机科学术语,比如生成对抗的网络(GAN)和深度神经网络充斥着更先进的视频编辑技术的学术论文。乐动-软件

一般来说,这些程序所做的就是一帧一帧地检查一个实验对象的视频,并“学习”实验对象的大小、形状和运动,这样它们就可以被转移到视频中的另一个实验对象。虽然深度造假主要局限于替换受试者的面部,但更先进的程序可以转换完整的3D头部位置,包括头部倾斜或抬头等或者撅起的嘴唇。对整个身体运动也做了一些研究。

这些程序检测的越多,这些网络接收和“学习”的变量就越多,视频就会变得更有效率、更有效、更真实。

广告

除了Deepfakes

值得注意的是,并非所有基于人工智能和机器学习的视频和照片编辑技术都是深度造假。乐动-软件在该领域工作的学者们看来,深度造假是业余的,只是换脸而已。

加州大学伯克利分校(University of California Berkeley)的一个小组正在研究一种技术,它可以将一个职乐动-软件业舞者的整个身体移动起来,然后在视频中把它转换成一个业余舞者的身体。通过一点AI魔法,即使是两只左脚的人至少也能像Baryshnikov一样移动。伯克利的研究小组在论文中详细介绍了他们的工作,每个人都跳舞现在

当然,这乐动-软件项技术并不完美。但这是个棘手的问题。即使是画一张电脑生成的移动脸也很困难。到目前为止,大多数人工智能生成的人脸,甚至是深度造假的人脸,尤其是深度造假的人脸,都是明显的伪造品。有些事情,几乎无一乐动体育网站5.0例外地,似乎有点不对劲。

“我认为其中一个原因是面部的阴影细节,”伯克利大学计算机科学研究生、《现在就跳舞吧》(Everybody Dance Now)的作者之一周廷辉(Tinghu乐动体育网站5.0i Zhou)说。“我们(人类)非常擅长识别一张脸是真的还是假的——阴影细节、皱纹如何移动、眼睛如何移动——所有这些细节都需要完全正确。我认为,如今的机器学习系统仍无法捕捉所有这些细节。”

另一种新的人工智能视频处理系统——或者,正如其设计者所称的,一种“肖像视频的逼真再现”——乐动体育网站5.0实际上使用了一个“源”角色,可以改变“目标”角色的面部。

比如,你,“源头”,以某种方式动你的嘴,电脑将这个动作映射到学习程序中,然后程序将其翻译成视频奥巴马口口相传。你笑了,或者扬起眉毛,奥巴马也会笑。乐动体育网站5.0

一篇关于这个过程的论文,叫做深度视频画像该项目于2018年8月中旬在温哥华举行的计算机图形和交互技术会议上展示,并揭示了该项目的地点:好莱坞。乐动-软件乐动体育网站5.0

30多年来,计算机生成的视频一直是故事片的重要组成部分。事实上,每一部高端电影制作都包含了相当大比例的电脑生成图像(CGI)指环王本杰明·巴顿。”作者写道。“这些结果很难与现实区分开来,人们往往不会注意到这些内容不是真实的……但是这个过程很耗时,而且需要领域专家。即使是制作一个简短的合成视频剪辑,也需要花费数百万美元的预算和数月的工作,即使是受过专业培训的艺术家,也需要手工制作大量的3D内容和动画。”

多亏了人工智能,我们现在可以用更少的时间制作出同样的图像。和便宜。而且——如果不是现在,也会很快——同样令人信服。

广告

走在道德的钢索上

正如喜剧演员皮尔(Peele)等人所警告的,操纵现有视频或用虚假图像制作新视频的过程,如果落入坏人之手,可能会非常危险。乐动体育网站5.0在最令人不安的深度造假早期案例中,一些著名女演员和艺人的脸被偷去,并被编织到色情视频中。就像皮尔在他的奥巴马视频中警告乐动体育网站5.0的那样,用图片来制作“假新闻是非常有可能的。

许多媒体已经采取措施阻止深度造假。Reddit,事实上,关闭了Reddit深度造假版块。Pornhub誓言禁止人工智能色情。Tumblr和Twitter等网站也禁止了色情深度造假。

但监管这些视频可能不是特别容易,尤其是随着制作这些视频的程序不断改进。斯坦福大学(Stanford)计算乐动体育网站5.0机科学教授、深度视频肖像背后的专家之一迈克尔•Zollhöfer (Michael Zollhöfer)表示,学术界人士意识到了其中涉及的伦理问题。从Zollhöfer,在一个新闻稿宣布他的项目:

多年来,媒体行业一直在用照片编辑软件对照片进行润色,这意味着我们大多数人都学会了对照片中看到的东西半信半疑。随着视频编辑技术的不断进步,我们也必须开始对我们每天消费的视频内容更乐动-软件加挑剔,特别是在没有来源证明的情况下。

周说,每个参与建设这项技术的人都需要采取适当的措施,以确保它不被滥用。乐动-软件开发一种软件来检测计算机增强或修改过的视频,并在视频上打上看不见的“水印”,在法医鉴定下显示它们是计算机生成的,这将会有所帮助。乐动体育网站5.0再次,从深度视频肖像:

值得注意的是,我们对最先进的视频编辑工具背后的算法和原理进行了详细的研究和理解,这也是开发能够检测其使用的技术的关键……乐动-软件乐动体育网站5.0检测视频操作的方法和执行视频编辑的方法基于非常相似的原理。

周说:“我认为,作为研究人员,我们肯定有责任乐动体育网站5.0提高公众对这些技术滥用的意识。乐动-软件但我想强调的是:这项研究有很多积极的用途。舞者们要求我们用我们的研究来帮助他们跳舞。这项技术也有积极的一面。”乐动-软件

广告

前方有什么

随着程序变得更加复杂,以及机器更好地学习如何克服这些计算机生成的视频和照片中明显和不太明显的错误,这个领域继续得到改进。谁也不知道它会去哪儿。但很多人担心,这项技术的进步可能会来得如此之快、如此之远,我们可能会进乐动-软件入一个时代,在这个时代里,我们不再相信自己的所见所闻。

这就给我们带来了另一种可能会引发大麻烦的虚假视频,尤其是在即将到来的2020年总统大选中:dumbfakes。例如,2019年5月,a乐动体育网站5.0南希·佩洛西议长的失真视频在社交媒体上迅速传播。视频显示佩洛西在演讲中含糊不清,结结巴巴。事实上,这段视频是由纽约的一位体育博主和“特朗普的超级粉丝”进行了数字修改,然后上传到Facebook上的。这段视频很快就被揭穿了,但那时它已经被观看了数百万次。YouTube删除了该视频,称该视频违反了其标准。然而,Facebook将其保留在网站上,只是说该视频是“虚假的”,并表示将试图限制其可以分享的数量。

虽然这段经过修改的佩洛西的视频不是深度造假的技术,乐动-软件加州大学伯克利分校的乐动体育网站5.0数字取证专家哈尼·法里德在接受NPR采访时表示这就使得这件事更加令人担忧。这些被贴上了“傻瓜”的标签,因为它们比深度造假更容易制作,也更便宜。通常,它需要改变视频的速度或基本的编辑,以产生一个有说服力的新视频。

“时间不等人,”他告诉美国国家公共电台。“南希·佩洛西的视频是煤矿里的金丝雀。”

原刊日期:2018年9月5日

广告