首页 体育 教育 财经 社会 娱乐 军事 国内 科技 互联网 房产 国际 女人 汽车 游戏

DeepFakes=假货制造机?一文告诉你深度伪造技术的发展现状

2020-05-22

编者按:本文来自微信大众号 “AI科技大本营” ,36氪经授权发布。

作者 | Kyle Wiggers

翻译 | 天道酬勤

修改 | Carol

Deepfakes是什么?

「深度假造技能」是一种运用人工智能将现有图画、音频或视频中的人物替换成其别人的肖像的媒体,这种技能正在迅速展开。这令人很忧虑,不只因为这些假货或许被用来在推举中左右言论,或将或人卷进违法,并且还因为它们现已被乱用来制作艺人的色情资料,并诈骗首要的动力生产商。

面临这一新实践,由学术安排、科技公司和非营利安排组成的联盟正在研讨开发人工智能发生的误导性媒体的办法。

他们的作业标明,检测东西是一种可行的短期解决方案,可是深度假造军备比赛才刚刚开端。

人工智能发生的最好的散文比《愤恨的葡萄》更挨近《张狂的图书馆》,可是顶级的言语模型现在可以用人文般的才智和意志来写作。旧金山研讨公司OpenAI的GPT-2只需几秒钟即可制作出《纽约客》文章或团体评论游戏场景的文章。

更让人忧虑的是, 米德尔伯里世界研讨中心恐怖主义、极端主义和反恐中心的研讨人员以为,可以运用GPT-2和其他类似的安排来宣扬白人至上主义、伊斯兰圣战主义和其他具有要挟性的意识形态。

为了寻求一种可以检测组成内容的体系,华盛顿大学的保罗 G 艾伦计算机科学与工程学院和艾伦人工智能研讨所的研讨人员开发了Grover,他们宣称该算法可以从开源通用抓取语料库编译的测验会集选出92%的深度假造的书面著作。

该团队将其成功归因于Grover的案牍办法,他们说这种办法有助于他们了解人工制品和人工智能来源的言语的古怪。

来自哈佛大学和麻省理工学院—IBM沃森人工智能实验室的一组科学家别离发布了巨型言语模仿测验室,这是一个旨在确认文本是否由人工智能模型编写的网络环境。在给定语义上下文的情况下,它可以猜想哪些单词最有或许呈现在语句中,本质上便是编写自己的文本。

假如要评价的样本中的单词与前10个、100个或1,000个猜想的单词匹配,则指示器别离变为绿色、黄色或赤色。实践上,它运用自己的猜想文本作为基准来发现人工生成的内容。

最先进的视频生成人工智能与自然言语相同强壮,乃至更强壮。由香港草创公司SenseTime、南洋理工大学和中国科学院主动化研讨所宣告的一篇学术论文具体介绍了一个结构,该结构经过运用音频组成传神的视频来修改资料。

首尔Hyperconnect公司的研讨人员最近开发了一种东西MarioNETte,该东西可以经过组成因别人的动作而动画化的面部来操作历史人物、政治家或CEO的面部特征。

但是,即便是最传神的深度假造也有一些手工艺品披露出来。网络安全公司Deep Instinct的深度学习小组负责人伊沙伊•罗森博格经过电子邮件萍水相逢VentureBeat::“‘生成体系’生成的‘深度学习’学习视频中实践图画的数据集,你可以向其间增加新图画,然后用新图画生成新视频。”

“结果是,输出视频具有纤细的差异,因为由深度假造人工生成的数据分布和原始源视频中的数据分布发生了改变。这些差异是深度假造检测器可以区别的。”

上一年夏天,加州大学伯克利分校和南加州大学的一个团队练习了一个模型,来寻觅准确的“面部动作单位”,即人们面部运动、抽动和表情的数据点,包括他们举起上唇的时间以及皱着眉头时的头部旋转办法——可以识别出90%以上的被操作视频。

相同,在2018年8月,美国国防高档研讨方案局的媒体取证项目的成员对体系进行了测验,这些体系可以从头绪中检测出人工智能生成的视频,这些头绪包括不自然的眨眼、古怪的头部运动和古怪的眼睛色彩等等。

几家草创公司正在将类似的深度假造视频检测东西商业化。总部坐落阿姆斯特丹的深度追寻实验室供给了一套监督产品,旨在对交际媒体、视频保管渠道和虚伪信息网络上载的深度假造内容进行分类。

黛莎提出了一些技能,用于改进在经过处理的视频数据集上练习的深度假造检测器。Truepic于2018年7月为其视频和相片深度假造检测服务筹集了800万美元的融资。2018年12月,该公司收买了另一个深度假造的“检测即服务”草创公司Fourandsix,该公司的假造图画检测器已取得美国国防高档研讨方案局的答应。

除了开发彻底练习有素的体系外,许多公司还发布了语料库,来期望研讨界可以开辟新的检测办法。为了加速这种尽力,Facebook与亚马逊服务、人工智能协作伙伴关系以及来自许多大学的学者一同,首先展开了深度假造检测挑战赛。挑战赛包括一组视频样本数据集,这些数据集带有标签来指示哪些内容是由人工智能处理的。

作为FaceForensics基准测验的一部分,谷歌于2019年9月发布了一系列深度假造相片,该基准由慕尼黑工业大学和那不勒斯大膏火德里科二世一同创立。最近,来自SenseTime的研讨人员与新加坡南洋理工大学协作,规划了DeeperForensics-1.0,这是一种用于人脸假造检测的数据集,他们宣称这是同类数据中最大的。

人工智能和机器学习不只合适视频和文本组成,还可以克隆声响。很多的研讨标明,重现人们说话的韵律只需求一个小的数据集。像Resemble和Lyrebird这样的商业体系仅需求几分钟的音频样本,而百度最新的Deep Voice完成等杂乱的模型可以从3.7秒的样本中仿制语音。

深度假造音频检测东西没有丰厚,但解决方案开端呈现。

视频网址:https://youtu.be/DWK_iYBl8cA

几个月前,Resemble团队发布了一个名为Resemblyzer的开源东西,该东西运用人工智能和机器学习来经过获取语音样本的高档表明并猜想它们是实在的仍是生成的来检测深度假造。给定语音的音频文件,它将创立一个数学表明,总结录制的语音的特征。这样一来,开发人员就可以比较两种声响的类似度,也可以在任何给定时间猜想谁在说话。

2019年1月,作为谷歌新闻方案的一部分,谷歌发布了语料库,其间包括该公司的文字转语音模型所运用的数千个短语。样本取自以68种不同的组成声响所讲的英语文章,并涵盖了各种方言。该语料库适用于ASVspoof 2019的一切参与者,该比赛旨在促进针对深度假造语音的对策。

现在还没有检测器可以到达完美的精度,研讨人员还没有弄清楚怎么确认深度假造的假冒者身份。Deep Instinct的罗森伯格以为,这会加重分布深度假造的假冒者的胆略。他说:“即便一个歹意假冒者被抓了,也只要深度假造自身有被损坏的危险。”“假冒者被抓到的危险很小。因为危险低,所以制作深度假造几乎没有威慑力。”

罗森伯格的理论得到了深度追寻的一份陈述的支撑,该陈述在2019年6月和7月的最新计算中在线显现了14698个深度假造视频,在七个月内增长了84%。其间绝大多数包括以女性为特征的色情内容。

考虑到这些数字,罗森伯格以为,因为深度假造而遭受巨大损失的公司应开发并将深度假造检测技能整合到其产品中。这方面现已有了一些开展;Facebook在1月初宣告,它将运用主动和手动体系的组合来检测深度假造内容,而Twitter最近主张符号深度假造,并删去那些或许形成要挟的内容。

当然,深度假造生成器背面的技能仅仅是东西,它们具有巨大的展开潜力。咨询公司Access Partnership的数据和信赖事务负责人Michael Clauser指出,该技能已被用于改进医学确诊和癌症检测,添补制作世界图的空白以及更好地练习主动驾驶体系。因而,他劝诫人们不要进行全面举动来阻挠展开人工智能。

克劳斯特经过电子邮件对VentureBeat表明:“跟着领导者开端将诋毁等现有法令准则应用于新式的深度假造事例中,重要的是不要把婴儿和洗澡水一同丢掉。”“终究,环绕运用这种新式技能的判例法和社会规范还不行成熟到足以在构成合理运用仍是乱用的当地划上红线。”

热门文章

随机推荐

推荐文章