位置:主页 > 热点追踪 >

AI时代,真实已经是易碎品了

编辑:秀儿/2019-06-20

【图片声明:图片来源网络,如有侵权请联系作者删除!】

  AI年代,实在现已是易碎品了

欢迎重视“创事记”微信订阅号:sinachuangshiji

  

文/霍炬

  

来历:歪理邪说(ID:wxieshuo)

  

先做声明,尽管文末我提到了一次正在做的工作,可是这不是一篇软文。仅仅由于观念不约而同很快乐,所以提了一下罢了。期望不要影响你的阅览。

  

这几天,科技新闻的头条大事是:Facebook发布了名为Libra的加密钱银白皮书,这是一套根据加密钱银理念规划的,且Facebook不能彻底操控的数字钱银。当然,它依然是几家巨子操控的中心化较强的钱银,而不是实在的去中心加密钱银。这不是Facebook第一次测验这个方向,这一次它的预备比以往的计划完善许多。尽管和实在的“区块链去中心钱银”还有许多差异,可是好歹巨子们总算冲进了这个商场。

  

所以,即便Facebook的意图达不到,关于整个职业依然含义严重。不过我这篇文章并不是专门评论FB的加密钱银,区块链和加密钱银这两个东西严密相关,有的项目垂青链多一些,有的垂青币多一些,Facebook的Libra是垂青币多一些,更着重强调它的付出功用,和更低本钱的跨国付出结算。而十分偶然的是,相同在这几天,Stephen Wolfram也写了一篇关于区块链的文章,这篇文章讲到了区块链的一个重要运用,可是在FB发币新闻的热潮下,它取得重视少了许多。但在我看来,这篇文章评论了的东西更值得考虑。

  

Stephen Wolfram知名度在中文国际好像并没有特别高,这和他的实践业界位置距离很大。

  。假如让我点评,他是整个职业界最天才的人之一。此人无论是科研仍是商业,都有超乎寻常的成果。他15岁就开端宣布物理学论文,专心想做物理学家,20岁在加州理工拿到了物理学博士学位之后,开端研讨杂乱性理论,之后为了他的研讨需求,决议自己做一些东西,终究发明晰Mathematica。Mathematica算的上是前史上最重要的软件之一。除了数学和物理研讨,他也是最早研讨人工智能的科学家之一。 为什么他会写这篇文章呢,要从根据深度学习的视频换脸术DeepFake谈起,假如你常看科技新闻,应该记住上一年这时分抢手的换脸黑科技DeepFake。一年之后,根据它的各种古怪运用层出不穷,起先人们也便是拿来换换明星的脸玩,但很快人们发现,这种技能假如用来做假新闻,就会形成极大破坏性和难以预料的成果。跟着2020美国大选越来越近,这种忧虑也随之添加。

  

六月初,美国众议院情报委员会召开了一个听证会,期望了解DeepFake和AI相关的一些问题,Stephen Wolfram是被约请参加听证会的人之一。可是他没空去,所以把主意写成了这篇文章放在了自己Blog上。这关于我这样的读者却是个功德,这能够让他更沉着的写下他的主意,而不是被听证会的节奏搅扰。

  

众所周知,假造相片是一个前史悠久的技能,从有PhotoShop之前的年代运用传统胶片人们就一向在做,Stephen Wolfram说相片假造技能和照相技能前史简直相同长。而今日咱们的问题是,当AI能够用来参加假造相片的时分,咱们有没有简略的方法分辩出哪些相片是真的?究竟之前咱们说“无图无本相”,现在是“有图有视频它也未必是真的”。

  

要评论这个问题,咱们先要躲藏技能细节来简略介绍一下假造相片和视频运用的人工智能技能:GAN(生成对立网络),用最简略了解的方法,能够看作两个体系相互对立,一个体系生成假数据集叫做生成器,别的一个体系叫做判别器,它用实在数据集来判别生成的假数据集的真伪。然后两个体系相互对立,终究意图便是让判别器无法判别真假,所以这类体系的方针便是生成机器无法判别真假的数据集。GAN网络当然不是全能的,说它有智能也是一种美化的说法,它当然没有实在的智能,也了解不了逻辑自身,可是用在假造视频和相片上,它现在的才能现已满意给人类带来麻烦了。由于假如生成器生成的内容满意多,并且运用交际网络传达和转发,那么要辨别真假,就成了一个工作量巨大的工作。信任在这个年代,大部分人都对各种群里边千奇百怪的流言有深入体会,那么考虑一下,这些文字流言都配上了很实在的相片和视频的时分,要辨别真假的劳动力会添加多少?

  

现已无法阻挠人们运用机器连绵不断发作假图片和视频了。关于某些关键性内容,人类应该还能够花费巨大的本钱,由相似鉴证小组这样的专家安排来判别真伪,可是关于日常日子中,尤其是交际网络盛行的海量内容,限于功率和人力本钱,能够说是力不从心的。假视频生成的速度会远远大于判定的速度,即便能判定出来真伪也没含义了。

  

要高功率的辨别真假,那就只能依托机器,运用AI来辨别假视频的创业公司也呈现了不少。可是假如考虑这个问题:机器有没有才能辨别图片和视频是否是假造的?很惋惜,答案应该是失望的。失望的原因在介绍GAN的原理时分现已包含了,已然生成器的意图便是应战判别器使之无法分辩,就意味着这样的图片和视频,机器现已分辩不出了。尽管人类能找到一些图片生成的缺乏,做出更好的判别器来,但这些缺乏相同会被生成器补上。Stephen Wolfram的说法是“这是一场军备竞赛”,两者博弈,终究成果只能是让假数据到达更高的高度。所以想用机器来协助区别真假的主意,或许会在短期内有用,但长时刻看来,这些挣扎都是无力的,终究一定是生成器强于判别器,即无法判别的假图片和假视频会制胜。

  

依照这个推论,咱们今日界说“实在”的方法会发作彻底的改变。现在咱们做为事情实在发作的依据都不再可信,比方说,现在你能够拿行车记载仪的视频证明自己在交通事故中是无责一方,可是未来,这种依据或许就无效了,由于谁也不知道视频是不是被AI重新处理过的。乃至社会上盛行的相片和视频,假的会比真的还多,由于一个实在的视频,通过AI处理能够变成不同的假视频,用在不同场合。现在社会的许多锚点都会消失,而咱们对此毫无方法。

  

所以,咱们需求一套彻底不同的思路来处理实在性问题,即:从现在的“默许相片和视频实在,除非找到依据证伪“,转变成“默许相片和视频是不实在的,除非找到依据证真”。为了满意这种需求,就需求一种体系,能够公平,中立的寄存全部依据,并且让机器简略读取这种依据,给出“可证真概率很高”之类的定论。Stephen Wolfram以为,这种体系便是区块链。区块链的去中心,不行篡改,以及比较好的程序可读写特性,都完美契合以上需求。

  

运用区块链技能不能直接判别实在,可是假如每一个视频创立出来,每一个相片拍照完结,就在区块链上存证,将来就有或许让机器运用这些依据来协助人判别真假。并且,今日咱们还不能彻底预知未来国际的改变,也不知道AI和假造技能会开展到什么程度。所以咱们只能尽量保存更多的元数据。包含拍照时分的场景数据,比方GPS信息,时刻,温度,气候…各种相关和不相关的信息,都应该保存起来,越多的元数据,将来用来判别真假的数据越足够。具体做法便是把全部这些元数据打包到媒体文件中,然后核算hash,把hash记载到一个去中心的区块链上。比及将来有一天,机器会有方法读取今日保存的信息,用来确认信息实在性。现在的“无图没本相”,就会变成“不在链上没本相“。

  

这儿特别需求留意的是,要完结这个体系还有许多技能细节需求处理。比方并不是寄存在链上的数据一定是真的。相同或许呈现第一个作者拍照视频之后先进行假造,再签名往区块链上寄存,这时分要判别真伪就变得愈加困难。所以终究判别真伪的成果依然仅仅一个概率,而不是放在链上100%便是实在的。可是揭露寄存了尽量多的元数据之后,人们能够运用这些元数据来进行更多的剖析和穿插比照,进一步下降假造的或许性。如前面这个比如,假如假造的视频中呈现了的人,在附近的时刻段内,在区块链上找到了别的一个不同地理位置的视频也包含了他形象,那么就能够以为这两个视频中至少有一个是假造的。并且,这种假造的依据在链上无法被消除,终究会使得上传者的可信度下降。总归,这样的体系能够供给更多的正派,运用更自动化的手法解决问题,它依然不是完美的解决计划,可是比没有这个体系仍是好许多。未来人们会越来越体会到概率的无处不在,人们只能说“有很大概率是真的”,很难说“肯定是真的”。

  

这个推论进程十分明晰简略,并且也的确想不到其他解决计划了。实践上Stephen Wolfram一向是记载悉数个人数据的推重者,他在长达二十多年的时刻里,尽或许的记载了自己周围的全部数据,从工作时刻到运用的文档类型,邮件发送频率,全部数据只要能记载的都记载,并且会写程序剖析这些数据。仅有的差异是,曩昔这些数据他自己寄存,供自己运用,但在未来,做为信息创立者,一部分数据记载应该被揭露出来,供更多人运用,这是一个有意思的改变。

  

让我比较惊喜的时分,这和咱们的思路是共同的。我之前从前写过咱们做PRESSone的方针是协助完结“确权”,并且我还常常企图解说“确权”不是“版权”,尽管确权之后下一步能够完结版权相关运用,可是这两个概念是不相同的。可是我一向没找到特别好的比如来阐明,为什么不相同,以及为什么要运用区块链这么杂乱的体系来完结确权,所以PRESSone总是被人们归类为“内容版权“类运用,说它是内容版权当然也不是不能够,但确权才是更重要的根底。区块链比较中心数据库是一种贵重得多的存储体系,已然运用了这种贵重的计划,那么就需求有贵重的理由。人们最简略问的问题便是:“为什么我需求运用它”。很有意思的是,跟着时刻的推移,这种答案正在越来越多的冒出来,科技的开展使得人类在许多场景下不得不需求这样的体系。并且科技的开展正在把越来越多的人卷进这个范畴,曩昔仅仅科技职业从业者,现在创作者也不得不关心这个范畴。谁也不想让自己的著作将来变成发明用处不明的假视频的资料,那么现在需求做的便是,保存不行篡改的数据,然后等着未来到来。

  

参阅补白:

  

封面图 Photo by Agence Olloweb on Unsplash

  

Stephen Wolfram的Blog: https://blog.stephenwolfram.com/2019/06/a-few-thoughts-about-deep-fakes

  

DeepFake: https://en.wikipedia.org/wiki/Deepfake

  

众议院情报委员会听证会记载:https://intelligence.house.gov/news/documentsingle.aspx?DocumentID=657

  

PRESSone是什么: https://static.press.one/files/PRS_whitepaper_1_0_1_cn.pdf