您当前的位置:中国品味生活网 资讯 正文

你换脸了吗AI换脸APP刷屏人脸识别都用了哪些黑科技

2019-09-02 12:39:07  阅读:6488 作者:责任编辑NO。姜敏0568

出品:"SELF格致论道讲坛"大众号(IDSELFtalks

以下内容为我国科学院重庆研讨院人工智能联合研讨中心副主任温浩讲演实录:

为什么要做人脸辨认?

前段时刻咱们看到一个新闻,在张学友的全国9场演唱会上,接二连三的有逃犯被捕,总共抓了25名逃犯,其间有些是潜藏多年的逃犯。一方面阐明张学友的号召力特别强壮,但更重要的是暗地咱们的人工智能技能。

公安经过在安检门和会场布设许多摄像头,实时剖析每一位参与观众的面部。当逃犯出现在现场的时分,后台立刻核算剖析出来,告诉咱们的公安干警。

所以咱们的公安干警能够在短时刻内高效地抓到逃犯,它为公安省去了许多的人力和物力。这便是人工智能技能给咱们的日子带来的保证和安全。

除了保证安全外,咱们在各种场合如门禁、高铁、机场,都在许多运用人脸辨认和其他技能。举个比方,在有些当地,咱们也运用刷脸付出。

咱们为什么要做人脸辨认?当然不可是为了抓逃犯,咱们是为了一个新的年代,叫做人类和人工智能协作共存的新年代。

咱们或许对人工智能既了解又生疏,觉得是不是人工智能要代替人?咱们其实是抱活跃达观的情绪,它一定是和咱们协作共存的。协作一定是从辨认人开端的,假如机器连你是谁都不知道那它怎样和你协作?

那辨认是从什么时分隔端?咱们以为应该是从核算机视觉开端,所谓百闻不如一见,许多时分咱们对人的信息是来自他的脸,来自他的外在形象,这是一个最重要的信息。

咱们70%的信息都来自于视觉,所以人脸辨认是十分重要的视觉的进口,在各行各业现已得到广泛的使用。

比方经过刷脸付出,咱们能很便利地买到一杯咖啡,不需求带卡,不需求带其他东西,也不需求记暗码。

刷脸付出

在机场经过安检口辨认之后,咱们能够走到一个航显屏上,它能够实时地把我要去的意图地、航班、登机口都显示出来,一同能够指示我怎样走到登机口。

这便是十分好的展示人工智能协助咱们更好地日子的比方,不可是保证咱们的安全

才智航显

怎么扫除光、视点的搅扰

咱们要到达让机器更靠谱地辨认人的意图,第一个便是要处理人脸辨认。

人脸辨认的基本原理是经过摄像机拍一张你的相片,然后在后台核算机上剖析。相片是有视点、有光线的,怎么让核算机脱节这些搅扰要素?

假如是旁边面和正面,会有怎样的影响?假如是逆光,人脸或许都看不清楚了,这时怎样把它辨认出来?这些要素都是咱们首要要考虑的。

光线改变

从2013年开端,咱们做了一些实验性的作业。

首要,咱们规划了一个大规模的摄像头阵列,这个阵列有91个摄像头,包含7层,咱们叫7种俯仰角,以及13个不同偏转视点,咱们叫偏航角。

这91种视点,91个摄像头,能够在毫秒的差错范围内一同收集到一个人不同视点的人脸,咱们称之为结构化的数据。

多视点人脸收集阵列

它有别于咱们在互联网上收集到的一些人脸相片,或许是咱们自己拍的相片,由于它没有视点信息。咱们需求知道相片是什么视点拍的,这个便是结构化。

它能够让核算机在短时刻内经过少数的数据练习,对一个人不同的视点采纳有用的剖析。这个设备咱们现在还在用,收集到上千万张结构化的人脸。

其次,咱们模仿了各式各样的光源,强光、弱光、逆光、顺光,或许是太阳光,或是弱小的星光,或许室外的车灯、室内的照明灯,来看这种光源状况下,不同的光照等级下人脸的改变状况。

多光源模仿光环境

这是从视点和光源两个方面去辨认人脸。

经过这些技能,咱们今日能够把人脸辨认的误识率做到亿分之一相当于1亿次测验假充他人去验证,只要一次时机的概率经过,这基本上能够掩盖到绝大多数的使用。咱们人眼的正确率大概是97%左右,它现已是99.8%了。

误识率亿分之一

辨认“活人”

仅仅靠这个就能够把工作做好了吗?还不可。

举个比方,前段时刻咱们看到宁波有一套行人的闯红灯辨认体系,它能够把不合法闯红灯的行人实时抓拍并曝光在LED屏上。

成果有网友看到董明珠女士的相片曝光在曝光台。咱们觉得很古怪,为什么董明珠会在宁波,细心一看发现原来是公交车上的车身广告。

车身广告有董明珠女士的人脸,摄像机把她精确地辨认出来了,然后被以为是不合法闯红灯了。

乃至还有交警在法律的过程中也被抓拍下来,也被以为是闯红灯了。

这种状况让人为难,辨认没有错,但犯了一个最大的问题是这是不是实在的人脸,假如不是实在的人脸就应该扫除去。

这牵扯到别的一项技能——活体检测技能,它能够分辩是平面的相片,仍是视频,仍是一个实在的人脸,乃至是一个3D的人脸模型,都能够把它分辩出来,这是咱们要做的第二项技能。

最早咱们的技能是用在手机银行,或许是证券的长途开户,比方今日许多APP上用刷脸登陆,它会让你眨眼、回头或许是张嘴,这些动作是随机的,你不或许事前录制好,经过这些动作就能够判别出你是真人仍是相片。

动作检测

但咱们在运用过程中会发现它比较慢,快的话也要三五秒钟,慢的话或许要十几秒钟,有时或许不太便利。要害它让你觉得不太友爱,为什么要做这些看起来很傻的动作?所以这便是咱们现在要处理的。

第二代的红外双目技能。它经过两个摄像头,一个是可见光的摄像头,RGB的,还有一个是红外光摄像头,咱们尽管人眼看不到,但它对咱们的人脸是比较灵敏的,它能够反射,能够被红外的摄像头收集到,但假如是相片,或许是视频、平板,它反射回来的相片是不一样的。

红外双目摄像头

这里有两幅图片,一幅是可见光的RGB的图画,一幅是红外光的图画。红外光本来是看不到的,咱们把它经过一些核算展示出来。

能够看到这两幅图片是对同一个人脸一同收集的,假如是相片的话一定是有很大差异的,经过这种差异性的核算能够把实在的人脸和相片区分隔。

RGB图画(左)红外光图画(右)

像这样的技能,咱们现已用在刷脸付出,银行里的刷脸取款,包含在华南理工大学各式各样的学校e银行里边有许多刷脸购物的东西,它的设备上都有这样一个双目摄像头。

咱们在内部也会做许多进犯,自己去进犯自己。比方经过挖眼睛、挖嘴巴等的人脸相片,还有各式各样的人脸的面具、3D模型一同进行测验,让核算机能够实在地分辩是进犯的仍是实在的。

人脸相片和面具进犯测验

可是咱们现在的技能仍是平面的,最重要的是开展一个三维的、实时的生成人脸,咱们采纳结构光的技能

它相同是红外光,也相同有至少两个摄像头,一个是可见光摄像头,一个是红外光摄像头,可是这个光跟方才不一样,它是有结构的,比方说二维的点阵。

红外结构光3D成像

假如有一万多个二维点阵,它能够一同投射到人脸上,由于这些光有结构,它经过空间的传输后到人脸,人脸是有深度的,经过反射之后会发作形变,形变信息经过核算今后就能够得到人脸的实时的3D模型。

这个技能能够精确地完成人脸3D建模,当然就能够分辩出人脸是平面的仍是实在的。这个技能能够用来实时地如经过一张相片就能生成你的人脸模型,他的旁边面、正面、顶部和底部,都能够快速地完成。许多文娱化的使用里也会用这样的技能。

实时3D人脸模型

拍不到脸怎样办?

有了这些技能之后,咱们基本上能够比较精准地辨认到一个人脸。但这还远远不够,许多时分摄像机是固定的视点,并不能拍到你的人脸,这时怎样办?

从2017年开端,咱们在做这样一个技能叫跨镜追寻,不同的摄像机能够把同一个人的穿着、姿势、配饰都辨认出来,然后依然把你定位出来

跨镜追寻

这个技能十分有用,假如用在抓逃犯上,能够更精准地经过少数的摄像机就能把方针人物检测出来。

当然它能够用在其他更多当地,假如说一个女孩在公园里跑步,公园主干道上有一些摄像机,这些摄像机在没有拍到人脸的状况下,依然能够把这个女孩的穿着和步态辨认出来,然后对她进行轨道的盯梢,这便是咱们的跨镜追寻技能。

这个技能除了抓逃以外,还能够用于协助迷路的儿童、迷路的白叟,能够实时地、快速地盯梢。一同,这个技能还能够用在商业里边。

三个方针:为了更靠谱地辨认人

咱们的人脸辨认技能,或是行人辨认技能,它都能够让咱们比较精准地去辨认,但咱们仍在持续研讨一些更前沿的技能,期望能够愈加精准地去辨认人,咱们的方针是靠谱地辨认人。

首要,咱们的技能能不能做在前端,而不是一直在后端,要靠核算机、服务器完成,这样的话它的实时性、核算量都会比较复杂。所以咱们会放在前端,包含到咱们的摄像机、无人机上面去做。

第二,咱们要远间隔、大规模地辨认。假如是上百人、上千人的场合,咱们能不能快速地辨认,并且当间隔相对来说或许比较远时,相片的分辩率、每个人人脸或人体的分辩率会比较低,这时咱们照样能够把它辨认。

第三,辨认人是终究意图,所以不可是核算机视觉,还有语音、手势,包含动作、唇语咱们都能够去辨认。做辨认的意图是要辨认人、理解人,终究是协助人,所以它一定要完成一个完好的人机交互。这是咱们开展的三大方针。

我简略地用三个视频来展示咱们三大方针的开展。

第一个是科幻电影《头号玩家》,这里边便是用无人机直接快速精确地锁定方针,现在这现已不是科幻场景了,现已在实时地完成了。

和一些合作伙伴一同,现现已过无人机、摄像头,或许一些移动式设备就能够直接辨认到咱们的方针。它的难度在于它的核算量一定要放在前端的移动体系里边。

前端快速辨认

第二个是咱们在商业门店做的能快速地辨认上百名顾客,能够把他们实时的人员分布图,每个人的移动轨道,他关于哪些区域比较感兴趣、停留了多久,都能够剖析出来。

这关于商家来说是十分有用的商业剖析,他能够知道他的店里边发作了怎样的价值,每个人是怎样的规则,能够做实时的剖析。

远间隔大规模辨认

第三个,咱们经过多模态的技能,人机交互,包含语音、人脸、唇语、动作归纳地辨认人,然后完成一个完美的人机交互

在这里,他经过不同的动作来操控地图,或许找寻他的意图地,终究在车上经过一些相关的办法认证它,终究完成一个比较完好的交互。

这三个方针到达之后,咱们就能够终究完成靠谱地辨认人的意图。

归纳辨认

终究,我想以卡斯帕罗夫的话结束,他最近写的一本新书《深度考虑》里边说到:

咱们终究会被人工智能这样一个技能逾越,乃至替代,这是咱们社会正在发作的必然趋势,可是咱们不应该惧怕,咱们应该努力地面临,努力地和它协作,终究到达一个新的高度,这才是咱们应该去活跃地考虑和处理的情绪。

咱们信任,在座的各位也会在人工智能范畴发挥你们的聪明才智,做出更多更好的新事物!谢谢咱们。

“SELF格致论道讲坛是我国科学院全力推出的科学文化讲坛,致力于精英思维的跨界传达,由我国科学院核算机网络信息中心和我国科学院科学传达局联合主办,我国科普饱览承办。SELFScience, Education, Life, Future的缩写,旨在以格物致知的精力讨论科技、教育、日子、未来的开展。重视微信大众号SELFtalks获取更多信息。

本文出品自“SELF格致论道讲坛大众号(SELFtalks),转载请注明大众号出处,未经授权不得转载。

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!