所謂人臉識(shí)別,就是利用計(jì)算機(jī)分析人臉視頻或者圖像,并從中提取出有效的識(shí)別信息,最終判別人臉對(duì)象的身份。雖然對(duì)于你我而言,分辨人臉是從小就習(xí)以為常的技能,但想要計(jì)算機(jī)擁有這雙識(shí)別人臉的“慧眼”,已經(jīng)讓無(wú)數(shù)人類專家殫精竭慮、前赴后繼地投入研究工作,前后竟已有半個(gè)世紀(jì)之久。
在《碟中諜4》有這樣一個(gè)情節(jié),身穿風(fēng)衣的特工在熙熙攘攘的火車站一邊疾步逆人流而上,一邊左右環(huán)顧,迎面而來(lái)的每個(gè)旅客的個(gè)人信息都出現(xiàn)在他的隱形眼鏡上,不一會(huì)就鎖定了要找的人。
而隨著人臉識(shí)別技術(shù)的飛速發(fā)張,類似上述電影中的場(chǎng)景將更多的出現(xiàn)在現(xiàn)實(shí)生活中。2015年以來(lái),騰訊、阿里、民生銀行等國(guó)內(nèi)巨頭紛紛加碼人臉識(shí)別產(chǎn)業(yè),推出眾多應(yīng)用。金融大鱷中國(guó)平安2015年在人臉識(shí)別技術(shù)方面,包括“刷臉”征信在內(nèi)的應(yīng)用場(chǎng)景已達(dá)近10處,使用量已近千萬(wàn)。
那么問(wèn)題來(lái)了,在2015年從年頭火到年末的人臉識(shí)別技術(shù)究竟是個(gè)什么鬼?想要搞清楚這個(gè)問(wèn)題,我們先要了解一下,計(jì)算機(jī)進(jìn)行人臉識(shí)別的一般過(guò)程。
所謂人臉識(shí)別,就是利用計(jì)算機(jī)分析人臉視頻或者圖像,并從中提取出有效的識(shí)別信息,最終判別人臉對(duì)象的身份。雖然對(duì)于你我而言,分辨人臉是從小就習(xí)以為常的技能,但想要計(jì)算機(jī)擁有這雙識(shí)別人臉的“慧眼”,已經(jīng)讓無(wú)數(shù)人類專家殫精竭慮、前赴后繼地投入研究工作,前后竟已有半個(gè)世紀(jì)之久。
畢竟,計(jì)算機(jī)并不是人類,給出一張圖片以后,計(jì)算機(jī)“看到”的照片僅僅是一段編碼的字符串序列,無(wú)從知道人臉在哪里,更無(wú)從判斷其相似性。所以對(duì)于一臺(tái)計(jì)算機(jī)而言,要實(shí)現(xiàn)一次人臉識(shí)別,至少完成三個(gè)步驟:首先,從包含人物的場(chǎng)景圖片中分割出人的面部區(qū)域;然后,從該面部區(qū)域中提取出人臉特征;最后,根據(jù)所提取的特征進(jìn)行人臉識(shí)別。
人臉檢測(cè)是人臉識(shí)別的第一步,當(dāng)今的人臉識(shí)別系統(tǒng)雖然包含無(wú)數(shù)細(xì)節(jié)和各種工程技巧,但大的系統(tǒng)框架不外乎如下流程:首先要確認(rèn)攝像頭捕捉的圖像中是否存在人臉,如果存在,需要先找到人臉的位置(人臉檢測(cè)),然后在這個(gè)基礎(chǔ)上定位人臉關(guān)鍵點(diǎn)的位置(如眼睛中心或嘴角等)。這些點(diǎn)的位置一是用來(lái)做人臉的幾何校正,即把人臉通過(guò)縮放、旋轉(zhuǎn)、拉伸等圖像變化變到一個(gè)比較標(biāo)準(zhǔn)的大小位置。這樣待識(shí)別的人臉區(qū)域會(huì)更加規(guī)整,便于后續(xù)進(jìn)行匹配。同時(shí),現(xiàn)在檢測(cè)技術(shù)一般也都配有人臉光學(xué)校正模塊,通過(guò)一些濾波的方法,去除一些對(duì)光照更加敏感的面部特征。
接下來(lái),計(jì)算機(jī)需要將捕捉到的人臉進(jìn)行特征提取,以往常用的方法有提取面部幾何特征或特征臉?lè)椒ā;趲缀翁卣鞯姆椒ǎ菀资艿饺宋锉砬橐约坝裳坨R、頭發(fā)、飾物等外部物體引起的面部圖像部分遮擋的影響。而對(duì)于使用特征臉?lè)椒ǎ庹諚l件變化、曝光等引起的圖像亮度、對(duì)比度不同都會(huì)對(duì)其效果造成影響。好在隨著科研人員的不懈努力,2012年以后主流科技公司開(kāi)始逐步采用基于神經(jīng)網(wǎng)絡(luò)等進(jìn)階技術(shù)進(jìn)行人臉識(shí)別,實(shí)現(xiàn)了質(zhì)的飛躍。
目前計(jì)算機(jī)算法中提到的神經(jīng)網(wǎng)絡(luò)理論,是從生物神經(jīng)網(wǎng)絡(luò)得到啟發(fā)從而構(gòu)建的一種分類器數(shù)學(xué)模型,其特點(diǎn)就是訓(xùn)練時(shí)間長(zhǎng)而識(shí)別時(shí)間短。所以簡(jiǎn)單說(shuō)來(lái),人臉識(shí)別所用到的神經(jīng)網(wǎng)絡(luò)算法,就是通過(guò)收集的海量人臉照片,通過(guò)大數(shù)據(jù)訓(xùn)練將圖片信息變成能夠被機(jī)器理解分析的結(jié)構(gòu)化數(shù)據(jù),從而將人臉特征轉(zhuǎn)化為計(jì)算機(jī)可以識(shí)別的字符串,并與大數(shù)據(jù)進(jìn)行比對(duì),從而達(dá)到識(shí)別人臉的目的。
2015年這一年里,機(jī)器學(xué)習(xí)、深度神經(jīng)網(wǎng)絡(luò)技術(shù)、人工智能、量子計(jì)算等方面的技術(shù)創(chuàng)新碩果累累,這些技術(shù)的進(jìn)步都極大地提升了計(jì)算的處理能力、處理速度和復(fù)雜性,為廣大廠商發(fā)力人臉識(shí)別應(yīng)用提供了堅(jiān)實(shí)的技術(shù)后盾。據(jù)平安科技創(chuàng)新研究院專家透露,基于神經(jīng)網(wǎng)絡(luò)的平安人臉識(shí)別算法在多種測(cè)試環(huán)境下均達(dá)到了99%以上的正確率。即便是面對(duì)細(xì)胞老化和雙胞胎等業(yè)界公認(rèn)的技術(shù)難題,也有了一系列解決方案。
目前,人臉識(shí)別技術(shù)在安防、金融等好多領(lǐng)域中的運(yùn)用已經(jīng)鋪開(kāi),2015年,馬云演示了螞蟻金服Smile to pay掃臉支付,馬明哲將平安人臉識(shí)別技術(shù)運(yùn)用到平安普惠iLoan貸款場(chǎng)景中,就連央行也發(fā)了文件允許遠(yuǎn)程“刷臉”開(kāi)戶。隨著人臉識(shí)別技術(shù)的革新,智慧銀行VTM、新型安防系統(tǒng)以及后端海量視頻數(shù)據(jù)檢索等項(xiàng)目將在不遠(yuǎn)的未來(lái)大量上線。
在未來(lái),你無(wú)論是開(kāi)門,打卡,購(gòu)物,只用對(duì)著攝像頭眨眨眼或者動(dòng)動(dòng)腦袋就能輕松搞定,甚至相親時(shí)刷一下臉,還可以核實(shí)身份避免婚騙。甚至,以后在你打算付款或者要借貸的時(shí)候,“刷臉”之后,說(shuō)不定還會(huì)蹦出你的好信分,要是分?jǐn)?shù)滿足要求,不僅租車、住酒店時(shí)不用交押金,貸款時(shí)還可以更快得到批復(fù)、拿到比別人低的利率。
與此同時(shí),科研人員在人臉識(shí)別探索的道路上依舊奮力前行。或許很快,人臉識(shí)別系統(tǒng)會(huì)將人眼無(wú)法看到的紅外波段、紫外波段光譜信息應(yīng)用到特征提取中。也有可能,隨著圖像采集精度的進(jìn)一步提高,大數(shù)據(jù)的分析技術(shù)可以從面部圖像上找到類似于指紋的、并非計(jì)算出的特征、而是真正存在臉上的“臉紋”。甚至,科研人員除了“教導(dǎo)”人臉識(shí)別系統(tǒng)學(xué)會(huì)認(rèn)出你是誰(shuí)以外,還能看出你當(dāng)時(shí)的喜怒哀樂(lè)。
試想一下,以后你對(duì)著手機(jī)自拍一下,不僅能解鎖手機(jī),手機(jī)還能立即分別你現(xiàn)在的心情是開(kāi)心還是沮喪,或許立馬就給你放一首你最喜歡的歌曲安慰你,舒緩你的壓力。當(dāng)手機(jī)識(shí)別出你很疲倦,說(shuō)不定就自動(dòng)打開(kāi)了約車軟件,你只用確認(rèn)回家時(shí)間。沒(méi)錯(cuò),這就是飛速發(fā)展的人臉識(shí)別技術(shù)將給我們的日常生活帶來(lái)不斷驚喜的小小一部分。