report
Energy Taiwan

商湯研究院:人臉辨識準確率 4年內將躍升4個數量級

  • 馬智堯
以商湯這幾年累積的人臉辨識成果來看,準確率已經可以真正地應用到各行各業。商湯科技

商湯研究院院長王曉剛日前表示,2014年人工智慧(AI)人臉識別技術的準確率首次超過人眼準確率,但目前誤差率已經可以達到億分之一。機器做人臉識別如果相當於一個4位元密碼,現在則相當於一個8位元的密碼,人臉識別4年內準確度已經提升了4個數量級。

商湯研究院院長王曉剛日前在《麻省理工科技評論》新興科技峰會上發表了題為「AI賦能下的當下與未來」演講,闡述了人工智慧如何通過雲和端改變生活和未來。

王曉剛回顧在過去的十年裡,人工智慧飛速發展最傑出的代表就是深度學習。其中有三個推動深度學習發展的因素:一是大數據,二是雲端計算能力包括了GPU和AI晶片,三是深度學習演算法不斷創新。

王曉剛舉例,2014年時機器做人臉識別可以達到萬分之一的誤差率;而現在誤差率可以達到億分之一。換句話說,機器做人臉識別如果相當於一個4位元密碼,現在則相當於一個8位元的密碼,人臉識別性能已經提升了4個數量級。

隨著演算法的提升,應用邊界不斷擴大,從最開始1:1身份的比對,到後來動態布控,如抓捕在逃嫌疑人。現在可以在整個城市範圍內,從上千億的圖像中去搜索人臉,恢復人的活動軌跡。這樣高的準確率實際上得益於神經網路的強大,通過訓練超過1,200層的神經網路,從而超過人眼識別的能力。

神經網路已經從2012年的5層,發展到現在的1,200層這樣一個過程,其網路的複雜度、深度也在不斷的提升。但是為何在前端應用的時只用一個很小的網路,後台卻需要訓練1,200層這麼大的網路?

王曉剛指出,原因是為了得到一個很小、但是識別率很高的網路,你首先需要得到一個非常深、非常強的網路進行學習。他比喻,這個小的但是識別率高的網路,就好比是一個小學生,資料就好比是書籍。

若是直接讓一個小學生,從大量的書籍當中提取知識,這是一件非常困難的事,首先要找到一個老師,老師有非常強的學習能力,這就是1,200層網路。它首先能夠從海量的資料裡面,把知識提取出來,然後通過知識傳播的方式去教更小的網路,讓其達到很好的識別性能。

演算法的提升可以帶來非常多的應用,能讓城市變得更加安全。比如,有罪犯十幾年前隱姓埋名,就算改了身份證,最終還是被動態人臉布控系統所捕捉;此外公安局利用人臉識別系統結合城市裡幾萬個攝像頭,能夠成功找到走丟的老人或孩童。

以商湯這幾年累積的成果來看,2014年能夠用20萬人臉來對機器進行訓練做到了98.5%的準確率,而人是97.5%;2015年用30萬人臉進行訓練,達到了99.55%的準確率;2016年用6,000萬人臉訓練可以達到了百萬分之一的誤識率;2017年用20億人臉訓練可以達到一億分之一的誤識率,這樣的誤識率才已可以真正地應用到各行各業。

在硬體方面,王曉剛也提及商湯與高通(Qualcomm)的戰略合作,他認為如果人工智慧想要普及,那麼AI就要走到前端設備。而這些前端設備都離不開晶片。目前商湯的人臉解鎖技術已經被超過上億的手機用戶使用,都要靠高通的晶片支援。