目前市面上做的比對來源主要有三種方式:
1. 用戶自傳照片,比如支付寶的人臉比對,用戶自傳的照片最大的問題是照片質量的合格率太低,拍照的光線、各種相機美顏、角度等因素會導致采集源的質量下降,不利于后期的大批量人臉特征碼管理。
2. 使用身份卡閱讀器,讀取身份卡上的照片,遺憾的是這張照片的質量極差,2K的大小,很多照片上的人臉質量實際非常差,不過也是目前用的最多的方式。
3. 使用公安部旗下NCIIC的人臉比對接口(注意,不是網(wǎng)紋照片接口,這個接口已經(jīng)不對外),使用的是直接的人臉比對接口。目前具備有這個庫調用權限的,目前所知的只有幾家,在人臉識別公司中,好像只看到一家在提供,這里先不提了。BAT應該都還沒有接入,如有大家有新發(fā)現(xiàn)的可以補充。
實際上,解決比對源的問題的關鍵是需要有準確的照片數(shù)據(jù)來進行比對,許多公司開始的時候采取NCIIC(公安部的一個事業(yè)單位)身份卡片返照接口的照片,進行消網(wǎng)紋處理進行比對,但人臉的很多特征點被損毀成功率不高(根據(jù)網(wǎng)絡安全法,目前網(wǎng)紋返照接口市面上除了銀行系統(tǒng)可以使用外,其他所用的身份卡返照接口都是非法的,一用就被查)。
其他人臉比對的來源還有:
1.監(jiān)控相機、手機相機等各種類型相機:拍攝的視頻、照片是人臉原始數(shù)據(jù)的主要來源。項目中常通過RTSP、FTP等協(xié)議對接這類相機獲取實時視頻流或圖片流。
2.NVR/DVR等錄像儲存設備:儲存了大量視頻資源,可通過ONVIF協(xié)議對接這類設備獲取數(shù)據(jù)。
3.第三方企業(yè)、事業(yè)單位的人員信息庫:例如公安的八大信息資源庫、企業(yè)在職員工信息庫等。獲取這類數(shù)據(jù)難度較大,會涉及到第三方平臺對接,還需考慮到保密、網(wǎng)絡安全等問題。
4.互聯(lián)網(wǎng)中的開放數(shù)據(jù)集:常用的WebFace、FDDB、LFW、YouTube Face等人臉數(shù)據(jù)集,提供了優(yōu)質的標注數(shù)據(jù),可用于算法測試及模訓練。
5.網(wǎng)絡爬取:通過編寫或者利用免費網(wǎng)絡爬蟲程序,自動抓取萬維網(wǎng)中的圖片。它們被廣泛用于互聯(lián)網(wǎng)的數(shù)據(jù)采集中。