人臉識別技術(shù)(face recognition)的發(fā)展從20世紀(jì)70年代開始興起,是計算機視覺領(lǐng)域(computer vision)迄今為止最熱門的研究問題之一。作為一種最易普及的生物特征識別技術(shù),人臉識別的應(yīng)用場景眾多,其最傳統(tǒng)的場景莫過于安防、門禁、監(jiān)控領(lǐng)域。無論是在邊檢進出關(guān)的閘口,還是銀行保險柜的安全門鎖,都出現(xiàn)了人臉識別的身影。相較于傳統(tǒng)的密碼、證件、門卡等安全手段,人臉識別因為是一個天然的貼在臉上的“身份證”,具有極難偽造的屬性,。因而,人臉識別的技術(shù)也一度被認(rèn)為是可以取代所有賬號和密碼的新ID系統(tǒng),如果再搭載上現(xiàn)在無處不在的監(jiān)控攝像頭,人臉識別技術(shù)似乎有希望構(gòu)建起一套像小說《少數(shù)派報告》里的“天網(wǎng)”系統(tǒng),每個人的行蹤都將可以被精確掌控。這無疑是一個充滿幻想的未來圖景。此外,人臉識別技術(shù)作為大家最為熟知的生物特征識別技術(shù),也可以承載很多未來的想象力及巨大的市場。作為人臉識別領(lǐng)域的老兵和移動互聯(lián)網(wǎng)創(chuàng)業(yè)的新進者,F(xiàn)ace++對這一行業(yè)有哪些思考?他們在技術(shù)上有哪些心得?帶著這些問題,我們對Face++聯(lián)合創(chuàng)始人印奇進行了專訪。
CSDN移動:能否簡單介紹一下你們團隊?以及主要成員的從業(yè)經(jīng)歷?
印奇:我們是Face++團隊,一群85后的Geek。公司三位創(chuàng)始人是清華大學(xué)時的同學(xué),分別是我、唐文斌和楊沐。我從本科開始先后在MSRA(微軟亞洲研究院)實習(xí)加全職共四年時間,研發(fā)了微軟當(dāng)時核心的人臉識別系統(tǒng),被廣泛應(yīng)用在微軟如X-box和Bing等產(chǎn)品中。后赴美國哥倫比亞大學(xué)攻讀3D相機方向博士學(xué)位;唐文斌從初中開始參加信息學(xué)編程比賽,先后多次獲得ACM,CodeJam等各類編程比賽的冠軍,擔(dān)任國家信息學(xué)競賽總教練7年之久。清華研究生階段,專注社交挖掘和圖像檢索;而楊沐則獲得過國際信息編程奧林匹克比賽(IOI)金牌。參與多個開源項目,是一個“碼力”超強的架構(gòu)師,現(xiàn)在在團隊Lead整個大規(guī)模并行系統(tǒng)的搭建。
Face++團隊
CSDN移動:你們?nèi)绾味ㄎ籉ace++的產(chǎn)品?這款產(chǎn)品可以為開發(fā)者帶來什么?
印奇:Face++是一個技術(shù)服務(wù)的SaaS平臺,面向的是廣大開發(fā)者和企業(yè)級客戶。我們希望通過最簡單易用的方式把最牛掰的人臉識別技術(shù)提供給開發(fā)者,所以我們的Slogan是“Simplify Face Recognition”。在Face++平臺上,我們提供人臉檢測、人臉分析、人臉識別/搜索三大類技術(shù),共27小項細分技術(shù)點。Face++現(xiàn)在的技術(shù)服務(wù)場景和客戶主要有三類:1.手機硬件廠商,比如小米、美圖手機。服務(wù)核心就是優(yōu)化拍照、相冊的體驗和智能化;2.各類拍照和相冊的App,如美圖、Camera360、魔漫相機等;3.社交婚戀,提供人臉?biāo)阉髯尨蠹艺业阶约合矚g的妹子。以上都是線上互聯(lián)網(wǎng)場景,我們正在通過智能硬件的方式,來解決線下如智能商業(yè)里的VIP識別和安防監(jiān)控的場景。試想,如果每位顧客進店后,銷售人員可以馬上得知這位顧客是否是VIP,有哪些消費習(xí)慣,之前的消費記錄如何,那一定可以提供更個性化的服務(wù),提高轉(zhuǎn)化率。
CSDN移動:你們對Face++人臉識別產(chǎn)品/技術(shù)的定位是什么?
印奇:Face++本身是一個技術(shù)服務(wù)平臺,所以它的定位是面向開發(fā)者和企業(yè)級用戶。我們通過搭建這樣的平臺,積累了人臉核心技術(shù)和大量的人臉數(shù)據(jù),為我們的核心技術(shù)引擎的提升提供了源源不斷的數(shù)據(jù)基礎(chǔ)。通過這樣的技術(shù)優(yōu)勢,我們會通過一體化的人臉識別產(chǎn)品在智能監(jiān)控等領(lǐng)域做產(chǎn)品落地。
CSDN移動:目前,人臉識別這一市場的格局是什么?這一格局對公司的發(fā)展有哪些影響?
印奇:我認(rèn)為這個市場可以分為線上和線下兩部分。在線上,拍照、相冊、圖片分析、婚戀交友平臺中,人臉(及其他圖像識別)技術(shù)越來越重要,雖然現(xiàn)在很多還是Nice-To-Have的功能,不過未來比重會越來越大。線下的人臉識別市場本身就有非常巨大的剛需,特別是在各類監(jiān)控場景。不過線下場景對于人臉識別的精度要求非常高,雖然人臉識別的概念已經(jīng)出現(xiàn)了很多年,但遲遲沒有真正進入普通用戶的日常生活,究其原因還是技術(shù)仍在成熟的過程中,將人臉識別的精度做到接近100%仍然是一個未解的問題。同一個人人臉圖片的變化其實其實是非常巨大的。人可以根據(jù)海量數(shù)據(jù)學(xué)習(xí)和綜合分析判斷大家是不是一個人,但對于機器視覺來說,數(shù)據(jù)量和綜合分析都遠遠未達到人的水平,因而很多系統(tǒng)仍無法達到實際日常應(yīng)用場景的需求。這一背景給了我們一個契機,讓我們通過互聯(lián)網(wǎng)和深度學(xué)習(xí)的方式真正把人臉技術(shù)做出突破。
人臉識別技術(shù)的最大難點在于同一個在不同場景下外貌變化巨大
CSDN移動:Face++的產(chǎn)品做了多久?什么時候推出的?
印奇:Face++這個平臺是2012年初推出的,經(jīng)歷了三個大的版本迭代。
CSDN移動:針對上面提到的用戶需求,你們在產(chǎn)品中具體做了哪些工作?
印奇:對于Face++這類技術(shù)平臺型產(chǎn)品,核心點就是“技術(shù)好”和“容易用”。前者是我們的核心優(yōu)勢。而對于后者,我們則做了很多工作,包括簡化API接口、開設(shè)討論版、錄制教學(xué)視頻等。未來,我們會把“容易用”做的更好,比如我們打算推出一個名人搜索引擎,不光提供技術(shù),還提供數(shù)據(jù)庫。所以如果未來你想做一個與名人搜索相關(guān)的應(yīng)用,用我們的接口幾行代碼就能搞定了。
CSDN移動:與早期版本相比,現(xiàn)在的版本有哪些不同?
印奇:現(xiàn)在的版本技術(shù)點更全、封裝更易用,最重要的是不限調(diào)用次數(shù),而且完全免費。
CSDN移動:可否介紹一下,典型的人臉識別系統(tǒng)是什么樣子的?
印奇:當(dāng)今的人臉識別系統(tǒng)雖然包含無數(shù)細節(jié)和各種工程技巧,但大的系統(tǒng)框架不外乎如下圖所示的流程:一張人臉圖片輸入后,需要先找到人臉的位置(人臉檢測),然后在這個基礎(chǔ)上定位人臉關(guān)鍵點的位置(如眼睛中心或嘴角等),每個系統(tǒng)關(guān)鍵提取的數(shù)量相差很大,有的只有左右眼睛中心兩個點,有的可能多達近百個點。這些點的位置一是用來做人臉的幾何校正,即把人臉通過縮放、旋轉(zhuǎn)、拉伸等圖像變化變到一個比較標(biāo)準(zhǔn)的大小位置。這樣待識別的人臉區(qū)域會更加規(guī)整,便于后續(xù)進行匹配。同時,現(xiàn)在的實際系統(tǒng)一般也都配有人臉光學(xué)校正模塊,通過一些濾波的方法,去除一些對光照更加敏感的面部特征。在做完這些預(yù)處理之后,就是從人臉區(qū)域提取各種特征,包括LBP、HOG、Gabor等。最終相關(guān)的特征會連接成一個長的特征向量(Feature Vector),然后匹配出人臉的相似度,根據(jù)相似度的大小,系統(tǒng)會判定兩張圖片到底是不是一個人。不難看出,人臉識別技術(shù)還是一個系統(tǒng)鏈條較長,較為有技術(shù)門檻的領(lǐng)域。因為這條流水線的每個環(huán)節(jié)可能都會嚴(yán)重影響最終系統(tǒng)性能,所以一個好的人臉識別技術(shù)公司需要在各個環(huán)節(jié)上追求細節(jié),建立自己的技術(shù)優(yōu)勢,最終才有可能在最后的人臉識別精度上有出色的表現(xiàn)。
人臉識別技術(shù)的技術(shù)流程圖
CSDN移動:研發(fā)過程中遇到了哪些坎?怎么邁過去的?
印奇:研發(fā)過程中,核心還是服務(wù)的穩(wěn)定性問題。隨著我們調(diào)用量越來越大,因此要不斷優(yōu)化后臺的系統(tǒng)架構(gòu)。因為我們提供的是技術(shù)API,所以每個調(diào)用計算量都不小,在這方面,我們在系統(tǒng)層面做了不少針對性的優(yōu)化。研發(fā)過程中,遇到過celery的不靠譜,重寫,還遇到過API設(shè)計的不靠譜,重寫了N遍,配合各種搞兼容性,花費了很多時間。各種共有云服務(wù)還是挺不穩(wěn)定的,我們現(xiàn)在系統(tǒng)一崩就會有機制打電話給我們的手機,我們就需要連夜起來調(diào)。
CSDN移動:研發(fā)中主要用到了哪些開發(fā)工具,請具體談?wù)剬@些工具的使用心得,以及這些工具的特性。
印奇:因為我們對于系統(tǒng)效率要求很高,所以基本是團隊自己裸寫的。主要用了任務(wù)隊列celery,不靠譜,團隊自己寫了個LWDQ(LightWeight Distributed Queue),數(shù)據(jù)庫最終選擇了MySQL+MongoDB混用。剩下的東西都是阿里云的(RDS,F(xiàn)S),還比較靠譜。
CSDN移動:目前,你們的盈利模式是什么?未來有哪些可行的盈利模式?
印奇:目前,我們的線上技術(shù)服務(wù)主要通過企業(yè)級技術(shù)License來獲得收入。線下的一體化產(chǎn)品我們很快會推出,也會成為一個大的收入來源。
CSDN移動:對于未來,你們的發(fā)展方向是什么?這個領(lǐng)域是否會與我們今天看到的有所不同?
印奇:未來,我們會把人臉識別做深、做好,真正確立自己行業(yè)領(lǐng)導(dǎo)者的地位。同時,我們會從人臉拓展到更廣的圖像識別領(lǐng)域,還會基于我們在圖像識別和深度學(xué)習(xí)方面的積累,推出新的圖像識別平臺。
【《近匠》Mixtile:跑在盒子中的嵌入式平臺】《近匠》第33期:劉振宇與董迎軍已經(jīng)在硬件領(lǐng)域耕耘多年,他們希望將他們在硬件領(lǐng)域多年積累的技術(shù)經(jīng)驗和供應(yīng)鏈資源共享出來,幫助更多Maker、硬件愛好者、硬件初創(chuàng)團隊。因此,他們推出了Mixtile系列嵌入式平臺。
【《近匠》秦時明月:知名IP光環(huán)下的生存之道】《近匠》第32期,《秦時明月》是一款根據(jù)同名漫畫改編的手游,采用Cocos2d-x引擎開發(fā)者。知名IP為游戲帶來了可觀的首批用戶,然而,在盛名之下,下一步該怎么走,是頂著知名IP光環(huán)的游戲團隊需要深思的。
【《近匠》透鏡:代碼級定位,讓App性能監(jiān)控更從容!】《近匠》第31期,當(dāng)出現(xiàn)性能問題時,透鏡系統(tǒng)能夠?qū)崟r告訴你哪里出了問題,是用戶端的問題還是網(wǎng)絡(luò)的問題,是服務(wù)器的問題還是數(shù)據(jù)庫的問題,甚至能夠做到代碼級的定位,到底是哪行代碼寫的不好導(dǎo)致應(yīng)用性能的下降。
回顧更多內(nèi)容,及線下開發(fā)者活動信息,請關(guān)注mobilehub公眾微信號(ID: mobilehub)
尋求《近匠》免費報道,請私信:@CSDN移動,或發(fā)送郵件至mobile#csdn.net。