什么是深度學(xué)習(xí)?
首先,人工智能和深度學(xué)習(xí)是什么關(guān)系?人工智能真正落地的部分就是深度學(xué)習(xí)。因?yàn)橐郧暗娜斯ぶ悄艽_實(shí)是在很多情況下用不起來,人手設(shè)計(jì)的智能來做某一件事情還是比較難超越人。而有了深度學(xué)習(xí)之后,可以把這個(gè)過程變成一個(gè)數(shù)據(jù)驅(qū)動(dòng)的過程:當(dāng)做某一件特定事情時(shí),數(shù)據(jù)量及參數(shù)量大到一定程度之后,機(jī)器就可能在做這件事情上超過人類。很多現(xiàn)實(shí)中落地的產(chǎn)品化的東西,都是深度學(xué)習(xí)做出來的。深度學(xué)習(xí)做的東西,成功的案例比較多,一方面是在語音識別領(lǐng)域,另外可能更多的是視覺這方面,我們可以看到很多計(jì)算機(jī)視覺方面新的成果。
深度學(xué)習(xí)到底在做什么事情?實(shí)際上它所做的事情抽象出來是比較簡單的,就是在做一個(gè)從X到Y(jié)的回歸,者說從A到B的Mapping(對應(yīng))--你給它一個(gè)輸入,它怎么樣給出一個(gè)對應(yīng)的輸出?特殊的地方就是深度學(xué)習(xí)把這件事情做得非常好。以前也有其他算法可以做,只不過一直做不過人,現(xiàn)在深度學(xué)習(xí)做到了*。
比如說給了一張人臉照片,它就可以給你對應(yīng)出這個(gè)人的名字;給一個(gè)物體的形狀,它就可以告訴你是什么物體;給一個(gè)車的行駛場景,它就可以給你輸出這個(gè)車應(yīng)該往哪兒拐;給一個(gè)棋局,它能算出下一步怎么走;給一個(gè)醫(yī)療的圖像,它就能幫你判斷這是什么病……實(shí)際上就是這樣的一個(gè)過程。不要把人工智能想象成可以超越人類,可以控制人類,這些都是所謂的“好萊塢的人工智能”或者想象中的人工智能,真正人工智能在現(xiàn)在這個(gè)階段其實(shí)就是做這么簡單的事,當(dāng)然,做成這個(gè)簡單的事情其實(shí)已經(jīng)很不簡單了。
深度學(xué)習(xí)的突破?
zui近這幾年深度學(xué)習(xí)確實(shí)在學(xué)術(shù)界、工業(yè)界取得了重大的突破。*個(gè)突破是在語音識別上,語音識別取得了巨大成功以后,深度學(xué)習(xí)緊接著在視覺方面又取得了重大突破。接著人工智能在自動(dòng)駕駛領(lǐng)域也取得了一些重大的突破,現(xiàn)在比較熱門的是醫(yī)療影像方面,借助人工智能進(jìn)行診斷。
深度學(xué)習(xí)有三個(gè)核心的要素:學(xué)習(xí)算法的設(shè)計(jì),你設(shè)計(jì)的大腦到底夠不夠聰明;要有高性能的計(jì)算能力,訓(xùn)練一個(gè)大的網(wǎng)絡(luò);必須要有大數(shù)據(jù)。
“深度學(xué)習(xí)+安防”的應(yīng)用
目前深度學(xué)習(xí)主要的研究領(lǐng)域在語音識別和視覺方面,而且將深度學(xué)習(xí)應(yīng)用到各個(gè)方向,可以不同的領(lǐng)域做出不同的技術(shù)創(chuàng)新。對于掌握了許多視頻圖像資源的安防行業(yè)來說,深度學(xué)習(xí)和安防的結(jié)合擁有比較高的契合度,即對圖像和視頻的分析,包括:
——在圖像分析方面,比如人們熟悉的人臉識別、文字識別和大規(guī)模圖像分類等,深度學(xué)習(xí)大幅提升了復(fù)雜任務(wù)分類的準(zhǔn)確率,使得圖像識別、語音識別,以及語義理解準(zhǔn)確率大幅提升。
——在人臉方面,可以實(shí)現(xiàn)人臉檢測、人臉關(guān)鍵點(diǎn)定位、*對比、聚類以及人臉屬性、活體檢測等等。在智能監(jiān)控方面,可以做人、機(jī)動(dòng)車、非機(jī)動(dòng)車視頻結(jié)構(gòu)化研究。
——在文字方面,小票的識別、信用卡的識別、車牌的識別,這些都是由深度學(xué)習(xí)的算法來做的。同時(shí)在圖像的處理方面,在去霧、超分辨率、去抖動(dòng)、去模糊,HDR、各種智能濾鏡的設(shè)計(jì)都是用深度學(xué)習(xí)的算法。
有人說,深度學(xué)習(xí)技術(shù)可謂安防行業(yè)的“顛覆性力量”,極大地推動(dòng)了智能安防的發(fā)展。較之以往的傳統(tǒng)智能算法,深度學(xué)習(xí)在解決視頻結(jié)構(gòu)化和人臉識別等方面更“智能”。比如視頻結(jié)構(gòu)化,把視頻里面的人、機(jī)動(dòng)車、非機(jī)動(dòng)車及其特性都檢測出來了,并且自動(dòng)標(biāo)注出來了,這樣整個(gè)視頻就變成了文檔,可以進(jìn)行文檔性的搜索;人臉的布控系統(tǒng),目前已在很多城市實(shí)時(shí)布控了,還有百米之外抓人,百米之外看到一個(gè)目標(biāo)拉近然后進(jìn)行人臉識別。
隨著深度學(xué)習(xí)算法的突破,目標(biāo)識別、物體檢測、場景分割、人物和車輛屬性分析等智能分析技術(shù),都取得了突破性進(jìn)展。
現(xiàn)階段,不僅安防行業(yè),越來越多的產(chǎn)業(yè)和企業(yè)在深度學(xué)習(xí)領(lǐng)域進(jìn)行探索。當(dāng)然我們也期待在深度學(xué)習(xí)甚至是人工智能的影響和各個(gè)安防生廠商的創(chuàng)新下,更多的智能安防產(chǎn)品能迅速落地應(yīng)用,提高城市安防系統(tǒng)的工作效率!