智能視頻技術(shù)分析技術(shù)工作原理及技術(shù)缺陷
2010年,數(shù)字化、高清化、智能化充斥著整個安防市場,不論是企業(yè)還是媒體,都在樂此不疲地談?wù)撝曨l監(jiān)控的這三大走勢。而今,2010北京安博會召開在即,作為安防行業(yè)的年度盛會,我們沒有理由懷疑與這三大趨勢有關(guān)的產(chǎn)品會在展會上出現(xiàn)。今天,筆者將就智能視頻分析這一話題進(jìn)行探討。
記得在采訪北京光橋總裁張乃憲先生時,他曾說,對于視頻監(jiān)控來說,監(jiān)控錄像需要7*24小時不間斷,保安員在觀看視頻監(jiān)控屏幕時極易造成視覺疲勞,發(fā)現(xiàn)可疑線索的幾率就大大降低,舉個例子,人在盯著屏幕觀看錄像12分鐘的時候,45%的畫面會被忽視,而當(dāng)觀看錄像達(dá)到22分鐘的時候,95%的畫面將被忽略;另外,如何在監(jiān)控屏幕不斷切換的同時發(fā)現(xiàn)突發(fā)事件并及時預(yù)警也是實踐中的一個難題;同時,隨著視頻監(jiān)控的大范圍應(yīng)用,也帶來了海量的視頻數(shù)據(jù),如何在這些海量的數(shù)據(jù)中提煉有價值的數(shù)據(jù)成為一個亟待解決的問題;谶@些因素,智能視頻分析的產(chǎn)生和應(yīng)用就顯得極為必要。
智能視頻分析技術(shù)讓人迫不及待,那么,智能視頻分析的工作原理是什么呢?
智能視頻分析大體上分為兩大類,一類是以背景模型建立為基礎(chǔ),主要包括周界防范在內(nèi)的行為分析等。第二類是以特征識別為基礎(chǔ),包括車牌識別、人臉識別等。
行為分析主要基于運動背景建模與目標(biāo)識別技術(shù),簡單來講就是在相對靜止的背景圖像中找到在活動的目標(biāo)物體。
運動目標(biāo)識別的背景建模技術(shù),首先根據(jù)某種數(shù)學(xué)原理建立環(huán)境背景的數(shù)學(xué)模型,在概數(shù)學(xué)模型的基礎(chǔ)上,機器可以區(qū)分出靜止背景與運動的目標(biāo)物體,然后再根據(jù)目標(biāo)的輪廓、大小等信息對其分類,除去虛假的或無需關(guān)心的目標(biāo),最終結(jié)合剩下的目標(biāo)軌跡與設(shè)置的規(guī)則產(chǎn)生報警信號。
特征識別技術(shù)的原理與活動目標(biāo)識別技術(shù)不同。特征識別無需背景模型而需要目標(biāo)物體的特征,因此機器會存有一個可以用于描述這些特征的數(shù)據(jù)庫,特征識別也就是在所得的圖像中尋找與特征庫里具有一定相似程度的物體以進(jìn)行匹配,如果特殊庫里描述的特征越多,得到的結(jié)果越正確,同時需要的計算量也越大。
然而,目前智能視頻分析技術(shù)應(yīng)用并不廣泛,還處于試用階段,“不成熟”的技術(shù)無法催生市場的膨脹,這主要表現(xiàn)在以下幾個方面:
1.無法完全消除誤報的影響
例如運動目標(biāo)識別中的背景建模技術(shù),在控制漏報數(shù)量的同時,還不能完全的刪除誤報。在以目標(biāo)識別為技術(shù)基礎(chǔ)的周界防范產(chǎn)品中,誤報的數(shù)量一直是反映該產(chǎn)品優(yōu)劣的一大指標(biāo)。而誤報的數(shù)量是由背景模型與實際使用情況之間的差距造成的。模型的適應(yīng)能力越強,造成的誤報越少,背后要求的技術(shù)也越高。影響背景模型建立的因數(shù)很多,例如空曠的柏油馬路和邊上有樹木的圍墻,6m高的攝像機與2m高的攝像機所拍攝的畫面就需要不同的背景模型,白天和黑夜的狀態(tài)需要的模型也不同。目前,行業(yè)中還沒有開發(fā)出一種可以涵蓋所有使用情況的背景模型來,也無法完全的解決隨機事件的影響,如在黑夜環(huán)境下車燈造成的誤報。
2.不具備行為的判斷能力 例如周界防范,機器中行為分析的區(qū)域入侵功能能夠發(fā)現(xiàn)活動目標(biāo),并可以在這些活動目標(biāo)中利用技術(shù)手段把用戶希望的目標(biāo)(例如人體)提取出來。但是再進(jìn)一步,這個闖入者的動機是什么,是偶爾路過,還是故意闖入,是否有意的往警戒區(qū)域內(nèi)探望,這些都無法靠機器來識別。
3.特征識別技術(shù)對畫面要求高
對于基于特征識別的分析技術(shù),對于圖像的要求比較高。除了畫面本身清晰度外,也需要清楚的展示目標(biāo)物體的特征,目前計算機的識別能力大大低于人類對物體特征的識別能力,不同的光照條件和拍攝角度,都將改變計算機所看到的特征。因此,對攝像機的安裝以及周圍環(huán)境的要求比較高。例如車牌識別的產(chǎn)品,對車牌在畫面中呈現(xiàn)的角度,像素大小都有比較嚴(yán)格的要求,這些高要求限制了該類產(chǎn)品的實施與應(yīng)用。
4.CPU的處理能力仍然是瓶頸
要滿足實際復(fù)雜的應(yīng)用環(huán)境就需要越加復(fù)雜的算法,隨之帶來了巨大的計算量,目前DSP芯片的能力有限,已經(jīng)不能滿足某些復(fù)雜算法的需要。因此,難以開發(fā)相應(yīng)高級功能的嵌入式產(chǎn)品,這也增加了很多產(chǎn)品的施工難度與實際推廣的阻力。
盡管目前智能產(chǎn)品已經(jīng)開始小規(guī)模應(yīng)用,但是在使用過程中也表現(xiàn)出種種問題,讓火熱的市場開始逐步沉寂:
1、價格高昂普及困難
目前市場上前端智能視頻分析盒動輒一兩萬,而帶智能視頻分析功能的服務(wù)器則是幾十萬的身價,除了這些昂貴的必備用品之外,還有相應(yīng)配套的硬件軟件都需要高昂的造價,價格無疑成為國內(nèi)智能視頻分析產(chǎn)品不能普及的最大原因。試想連機場、軌道交通、金融、能源這些高端行業(yè)使用都要“三思而行”的狀況下,又怎么能向智能建筑、零售業(yè)、服務(wù)業(yè)等中低端行業(yè)普及呢?
2、誤報率高有可能形同虛設(shè)
目前的智能產(chǎn)品無論是嵌入式智能分析產(chǎn)品還是純軟件智能視頻分析產(chǎn)品,其分析效率及準(zhǔn)確率仍然受到環(huán)境因素(如環(huán)境光線變化等)的限制,面對各種各樣復(fù)雜的應(yīng)用環(huán)境,目前還無法進(jìn)行準(zhǔn)確、實時地判斷和分析。
國外視頻分析的理念是“寧可誤報,不可不報”,但這種理念到了中國可能會產(chǎn)生“狼來了”的效應(yīng)。如何解決分析靈敏度和誤報警之間的矛盾,也是我們急需解決的問題。
另外,相對于傳統(tǒng)的模擬系統(tǒng)和DVR系統(tǒng)來說,目前的智能分析產(chǎn)品規(guī)則設(shè)置及功能實現(xiàn)方面則較為復(fù)雜。為了減少誤報,智能分析系統(tǒng)還要根據(jù)現(xiàn)場的情況進(jìn)行多次的反復(fù)調(diào)試,從而達(dá)到較為理想的效果。也就是說我們需要較高端的配套設(shè)備,對設(shè)備的安裝調(diào)試有著更加嚴(yán)格的要求,需要更多高素質(zhì)的集成商和工程商,而這方面也是我們需要多加改進(jìn)的。
3、標(biāo)準(zhǔn)難于統(tǒng)一
跟網(wǎng)絡(luò)視頻監(jiān)控產(chǎn)品相似,智能視頻分析缺乏一個準(zhǔn)確的定義和相關(guān)的標(biāo)準(zhǔn),眾人都在談智能,誰家的智能技術(shù)才是真的?哪些智能技術(shù)其實并不智能?比如,有些產(chǎn)品把移動偵測這個并不能從根本上實現(xiàn)自動分析并提取有威脅信息的功能也叫做智能分析,顯然就是有所誤導(dǎo)。另外,分析核心算法差異化也會成為將來整合的一個難題,比如不同品牌的前端嵌入式分析產(chǎn)品與后端管理平臺如何來兼容,應(yīng)遵循什么樣的標(biāo)準(zhǔn),智能分析分析產(chǎn)品的廠家可提供什么樣的支持,這些都是需要解決的問題。
4、客戶認(rèn)知度低
產(chǎn)品的推廣需要終端客戶的最終認(rèn)可才能贏得市場,許多行業(yè)終端客戶普遍對智能分析產(chǎn)品系統(tǒng)所能實現(xiàn)功能知之甚少,也就不能提供很多有效的需求來促進(jìn)產(chǎn)品的較廣泛應(yīng)用及改進(jìn)提升,這也造成了很多智能分析產(chǎn)品功能與客戶的需求相差較遠(yuǎn),客戶往往過高地估計了智能化系統(tǒng)所能提供的便利功能,從而產(chǎn)生一些非產(chǎn)品質(zhì)量方面的矛盾。而企業(yè)只是自己埋頭苦修智能視頻分析技術(shù),研發(fā)出來的產(chǎn)品并不能得到客戶的認(rèn)可,這也等于是做了一場無用功。
應(yīng)該說,智能視頻分析技術(shù)是安防行業(yè)發(fā)展的必然趨勢,然而,智能視頻分析要真正實現(xiàn)其作用,首先必須突破上述幾大技術(shù)障礙,客戶對產(chǎn)品的認(rèn)可才是市場發(fā)展的動力。除了技術(shù)上的不成熟,應(yīng)用上的不成熟也是我們必須面對的問題,智能監(jiān)控會是安防行業(yè)的下一個拐點嗎?我們拭目以待。