隨著秒新月異的科技發(fā)展,各項技術(shù)成果不斷地應(yīng)用在我們?nèi)找嫱卣沟母黝I(lǐng)域需求當中,刷新著我們的生活和工作。地球村的崛起,不斷以互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等方式揭示著萬物相連的關(guān)系。無論是飛機、高鐵還是電話、網(wǎng)絡(luò),都成為托起地球新村時空縱橫的重要載體。怎樣拉近人與人之間的關(guān)系,如何建立起更行之有效的聯(lián)絡(luò)方式,提高遠程協(xié)同工作、信息傳達效率成為了一個重要命題。
遠程會議的出現(xiàn)在很大程度上為這種多極化辦公互動提供了優(yōu)質(zhì)的平臺保障,在借助互聯(lián)網(wǎng)便捷的遠程通信架構(gòu)下,通訊數(shù)據(jù)安全,穩(wěn)定可靠,很長一段時間廣受用戶青睞。
然而美中不足的是,這樣的(聲音)系統(tǒng)仍逃不出的還是自然聲學上的問題。有和業(yè)內(nèi)朋友聊天中談到,今后的擴聲系統(tǒng)也許只保留兩級傳統(tǒng)裝置了,那就是聲電轉(zhuǎn)換和電聲轉(zhuǎn)換的拾音和還原。而正是這兩級客觀存在的物理聲學現(xiàn)象,造就了我們今天所討論的內(nèi)容。
在遠程會議系統(tǒng)的終端(本地),為了實現(xiàn)多人互動、多人拾音等目的,系統(tǒng)聲音免不了被放大還原,而在諸如此類的放大系統(tǒng)中,僅為本地音箱能夠聽到遠端聲音,并能把本地拾音信號傳送到遠端而互通。
眾所周知,話筒在拾取到放大后的音箱信號后,再次回授、無限循環(huán)而產(chǎn)生反饋現(xiàn)象,而系統(tǒng)在均衡聲場后,該現(xiàn)象其實是可以得到明顯改觀的。但話筒的拾音靈敏度是不是可以無限大呢?不是,在足夠電平條件下,它始終會因拾取到具有相干性頻率相位關(guān)系的輸入信號而建立起回授。
上述嘯叫現(xiàn)象并不是本文重點,但它為我們討論接下來的話題提供了一個前提,那就是(同一個聲場環(huán)境中)話筒和音箱無論怎么擺都無法做到完全的隔離,更別說空間聲場條件有限的小中型會議室了。
在一套有擴聲、有拾音的遠程會議系統(tǒng)中,為了防止信號回授,我們通常會有意識地將遠端輸入信號不再路由給遠端輸出。然而無法抗拒的是,本地話筒因拾取到遠端傳送至本地擴聲的信號,仍可將聲音重新傳送至遠端。這也是一種回授,明顯的遠程回授現(xiàn)象可使得系統(tǒng)發(fā)生自激震蕩。
通過一個簡易的遠程音頻傳輸示意圖,能幫助我們更容易地理解聲音信號是怎樣的流向。也能夠更清楚地看到這里面可能存在的回授現(xiàn)象。
部分工程師在調(diào)試遠程會議系統(tǒng)時也許遇到過嘯叫,那可不一定是本地系統(tǒng)沒調(diào)好所造成的,你會發(fā)現(xiàn),關(guān)掉終端一切非常正常。為什么絕大多數(shù)的遠程系統(tǒng)沒有嘯叫呢?這還得感謝您還不算非常優(yōu)質(zhì)的網(wǎng)絡(luò)。
我們常說,距離產(chǎn)生延時,而在模擬音頻大舉轉(zhuǎn)向數(shù)字音頻、網(wǎng)絡(luò)音頻的今天,網(wǎng)絡(luò)信號的延遲也為音頻領(lǐng)域賦予了新的現(xiàn)象,尤其應(yīng)用在遠程會議這樣的音頻傳輸系統(tǒng)當中,它能將一次次回授剝離成一次次聽似回聲的現(xiàn)象,這就是網(wǎng)絡(luò)音頻回聲。
通常由A地發(fā)出的聲源A在幾乎不經(jīng)過延遲處理的本地系統(tǒng)中,通過A地音箱擴聲;而其經(jīng)過網(wǎng)絡(luò)終端編碼送向遠端時,除了考慮A地的上傳時間X,還得考慮B地的下載時間Y。在這樣一個架構(gòu)在Internet網(wǎng)絡(luò)傳輸環(huán)境中的聲音,其到達B地擴聲音箱出來的信號則是A+X+Y。經(jīng)B地本地話筒拾取后的該信號,再由B地的上傳網(wǎng)速(時間)Z、A地的下載時間W傳送回A地擴聲音箱,其表現(xiàn)出的信號則會出現(xiàn)一次A信號,及一次賦予了(X+Y+Z+W)時間的A信號。
假設(shè)A地—B地傳輸時間總和為200ms,B地—A地傳輸時間總和為200ms,則信號的一去一回,體現(xiàn)在A擴聲音箱中至少會存在A和A+400ms的信號,若反饋信號電平足夠強,則再被話筒拾取,這將不止產(chǎn)生一次的回聲,而是多次規(guī)律的回聲現(xiàn)象。
該圖片來源于Motivity產(chǎn)品DP處理器AEC調(diào)試界面
AEC即Acoustic Echo Cancellation(聲學回聲消除)技術(shù)簡稱,該技術(shù)的出現(xiàn)旨在消除這種因遠程網(wǎng)絡(luò)會議所帶來的回授現(xiàn)象,以遏制第一次回聲產(chǎn)生所需的必要條件來遏制多次回聲的出現(xiàn)。
為什么要費那么大周折去抑制回聲?這個話題應(yīng)該不言而喻了。會議、語音擴聲最講究的即是STI語音清晰度(可懂度),而回聲是語言清晰度的最大殺手。設(shè)想踩腳跟式的語音信號傳達到耳朵,聽者難受,講者費勁,對于這樣的語音會議來說,那必將是一場災(zāi)難。
我們把聲學回聲消除這個技術(shù)變成一張實體的插件(設(shè)備插卡),外掛在系統(tǒng)中,為實現(xiàn)第一次回聲過濾(過濾回聲源則過濾多次回聲)。這個技術(shù)應(yīng)該插入在系統(tǒng)的哪個環(huán)節(jié)呢?我們不妨來找找系統(tǒng)中具備近乎相同/相似信號的一級進出環(huán)節(jié)。
通過上圖的分析,我們并不難發(fā)現(xiàn)一組具備相似信號的輸入輸出環(huán)節(jié)。而AEC技術(shù)認為,在這里對回聲下手是最治根的辦法!市面上有多種類的回聲消除器,也有部分抑制器,其算法和解決辦法各有不同,本文就不詳細闡釋了。須知,通過對具有相似性極高的輸入、輸出信號的比對,約掉這一具備相似信號的輸出,即切斷了回授的根源,A地將不再聽到回聲現(xiàn)象。
筆者也經(jīng)常遇到有用戶因遠程會議本地有回聲而采購了帶有AEC回聲消除功能的處理器,拿回去安裝以后發(fā)現(xiàn),沒任何作用。!這到底是為什么呢?不是廠家設(shè)備功能不實現(xiàn),回觀上圖原理,答案自在其中。