隨著秒新月異的科技發(fā)展,各項(xiàng)技術(shù)成果不斷地應(yīng)用在我們?nèi)找嫱卣沟母黝I(lǐng)域需求當(dāng)中,刷新著我們的生活和工作。地球村的崛起,不斷以互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等方式揭示著萬(wàn)物相連的關(guān)系。無(wú)論是飛機(jī)、高鐵還是電話、網(wǎng)絡(luò),都成為托起地球新村時(shí)空縱橫的重要載體。怎樣拉近人與人之間的關(guān)系,如何建立起更行之有效的聯(lián)絡(luò)方式,提高遠(yuǎn)程協(xié)同工作、信息傳達(dá)效率成為了一個(gè)重要命題。
遠(yuǎn)程會(huì)議的出現(xiàn)在很大程度上為這種多極化辦公互動(dòng)提供了優(yōu)質(zhì)的平臺(tái)保障,在借助互聯(lián)網(wǎng)便捷的遠(yuǎn)程通信架構(gòu)下,通訊數(shù)據(jù)安全,穩(wěn)定可靠,很長(zhǎng)一段時(shí)間廣受用戶青睞。
然而美中不足的是,這樣的(聲音)系統(tǒng)仍逃不出的還是自然聲學(xué)上的問題。有和業(yè)內(nèi)朋友聊天中談到,今后的擴(kuò)聲系統(tǒng)也許只保留兩級(jí)傳統(tǒng)裝置了,那就是聲電轉(zhuǎn)換和電聲轉(zhuǎn)換的拾音和還原。而正是這兩級(jí)客觀存在的物理聲學(xué)現(xiàn)象,造就了我們今天所討論的內(nèi)容。
在遠(yuǎn)程會(huì)議系統(tǒng)的終端(本地),為了實(shí)現(xiàn)多人互動(dòng)、多人拾音等目的,系統(tǒng)聲音免不了被放大還原,而在諸如此類的放大系統(tǒng)中,僅為本地音箱能夠聽到遠(yuǎn)端聲音,并能把本地拾音信號(hào)傳送到遠(yuǎn)端而互通。
眾所周知,話筒在拾取到放大后的音箱信號(hào)后,再次回授、無(wú)限循環(huán)而產(chǎn)生反饋現(xiàn)象,而系統(tǒng)在均衡聲場(chǎng)后,該現(xiàn)象其實(shí)是可以得到明顯改觀的。但話筒的拾音靈敏度是不是可以無(wú)限大呢?不是,在足夠電平條件下,它始終會(huì)因拾取到具有相干性頻率相位關(guān)系的輸入信號(hào)而建立起回授。
上述嘯叫現(xiàn)象并不是本文重點(diǎn),但它為我們討論接下來的話題提供了一個(gè)前提,那就是(同一個(gè)聲場(chǎng)環(huán)境中)話筒和音箱無(wú)論怎么擺都無(wú)法做到完全的隔離,更別說空間聲場(chǎng)條件有限的小中型會(huì)議室了。
在一套有擴(kuò)聲、有拾音的遠(yuǎn)程會(huì)議系統(tǒng)中,為了防止信號(hào)回授,我們通常會(huì)有意識(shí)地將遠(yuǎn)端輸入信號(hào)不再路由給遠(yuǎn)端輸出。然而無(wú)法抗拒的是,本地話筒因拾取到遠(yuǎn)端傳送至本地?cái)U(kuò)聲的信號(hào),仍可將聲音重新傳送至遠(yuǎn)端。這也是一種回授,明顯的遠(yuǎn)程回授現(xiàn)象可使得系統(tǒng)發(fā)生自激震蕩。
通過一個(gè)簡(jiǎn)易的遠(yuǎn)程音頻傳輸示意圖,能幫助我們更容易地理解聲音信號(hào)是怎樣的流向。也能夠更清楚地看到這里面可能存在的回授現(xiàn)象。
部分工程師在調(diào)試遠(yuǎn)程會(huì)議系統(tǒng)時(shí)也許遇到過嘯叫,那可不一定是本地系統(tǒng)沒調(diào)好所造成的,你會(huì)發(fā)現(xiàn),關(guān)掉終端一切非常正常。為什么絕大多數(shù)的遠(yuǎn)程系統(tǒng)沒有嘯叫呢?這還得感謝您還不算非常優(yōu)質(zhì)的網(wǎng)絡(luò)。
我們常說,距離產(chǎn)生延時(shí),而在模擬音頻大舉轉(zhuǎn)向數(shù)字音頻、網(wǎng)絡(luò)音頻的今天,網(wǎng)絡(luò)信號(hào)的延遲也為音頻領(lǐng)域賦予了新的現(xiàn)象,尤其應(yīng)用在遠(yuǎn)程會(huì)議這樣的音頻傳輸系統(tǒng)當(dāng)中,它能將一次次回授剝離成一次次聽似回聲的現(xiàn)象,這就是網(wǎng)絡(luò)音頻回聲。
通常由A地發(fā)出的聲源A在幾乎不經(jīng)過延遲處理的本地系統(tǒng)中,通過A地音箱擴(kuò)聲;而其經(jīng)過網(wǎng)絡(luò)終端編碼送向遠(yuǎn)端時(shí),除了考慮A地的上傳時(shí)間X,還得考慮B地的下載時(shí)間Y。在這樣一個(gè)架構(gòu)在Internet網(wǎng)絡(luò)傳輸環(huán)境中的聲音,其到達(dá)B地?cái)U(kuò)聲音箱出來的信號(hào)則是A+X+Y。經(jīng)B地本地話筒拾取后的該信號(hào),再由B地的上傳網(wǎng)速(時(shí)間)Z、A地的下載時(shí)間W傳送回A地?cái)U(kuò)聲音箱,其表現(xiàn)出的信號(hào)則會(huì)出現(xiàn)一次A信號(hào),及一次賦予了(X+Y+Z+W)時(shí)間的A信號(hào)。
假設(shè)A地—B地傳輸時(shí)間總和為200ms,B地—A地傳輸時(shí)間總和為200ms,則信號(hào)的一去一回,體現(xiàn)在A擴(kuò)聲音箱中至少會(huì)存在A和A+400ms的信號(hào),若反饋信號(hào)電平足夠強(qiáng),則再被話筒拾取,這將不止產(chǎn)生一次的回聲,而是多次規(guī)律的回聲現(xiàn)象。
該圖片來源于Motivity產(chǎn)品DP處理器AEC調(diào)試界面
AEC即Acoustic Echo Cancellation(聲學(xué)回聲消除)技術(shù)簡(jiǎn)稱,該技術(shù)的出現(xiàn)旨在消除這種因遠(yuǎn)程網(wǎng)絡(luò)會(huì)議所帶來的回授現(xiàn)象,以遏制第一次回聲產(chǎn)生所需的必要條件來遏制多次回聲的出現(xiàn)。
為什么要費(fèi)那么大周折去抑制回聲?這個(gè)話題應(yīng)該不言而喻了。會(huì)議、語(yǔ)音擴(kuò)聲最講究的即是STI語(yǔ)音清晰度(可懂度),而回聲是語(yǔ)言清晰度的最大殺手。設(shè)想踩腳跟式的語(yǔ)音信號(hào)傳達(dá)到耳朵,聽者難受,講者費(fèi)勁,對(duì)于這樣的語(yǔ)音會(huì)議來說,那必將是一場(chǎng)災(zāi)難。
我們把聲學(xué)回聲消除這個(gè)技術(shù)變成一張實(shí)體的插件(設(shè)備插卡),外掛在系統(tǒng)中,為實(shí)現(xiàn)第一次回聲過濾(過濾回聲源則過濾多次回聲)。這個(gè)技術(shù)應(yīng)該插入在系統(tǒng)的哪個(gè)環(huán)節(jié)呢?我們不妨來找找系統(tǒng)中具備近乎相同/相似信號(hào)的一級(jí)進(jìn)出環(huán)節(jié)。
通過上圖的分析,我們并不難發(fā)現(xiàn)一組具備相似信號(hào)的輸入輸出環(huán)節(jié)。而AEC技術(shù)認(rèn)為,在這里對(duì)回聲下手是最治根的辦法!市面上有多種類的回聲消除器,也有部分抑制器,其算法和解決辦法各有不同,本文就不詳細(xì)闡釋了。須知,通過對(duì)具有相似性極高的輸入、輸出信號(hào)的比對(duì),約掉這一具備相似信號(hào)的輸出,即切斷了回授的根源,A地將不再聽到回聲現(xiàn)象。
筆者也經(jīng)常遇到有用戶因遠(yuǎn)程會(huì)議本地有回聲而采購(gòu)了帶有AEC回聲消除功能的處理器,拿回去安裝以后發(fā)現(xiàn),沒任何作用啊?!這到底是為什么呢?不是廠家設(shè)備功能不實(shí)現(xiàn),回觀上圖原理,答案自在其中。