網(wǎng)絡(luò)視頻會(huì)議中,人們都希望能實(shí)現(xiàn)發(fā)言人的特寫與其聲音同步的音視頻效果。那么,這一技術(shù)如何突破傳統(tǒng)的人工搜索方式,讓設(shè)備自己也能“尋聲辯人”呢?
說話人的聲音不能被清楚地收音,會(huì)議雙方聽不到對(duì)方的聲音,產(chǎn)生回音或者斷續(xù)音現(xiàn)象從而使與會(huì)雙方無法互相理解……即使現(xiàn)在使用視頻會(huì)議系統(tǒng)時(shí),我們?nèi)猿S龅竭@樣的問題。如何盡可能逼真地遠(yuǎn)程再現(xiàn)會(huì)議環(huán)境的聲音和圖像,給人以身臨其境之感,一直是聲音處理領(lǐng)域的頭等課題。
在視頻會(huì)議產(chǎn)品領(lǐng)域,中國產(chǎn)品重視視頻編解碼與聲音處理技術(shù),歐美產(chǎn)品更著重軟硬件設(shè)備、管理套件以及與統(tǒng)一通信架構(gòu)融合的研究,而日本的產(chǎn)品則堅(jiān)持其一貫的技術(shù)分工精細(xì)的主張:索尼在顯示器領(lǐng)域深耕,雅馬哈則在音頻處理領(lǐng)域細(xì)作。
日前,日本雅馬哈在中國推動(dòng)PJP(Projectphone)網(wǎng)絡(luò)會(huì)議系列產(chǎn)品巡展,試圖為該領(lǐng)域引入另一種完全不同的技術(shù)解決思路。通過本報(bào)記者對(duì)日本雅馬哈株式會(huì)社Sound Network事業(yè)部長田丸卓也、雅馬哈中國網(wǎng)絡(luò)會(huì)議系列產(chǎn)品技術(shù)總監(jiān)谷田的專訪,以下問題將得到解答:雅馬哈會(huì)采用哪些技術(shù)解決目前聲音傳輸?shù)蔫Υ,并輔助視頻功能?視頻會(huì)議中惱人的回聲與吞字現(xiàn)象如何得到解決?會(huì)議中重要的錄音功能,該如何設(shè)計(jì)?如何以人工智能的思路來設(shè)計(jì)網(wǎng)絡(luò)與視頻會(huì)議產(chǎn)品,最終使這一計(jì)算機(jī)科技成果貼近自然、符合人類習(xí)慣?