不容錯過的音頻基礎知識大全

來源:投影時代 更新日期:2008-06-16 作者:佚名

    1、多媒體中的音頻處理技術

    多媒體涉及到多方面的音頻處理技術,如:音頻采集、語音編碼/解碼、文一-語轉換、音樂合成、語音識別與理解、音頻數(shù)據(jù)傳輸、音頻一-視頻同步、音頻效果與編輯等。其中數(shù)字音頻是個關鍵的概念,它指的是一個用來表示聲音強弱的數(shù)據(jù)序列,它是由模擬聲音經(jīng)抽樣(即每隔一個時間間隔在模擬聲音波形上取一個幅度值)量化和編碼(即把聲音數(shù)據(jù)寫成計算機的數(shù)據(jù)格式)后得到的。計算機數(shù)字CD、數(shù)字磁帶(DAT)中存儲的都是數(shù)字聲音。模擬一-數(shù)字轉換器把模擬聲音變成數(shù)字聲音;數(shù)字一-模擬轉換器可以恢復出模擬來的聲音。
 
    一般來講,實現(xiàn)計算機語音輸出有兩種方法:一是錄音/重放,二是文一-語轉換。第二種方法是基于聲音合成技術的一種聲音產(chǎn)生技術,它可用于語音合成和音樂合成。而第一種方法是最簡單的音樂合成方法,曾相繼產(chǎn)生了應用調頻(FM)音樂合成技術和波形表(wavetable)音樂合成技術。
 
    2、樂器數(shù)字接口MIDI的概念
 
    現(xiàn)在我們用的最多的音頻名詞之一MIDI(musical instrument digital interface)是作為“樂器數(shù)字接口”的縮寫出現(xiàn)的,并用它來泛指數(shù)字音樂的國際標準。由于它定義了計算機音樂程序、合成器及其他電子設備交換信息和電子信號的方式,所以可以解決不同電子樂器之間不兼容的問題。另外,標準的多媒體PC平臺能夠通過內部合成器或連接到計算機MIDI端口的外部合成器播放MIDI文件,利用MIDI文件演奏音樂,所需的存儲量最少。

    至于MIDI文件,是指存放MIDI信息的標準文件格式。MIDI文件中包含音符、定時和多達16個通道的演奏定義。文件包括每個通道的演奏音符信息:鍵通道號、音長、音量和力度(擊鍵時,鍵達到最低位置的速度)。由于MDDI文件是一系列指令,而不是波形,它需要的磁盤空間非常少;并且現(xiàn)裝載MIDI文件比波形文件容易的多。這樣,在設計多媒體節(jié)目時,我們可以指定什么時候播放音樂,將有很大的靈活性。在以下幾種情況下,使用MIDI文件比使用波形音頻更合適:需要播放長時間高質量音樂,如想在硬盤上存儲的音樂大于4分鐘,而硬盤又沒有足夠的存儲容量;需要以音樂作背景音響效果,同時從CD-ROM中裝載其它數(shù)據(jù),如圖像、文字的顯示;需要以音樂作背景音響效果,同時播放波形音頻或實現(xiàn)文一語轉換,以實現(xiàn)音樂和語音的同時輸出。

    3、常見的聲音文件格式

    再接下來我們介紹七種目前最為流行的多媒體聲音文件效果讓你認識認識:

    WAVE,擴展名為WAV:該格式記錄聲音的波形,故只要采樣率高、采樣字節(jié)長、機器速度快,利用該格式記錄的聲音文件能夠和原聲基本一致,質量非常高,但這樣做的代價就是文件太大。

    MOD,擴展名MOD、ST3、XT、S3M、FAR、669等:該格式的文件里存放樂譜和樂曲使用的各種音色樣本,具有回放效果明確,音色種類無限等優(yōu)點。但它也有一些致命弱點,以至于現(xiàn)在已經(jīng)逐漸淘汰,目前只有MOD迷及一些游戲程序中尚在使用。
 
    MPEG-3,擴展名MP3:現(xiàn)在最流行的聲音文件格式,因其壓縮率大,在網(wǎng)絡可視電話通信方面應用廣泛,但和CD唱片相比,音質不能令人非常滿意。
 
    Real Audio,擴展名RA:這種格式真可謂是網(wǎng)絡的靈魂,強大的壓縮量和極小的失真使其在眾多格式中脫穎而出。和MP3相同,它也是為了解決網(wǎng)絡傳輸帶寬資源而設計的,因此主要目標是壓縮比和容錯性,其次才是音質。

    Creative Musical Format,擴展名CMF:Creative公司的專用音樂格式,和MIDI差不多,只是音色、效果上有些特色,專用于FM聲卡,但其兼容性也很差。

    CD Audio音樂CD,擴展名CDA:唱片采用的格式,又叫“紅皮書”格式,記錄的是波形流,絕對的純正、HIFI。但缺點是無法編輯,文件長度太大。

    MIDI,擴展名MID:目前最成熟的音樂格式,實際上已經(jīng)成為一種產(chǎn)業(yè)標準,其科學性、兼容性、復雜程度等各方面當然遠遠超過本文前面介紹的所有標準(除交響樂CD、Unplug CD外,其它CD往往都是利用MIDI制作出來的),它的General MIDI就是最常見的通行標準。作為音樂工業(yè)的數(shù)據(jù)通信標準,MIDI能指揮各音樂設備的運轉,而且具有統(tǒng)一的標準格式,能夠模仿原始樂器的各種演奏技巧甚至無法演奏的效果,而且文件的長度非常小。

    總之,如果有專業(yè)的音源設備,那么要聽同一首曲子的HIFI程度依次是:

    原聲樂器演奏 > MIDI > CD唱片 > MOD > 所謂聲卡上的MIDI > CMF,而MP3及RA要看它的節(jié)目源是采用MIDI、CD還是MOD了。
 
    另外,在多媒體材料中,存儲聲音信息的文件格式也是需要認識的,共有:WAV文件、VOC文件、MIDI文件、RMI文件、PCM文件以及AIF文件等若干種。

    WAV文件:Microsoft公司的音頻文件格式,它來源于對聲音模擬波形的采樣。用不同的采樣頻率對聲音的模擬波形進行采樣可以得到一系列離散的采樣點,以不同的量化位數(shù)(8位或16位)把這些采樣點的值轉換成二進制數(shù),然后存入磁盤,這就產(chǎn)生了聲音的WAV文件,即波形文件。Microsoft Sound System軟件Sound Finder可以轉換AIF SND和VOD文件到WAV格式。

    VOC文件:Creative公司波形音頻文件格式,也是聲霸卡(sound blaster)使用的音頻文件格式。每個VOC文件由文件頭塊(header block)和音頻數(shù)據(jù)塊(data block)組成。文件頭包含一個標識版本號和一個指向數(shù)據(jù)塊起始的指針。數(shù)據(jù)塊分成各種類型的子塊。如聲音數(shù)據(jù)靜音標識ASCII碼文件重復的結果重復以及終止標志,擴展塊等。
 
    MIDI文件:Musical Instrument Digital Interface(樂器數(shù)字接口)的縮寫。它是由世界上主要電子樂器制造廠商建立起來的一個通信標準,以規(guī)定計算機音樂程序 電子合成器和其它電子設備之間交換信息與控制信號的方法。MIDI文件中包含音符定時和多達16個通道的樂器定義,每個音符包括鍵通道號持續(xù)時間音量和力度等信息。所以MIDI文件記錄的不是樂曲本身,而是一些描述樂曲演奏過程中的指令。

    RMI文件:Microsoft公司的MIDI文件格式,它可以包括圖片標記和文本。
 
    PCM文件:模擬音頻信號經(jīng)模數(shù)轉換(A/D變換)直接形成的二進制序列,該文件沒有附加的文件頭和文件結束標志。在聲霸卡提供的軟件中,可以利用VOC-HDR程序,為PCM格式的音頻文件加上文件頭,而形成VOC格式。Windows的Convert工具可以把PCM音頻格式的文件轉換成Microsoft的WAV格式的文件。

AIF文件:Apple計算機的音頻文件格式。Windows的Convert工具同樣可以把AIF格式的文件換成Microsoft的WAV格式的文件。

    DSP: 即Digital Signal Processing 數(shù)字信號處理.DSP技術在音調控制,失真效果器,Wah-wah踏板等模擬電子領域有廣泛的應用。同時,DSP在模擬均衡和混響等多種效果上也能大顯身手 。通過電腦CPU或專門的DSP芯片都可以處理DSP 動作,不同的是,專門的DSP芯片處理要比電腦CPU處理更優(yōu)化,速度更快 。

    采樣:把模擬音頻轉成數(shù)字音頻的過程,就稱作采樣,所用到的主要設備便是模擬/數(shù)字轉換器(Analog to Digital Converter,即ADC。與之對應的是數(shù)/模轉換器,即DAC)。采樣的過程實際上是將通常的模擬音頻信號的電信號轉換成二進制碼0和1,這些0和1便構成了數(shù)字音頻文件。采樣的頻率越大則音質越有保證.由于采樣率一定要高于錄制的最高頻率的兩倍才不會產(chǎn)生失真,而人類的聽力范圍是20Hz-20kHz,所以采樣頻率至少得是20k×2=40kHz以保證不產(chǎn)生低頻失真,這也是CD音質采用44.1kHz(稍高于40kHz是為了留有余地)的原因。  
  

    信噪比:以dB計算的信號最大保真輸出與不可避免的電子噪音的比率。該值越大越好。低于75dB這個指標,噪音在寂靜時有可能被發(fā)現(xiàn)。AWE64 Gold聲卡的信噪比是80dB,較為合理。SBLIVE更是宣稱超過120dB的頂級信噪比。總的說來,由于電腦里的高頻干擾太大,所以聲卡的信噪比往往不令人滿意。但SBLIVE!提供了一個數(shù)字輸出口SPDIF,可繞過輸出時的模擬部分,極大地減少了噪音和失真,同時又極大地提高了動態(tài)范圍和清晰度。
 
    FM: Synthesis Frequency Modulation調配合成技術。FM發(fā)聲器的原理是先對音色本質進行研究計算之后再通過人工方式“模擬”(或合成)其頻率,使用調變波去調變載波,最終獲得不同的音色表現(xiàn)。該方法很難制出逼真的真實樂器音色,聽上去有很強的人工合成的痕跡。 

    GM:即通用MIDI標準系統(tǒng)第一級(General MIDI system Level1),制定于1991年。在GS標準基礎上,規(guī)定了MIDI設備的最大同時發(fā)音數(shù)不得少于24個、鼓镲等打擊樂器作為一組單獨排列、128種樂器音色有統(tǒng)一的排列方式等。GM的音色排列方式基本上沿襲了GS標準.它一推出便得到了全球MIDI廠商的一致支持,實現(xiàn)了MIDI設備間的交流。 
 
    XG:YAMAHA于1994年提出了自己的音源標準——XG。XG在兼容GM的基礎上做了大幅度的擴展,能夠進行“音色編輯”和自由發(fā)展不同層次的器材.具有強大的可擴充性。同過其“庫方式”可選擇共480種音色。
  
    SMPTE(The Society of Motion Picture and Television Engineers)。它是目前在影音工業(yè)中得到廣泛應用的一個時間碼概念.該碼用于設備間驅動的時間同步,計數(shù)方式 ,主要參數(shù)格式是:Hours: Minutes : Second : Frames.其中SMPTE 24 Film Sync: 以每秒24幀的速度播放,通常用于電影工業(yè);SMPTE 30 Non-Drop: 該標準適用于音頻領域。  

    音頻壓縮(Audio Compression).是指降低信號動態(tài)以濾除噪聲和避免動態(tài)過大的失真。通過不同的計算方式、忽略人耳不易察覺的頻段、或通過制造聽覺上的錯覺,從而大幅度降低音頻數(shù)據(jù)的數(shù)量,卻令音質基本不變甚至更好。  

    標準的MIDI插頭:一般的MIDI設備背后都有3個5針插頭,分別是MIDI IN接受MIDI信息;MIDI OUT發(fā)送該設備自身的MIDI信息;MIDI THRU轉接輸出MIDI IN接受到的MIDI信息。
   
    合唱(Chorus):最常用的音響效果之一。原理是將信號的調制延遲部分做copy,然后再與原信號合成。這種效果可產(chǎn)生多個相同聲音組合的感覺。MIDI應用時,與Reverb等效果適當配合和滲透,作出意想不到的效果。 

    另外還有: 放大器(Amplifier),俗稱“功放”,用以增強電平信號。 Hz:同一頻率每秒振動次數(shù)的單位. quantize: 量化。其作用是對音符或音頻以某個精確度進行“對位”。

    半雙工(half-duplex):計算機技術上可以在 兩個方向上進行信息傳輸。但在同一時刻只可單向進行。 EQ(Equalize)均衡效果器。其中Paragraphic EQ是參數(shù)圖形均衡器。Graphic EQ是圖示均衡器。用滑動控制器作為參數(shù)調整的多段可變均衡器;瑒涌刂破飨碌臉俗R與其頻率響應所對應。每一頻段的中心頻率與帶寬是固定的。

廣告聯(lián)系:010-82755684 | 010-82755685 手機版:m.pjtime.com官方微博:weibo.com/pjtime官方微信:pjtime
Copyright (C) 2007 by PjTime.com,投影時代網(wǎng) 版權所有 關于投影時代 | 聯(lián)系我們 | 歡迎來稿 | 網(wǎng)站地圖
返回首頁 網(wǎng)友評論 返回頂部 建議反饋
快速評論
驗證碼: 看不清?點一下
發(fā)表評論