四、聲音信息的表示
(一)數(shù)字聲音基礎(chǔ)1.波形聲音的數(shù)字化
聲音是一種物理信號(hào),計(jì)算機(jī)要對(duì)它進(jìn)行處理,其前提是必須用二進(jìn)制數(shù)字的編碼形式來(lái)表示聲音。最常用的聲音信號(hào)數(shù)字化方法是取樣-量化法,它分成如下3個(gè)步驟:
(1)取樣(Sampling)
(2)量化
(3)編碼(Encoding)
2.PC機(jī)中的聲音
PC機(jī)中的數(shù)字聲音有兩種不同的表示方法。一種稱為“波形聲音”,通過(guò)對(duì)實(shí)際聲音的波形信號(hào)進(jìn)行數(shù)字化(取樣和量化)而獲得,它可表示任何種類的聲音。另一種是“合成聲音”,它使用符號(hào)(參數(shù))對(duì)聲音進(jìn)行描述,然后通過(guò)合成(Synthesize)的方法生成聲音,合成語(yǔ)音(用聲母、韻母或清音、濁音、基音頻率等參數(shù)描述的語(yǔ)音)等。
PC機(jī)中使用最廣泛的波形聲音文件采用wav作為擴(kuò)展名,稱為波形文件格式(Wave FileˉFormat).wav文件格式能支持多種取樣頻率和樣本精度,并支持壓縮的聲音數(shù)據(jù)。
(二)波形聲音
1.數(shù)字語(yǔ)音的壓縮編碼
數(shù)字語(yǔ)音的數(shù)據(jù)壓縮方法很多,從原理上可以分成3類:
(1)波形編碼
(2)參數(shù)編碼或模型編碼
(3)混合編碼
2.全頻帶聲音的壓縮編碼
(1)MPEG-1Audio(ISO/IEC11172-3)
MPEG-1聲音壓縮編碼是國(guó)際上第一個(gè)高保真聲音數(shù)據(jù)壓縮的國(guó)際標(biāo)準(zhǔn),它規(guī)定了高質(zhì)量數(shù)字聲音的編碼方法、存儲(chǔ)表示和解碼方法,得到了極其廣泛的應(yīng)用。它雖然是MPEG-1標(biāo)準(zhǔn)的一個(gè)組成部分,但完全可以獨(dú)立應(yīng)用。
(2)MPEG-2Audio(ISO/IEC13818-3)
MPEG-2Audio與MPEG-1Audio標(biāo)準(zhǔn)都使用相同類型的編/解碼器,層1、層2和層3的結(jié)構(gòu)也相同。
(3)MPEG-2AAC(ISO/IEC13818-7)
MPEG-2AAC(Advanced Audio Coding)是MPEG-2標(biāo)準(zhǔn)中一種新的先進(jìn)的聲音編碼標(biāo)準(zhǔn)。AAC支持的取樣頻率可從8kHz到96kHz,AAC編碼器的輸入可以是單聲道的、立體聲的和多聲道的聲音。
(4)MPEG-4Audio(ISO/IEC14496-3)
MPEG-4Audio的編碼對(duì)象既可以是自然音頻信號(hào)(波形聲音),也可以是合成的音頻信號(hào)。
(三)合成聲音1.合成音樂(lè)與MIDI
MIDI(Musical Instrument Digital Interface)是樂(lè)器數(shù)字接口的縮寫(xiě),它起源于數(shù)字式電子樂(lè)器,因?yàn)楦鞣N產(chǎn)品必須使用統(tǒng)一接口才能進(jìn)行連接,因些必須規(guī)定一種數(shù)字樂(lè)器相互間的接口標(biāo)準(zhǔn),特別是數(shù)字樂(lè)器與計(jì)算機(jī)的接口標(biāo)準(zhǔn),這就是MIDI。
2.合成語(yǔ)音
語(yǔ)音合成目前主要指從文本到語(yǔ)音的合成(Text-to-Speech,簡(jiǎn)稱TTS),也稱為文語(yǔ)轉(zhuǎn)換。
相關(guān)推薦:計(jì)算機(jī)等級(jí)考試三級(jí)PC技術(shù)常見(jiàn)系統(tǒng)命令行北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |