簡(jiǎn)介

擴(kuò)音

音頻去噪

靜音剪切

基本概念

數(shù)字信號(hào)

數(shù)字信號(hào)是通過(guò)對(duì)連續(xù)的模擬信號(hào)采樣得到的離散的函數(shù)。它可以簡(jiǎn)單看作一個(gè)以時(shí)間為下標(biāo)的數(shù)組。比如，x[n]，n為整數(shù)。比如下圖是一個(gè)正弦信號(hào)(n=0,1, ..., 9)：

對(duì)于任何的音頻文件，實(shí)際上都是用這種存儲(chǔ)方式，比如，下面是對(duì)應(yīng)英文單詞“skip”的一段信號(hào)(只不過(guò)由于點(diǎn)太多，筆者把點(diǎn)用直線(xiàn)連接了起來(lái)）：

衡量數(shù)字信號(hào)的能量（強(qiáng)度），只要簡(jiǎn)單的求振幅平方和即可：

E = sum(x[n]*x[n])

頻率

我們知道，聲音可以看作是不同頻率的正弦信號(hào)疊加。那么給定一個(gè)聲音信號(hào)（如上圖），怎么能夠知道這個(gè)信號(hào)在不同頻率區(qū)段上的強(qiáng)度呢？答案是使用離散傅里葉變換。對(duì)信號(hào)x[n], n=0, ..., N-1，通常記它的離散傅里葉變換為X[n]，它是一個(gè)復(fù)值函數(shù)。

比如，對(duì)上述英文單詞“skip”對(duì)應(yīng)的信號(hào)做離散傅里葉變換，得到它在頻域中的圖像是：

可以看到能量主要集中在中低音部分（約16000Hz以下）。

在頻域上，也可以計(jì)算信號(hào)的強(qiáng)度，因?yàn)楦鶕?jù)Plancherel定理，有：

E = sum(x[n]*x[n]) = 1/N*sum(|X[n]|*|X[n]|)

分幀

對(duì)于一般的語(yǔ)音信號(hào)，長(zhǎng)度都至少在1秒以上，有時(shí)候我們需要把其中比如25毫秒的一小部分單獨(dú)拿出來(lái)研究。將一個(gè)信號(hào)依次取小段的操作，就稱(chēng)作分幀。技術(shù)上，音頻分幀是通過(guò)給信號(hào)加一系列的窗函數(shù)實(shí)現(xiàn)的。

我們把一種特殊的函數(shù)w[n]，稱(chēng)作窗函數(shù)，如果對(duì)所有的n，有0<=w[n]<=1，且只有有限個(gè)n使得w[n]>0。比如去噪要用到的漢寧窗，三角窗。

漢寧窗

三角窗

我們將平移的窗函數(shù)與原始信號(hào)相乘，便得到信號(hào)的“一幀”：

w[n+d]*x[n]

比如用長(zhǎng)22.6毫秒的漢寧窗加到“skip”信號(hào)大約中間部位上，得到一幀的信號(hào)：

可見(jiàn)除一有限區(qū)間之外，加窗后的信號(hào)其他部分都是0。

對(duì)一幀信號(hào)可以施加離散傅里葉變換（也叫短時(shí)離散傅里葉變換），來(lái)獲取信號(hào)在這一幀內(nèi)（通常是很短時(shí)間內(nèi)），有關(guān)頻率-能量的分布信息。

如果我們把信號(hào)按照上述方法分成一幀一幀，又將每一幀用離散傅里葉變換轉(zhuǎn)換到頻域中去，最后將各幀在頻域的圖像拼接起來(lái)，用橫坐標(biāo)代表時(shí)間，縱坐標(biāo)代表頻率，顏色代表能量強(qiáng)度（比如紅色代表高能，藍(lán)色代表低能），那么我們就構(gòu)造出所謂頻譜圖。比如上述“skip”發(fā)音對(duì)應(yīng)的信號(hào)的頻譜圖是：

（使用5.8毫秒的漢寧窗）

從若干幀信號(hào)中，我們又可以恢復(fù)出原始信號(hào)。只要我們適當(dāng)選取窗口大小，以及窗口之間的平移距離L，得到 ..., w[n+2L], w[n+L], w[n], w[n-L], w[n-2L], ...，使得對(duì)k求和有：

sum(w[n+kL]) = 1

從而簡(jiǎn)單的疊加各幀信號(hào)便可以恢復(fù)出原始信號(hào)：

sum(x[n]*w[n+kL]) = x[n]

最后，注意窗函數(shù)也可以在頻域作用到信號(hào)上，從而可以起到取出信號(hào)的某一頻段的作用。

下面簡(jiǎn)單介紹一下3種音效。

1. 擴(kuò)音

要擴(kuò)大信號(hào)的強(qiáng)度，只要簡(jiǎn)單的增大信號(hào)的“振幅”。比如給定一個(gè)信號(hào)x[n]，用a>1去乘，便得到聲音更大的增強(qiáng)信號(hào)：

a*x[n]

同理，用系數(shù)0<a<1去乘，便得到聲音變小的減弱信號(hào)。

2. 去噪（降噪）

對(duì)于白噪音，我們可以簡(jiǎn)單的用“移動(dòng)平均濾波器”來(lái)去除，雖然這也會(huì)一定程度降低聲音的強(qiáng)度，但效果的確不錯(cuò)。但是，對(duì)于成分較為復(fù)雜，特別是頻段能量分布不均勻的噪聲，則需要使用下面的噪聲門(mén)技術(shù)，它可以看作是一種“多帶通濾波器”。

這個(gè)特效的基本思路是：對(duì)一段噪聲樣本建模，然后降低待降噪信號(hào)中噪聲的分貝。

更加細(xì)節(jié)的說(shuō)，是在信號(hào)的若干頻段f[1], ..., f[M]上，分別設(shè)置噪聲門(mén)g[1], ..., g[M]，每個(gè)門(mén)都有一個(gè)對(duì)應(yīng)的閾值，分別是t[1], ..., t[M]。這些閾值時(shí)根據(jù)噪聲樣本確定的。比如當(dāng)通過(guò)門(mén)g[m]的信號(hào)強(qiáng)度超過(guò)閾值t[m]時(shí)，門(mén)就會(huì)關(guān)閉，反之，則會(huì)重新打開(kāi)。最后通過(guò)的信號(hào)便會(huì)只保留下來(lái)比噪聲強(qiáng)度更大的聲音，通常也就是我們想要的聲音。

為了避免噪聲門(mén)的開(kāi)合造成信號(hào)的劇烈變動(dòng)，筆者使用了sigmoid函數(shù)做平滑處理，即噪聲門(mén)在開(kāi)-關(guān)2個(gè)狀態(tài)之間是連續(xù)變化的，信號(hào)通過(guò)的比率也是在1.0-0.0之間均勻變化的。

實(shí)現(xiàn)中，我們用漢寧窗對(duì)信號(hào)進(jìn)行分幀。然后對(duì)每一幀，又用三角窗將信號(hào)分成若干頻段。對(duì)噪聲樣本做這樣的處理后，可以求出信號(hào)每一頻段對(duì)應(yīng)的閾值。然后，又對(duì)原始信號(hào)做這樣的處理（分幀+分頻），根據(jù)每一幀每一頻段的信號(hào)強(qiáng)度和對(duì)應(yīng)閾值的差（diff = energy-threshold），來(lái)計(jì)算對(duì)應(yīng)噪聲門(mén)的開(kāi)合程度，即通過(guò)信號(hào)的強(qiáng)度。最后，簡(jiǎn)單的將各頻段，各幀的通過(guò)信號(hào)疊加起來(lái)，便得到了降噪信號(hào)。

比如原先的“skip”語(yǔ)音信號(hào)頻譜圖如下：

可以看到有較多雜音（在高頻，低頻段，藍(lán)色部分）。采集0.25秒之前的聲音作為噪聲樣本，對(duì)信號(hào)作降噪處理，得到降噪后信號(hào)的頻譜圖如下：

可以明顯的看到大部分噪音都被清除了，而語(yǔ)音部分仍完好無(wú)損，強(qiáng)度也沒(méi)有減弱，這是“移動(dòng)平均濾波器”所做不到的。

3. 靜音剪切

在對(duì)音頻進(jìn)行上述降噪處理后，我們還可以進(jìn)一步把多余的靜音去除掉。

剪切的原理十分簡(jiǎn)單。首先用漢寧窗對(duì)信號(hào)做分幀。如果該幀信號(hào)強(qiáng)度過(guò)小，則舍去該幀。最后將保留的幀疊加起來(lái)，便得到了剪切掉靜音部分的信號(hào)。

比如，對(duì)降噪處理后的“skip”語(yǔ)音信號(hào)做靜音剪切，得到的新信號(hào)的頻譜圖為：

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

Python 簡(jiǎn)單的擴(kuò)音，音頻去噪，靜音剪切

Python 簡(jiǎn)單的擴(kuò)音，音頻去噪，靜音剪切

簡(jiǎn)介

基本概念

數(shù)字信號(hào)

頻率

分幀

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

Python 簡(jiǎn)單的擴(kuò)音，音頻去噪，靜音剪切

簡(jiǎn)介

基本概念

數(shù)字信號(hào)

頻率

分幀

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

Python 簡(jiǎn)單的擴(kuò)音，音頻去噪，靜音剪切