目錄
- 參考
- 概述
- G.711原理
- 總結(jié)
1. 參考
- [1] wikipedia/A-law_algorithm
- [2] github.com/quatanium/foscam-ios-sdk
- [3] charybdis/G711算法學(xué)習(xí)
2. 概述
本文目的:
1、熟悉G711a/u兩種格式的基本原理
2、熟悉兩種壓縮算法的實(shí)現(xiàn)步驟及提供源碼實(shí)現(xiàn)
G.711是國(guó)際電信聯(lián)盟ITU-T定制出來(lái)的一套語(yǔ)音壓縮標(biāo)準(zhǔn),它代表了對(duì)數(shù)PCM(logarithmic pulse-code modulation)抽樣標(biāo)準(zhǔn),是主流的波形聲音編解碼標(biāo)準(zhǔn),主要用于電話。
- 主要用脈沖編碼調(diào)制對(duì)音頻采樣,采樣率為8k每秒。它利用一個(gè) 64Kbps 未壓縮通道傳輸語(yǔ)音訊號(hào)。
- 壓縮率為1:2, 即把16位成8位。
G.711 標(biāo)準(zhǔn)下主要有兩種壓縮算法。
- u-law algorithm (又稱u-law, ulaw, mu-law),主要運(yùn)用于北美和日本。
- A-law algorithm,主要運(yùn)用于歐洲和世界其他地區(qū)。特別設(shè)計(jì)用來(lái)方便計(jì)算機(jī)處理的。
G.711將14bit(uLaw)或者13bit(aLaw)采樣的PCM數(shù)據(jù)編碼成8bit的數(shù)據(jù)流,播放的時(shí)候在將此8bit的數(shù)據(jù)還原成14bit或者13bit進(jìn)行播放,不同于MPEG這種對(duì)于整體或者一段數(shù)據(jù)進(jìn)行考慮再進(jìn)行編解碼的做法,G711是波形編解碼算法,就是一個(gè)sample對(duì)應(yīng)一個(gè)編碼,所以壓縮比固定為:
- 8/14 = 57% (uLaw)
- 8/13 = 62% (aLaw)
3. G.711原理
G.711是將語(yǔ)音模擬信號(hào)進(jìn)行一種非線性量化, 詳細(xì)的資料可以在ITU 上下到相關(guān)的spec 。下面主要列出一些性能參數(shù):
G.711(PCM方式)
- 采樣率:8kHz
- 信息量:64kbps/channel
- 理論延遲:0.125msec
- 品質(zhì):MOS值4.10
算法原理:
A-law的公式如下,一般采用A=87.6
畫(huà)出圖來(lái)則是如下圖,用x表示輸入的采樣值,F(xiàn)(x)表示通過(guò)A-law變換后的采樣值,y是對(duì)F(x)進(jìn)行量化后的采樣值。
由此可見(jiàn)
- 在輸入的x為高值的時(shí)候,F(xiàn)(x)的變化是緩慢的,有較大范圍的x對(duì)應(yīng)的F(x)最終被量化為同一個(gè)y,精度較低。
- 相反在低聲強(qiáng)區(qū)域,也就是x為低值的時(shí)候,F(xiàn)(x)的變化很劇烈,有較少的不同x對(duì)應(yīng)的F(x)被量化為同一個(gè)y。意思就是說(shuō)在聲音比較小的區(qū)域,精度較高。
對(duì)應(yīng)反量化公式(即上面函數(shù)的反函數(shù)):
3.1 G.711A(A-LAW)壓縮十三折線法
G.711A輸入的是13位(S16的高13位),這種格式是經(jīng)過(guò)特別設(shè)計(jì)的,便于數(shù)字設(shè)備進(jìn)行快速運(yùn)算。
- 取符號(hào)位并取反得到s。
- 獲取強(qiáng)度位eee,獲取方法如下圖所示
- 獲取高位樣本位wxyz
- 組合為seeewxyz,將seeewxyz逢偶數(shù)為取補(bǔ)數(shù)。
A-law如下表計(jì)算。
- 第一列是采樣點(diǎn),共13bit,最高位為符號(hào)位。
- 對(duì)于前兩行,折線斜率均為1/2,跟負(fù)半段的相應(yīng)區(qū)域位于同一段折線上。
- 對(duì)于3到8行,斜率分別是1/4到1/128,共6段折線。
- 總共13段折線,這就是所謂的A-law十三段折線法。
示例:
輸入pcm數(shù)據(jù)為1234,二進(jìn)制對(duì)應(yīng)為(0000 0100 1101 0010)
二進(jìn)制變換下排列組合方式(0 00001 0011 010010)
1、獲取符號(hào)位最高位為0,取反,s=1
2、獲取強(qiáng)度位00001,查表,編碼制應(yīng)該是eee=011
3、獲取高位樣本wxyz=0011
4、組合為10110011,逢偶數(shù)為取反為11100110,得到E6
#define SIGN_BIT (0x80) /* Sign bit for a A-law byte. */
#define QUANT_MASK (0xf) /* Quantization field mask. */
#define NSEGS (8) /* Number of A-law segments. */
#define SEG_SHIFT (4) /* Left shift for segment number. */
#define SEG_MASK (0x70) /* Segment field mask. */
static int seg_aend[8] = {0x1F, 0x3F, 0x7F, 0xFF,
0x1FF, 0x3FF, 0x7FF, 0xFFF};
static int seg_uend[8] = {0x3F, 0x7F, 0xFF, 0x1FF,
0x3FF, 0x7FF, 0xFFF, 0x1FFF};
static int search(
int val, /* changed from "short" *drago* */
int * table,
int size) /* changed from "short" *drago* */
{
int i; /* changed from "short" *drago* */
for (i = 0; i < size; i++) {
if (val <= *table++)
return (i);
}
return (size);
}
int linear2alaw(int pcm_val) /* 2's complement (16-bit range) */
/* changed from "short" *drago* */
{
int mask; /* changed from "short" *drago* */
int seg; /* changed from "short" *drago* */
int aval;
pcm_val = pcm_val >> 3;//這里右移3位,因?yàn)椴蓸又凳?6bit,而A-law是13bit,存儲(chǔ)在高13位上,低3位被舍棄
if (pcm_val >= 0) {
mask = 0xD5; /* sign (7th) bit = 1 二進(jìn)制的11010101*/
} else {
mask = 0x55; /* sign bit = 0 二進(jìn)制的01010101*/
pcm_val = -pcm_val - 1; //負(fù)數(shù)轉(zhuǎn)換為正數(shù)計(jì)算
}
/* Convert the scaled magnitude to segment number. */
seg = search(pcm_val, seg_aend, 8); //查找采樣值對(duì)應(yīng)哪一段折線
/* Combine the sign, segment, and quantization bits. */
if (seg >= 8) /* out of range, return maximum value. */
return (0x7F ^ mask);
else {
//以下按照表格第一二列進(jìn)行處理,低4位是數(shù)據(jù),5~7位是指數(shù),最高位是符號(hào)
aval = seg << SEG_SHIFT;
if (seg < 2)
aval |= (pcm_val >> 1) & QUANT_MASK;
else
aval |= (pcm_val >> seg) & QUANT_MASK;
return (aval ^ mask);
}
}
int alaw2linear(int a_val)
{
int t; /* changed from "short" *drago* */
int seg; /* changed from "short" *drago* */
a_val ^= 0x55; //異或操作把mask還原
t = (a_val & QUANT_MASK) << 4;//取低4位,即表中的abcd值,然后左移4位變成abcd0000
seg = ((unsigned)a_val & SEG_MASK) >> SEG_SHIFT; //取中間3位,指數(shù)部分
switch (seg) {
case 0: //表中第一行,abcd0000 -> abcd1000
t += 8;
break;
case 1: //表中第二行,abcd0000 -> 1abcd1000
t += 0x108;
break;
default://表中其他行,abcd0000 -> 1abcd1000 的基礎(chǔ)上繼續(xù)左移(按照表格第二三列進(jìn)行處理)
t += 0x108;
t <<= seg - 1;
}
return ((a_val & SIGN_BIT) ? t : -t);
}
3.2 G.711u(u-law)
使用在北美和日本,輸入的是14位,編碼算法就是查表,計(jì)算出:基礎(chǔ)值+平均偏移值
μ-law的公式如下,μ取值一般為255
相應(yīng)的μ-law的計(jì)算方法如下表
示例:
輸入pcm數(shù)據(jù)為1234
1、取得范圍值,查表得 +2014 to +991 in 16 intervals of 64
2、得到基礎(chǔ)值為0xA0
3、得到間隔數(shù)為64
4、得到區(qū)間基本值2014
5、當(dāng)前值1234和區(qū)間基本值差異2014-1234=780
6、偏移值=780/間隔數(shù)=780/64,取整得到12
7、輸出為0xA0+12=0xAC
#define BIAS (0x84) /* Bias for linear code. 線性碼偏移值*/
#define CLIP 8159 //最大量化級(jí)數(shù)量
int linear2ulaw( int pcm_val) /* 2's complement (16-bit range) */
{
int mask;
int seg;
int uval;
/* Get the sign and the magnitude of the value. */
pcm_val = pcm_val >> 2;
if (pcm_val < 0) {
pcm_val = -pcm_val;
mask = 0x7F;
} else {
mask = 0xFF;
}
if ( pcm_val > CLIP ) pcm_val = CLIP; /* clip the magnitude 削波*/
pcm_val += (BIAS >> 2);
/* Convert the scaled magnitude to segment number. */
seg = search(pcm_val, seg_uend, 8);
/*
* Combine the sign, segment, quantization bits;
* and complement the code word.
*/
if (seg >= 8) /* out of range, return maximum value. */
return (0x7F ^ mask);
else {
uval = (seg << 4) | ((pcm_val >> (seg + 1)) & 0xF);
return (uval ^ mask);
}
}
int ulaw2linear( int u_val)
{
int t;
/* Complement to obtain normal u-law value. */
u_val = ~u_val;
/*
* Extract and bias the quantization bits. Then
* shift up by the segment number and subtract out the bias.
*/
t = ((u_val & QUANT_MASK) << 3) + BIAS;
t <<= (u_val & SEG_MASK) >> SEG_SHIFT;
return ((u_val & SIGN_BIT) ? (BIAS - t) : (t - BIAS));
}
3.2 A-law和u-law對(duì)比
A-law和u-law畫(huà)在同一個(gè)坐標(biāo)軸中就能發(fā)現(xiàn)A-law在低強(qiáng)度信號(hào)下,精度要稍微高一些。
實(shí)際應(yīng)用中,我們確實(shí)可以用浮點(diǎn)數(shù)計(jì)算的方式把F(x)結(jié)果計(jì)算出來(lái),然后進(jìn)行量化,但是這樣一來(lái)計(jì)算量會(huì)比較大,實(shí)際上對(duì)于A-law(A=87.6時(shí)),是采用13折線近似的方式來(lái)計(jì)算的,而μ-law(μ=255時(shí))則是15段折線近似的方式。
4. 總結(jié)
G711盡管是一種非常古老的話音編碼算法,原理和計(jì)算也比較簡(jiǎn)單,但是其中用到的一些基本原理同樣在其他編碼算法中得到了應(yīng)用,對(duì)其進(jìn)行深入的了解有助于更好的理解其他的算法。