浮點定點數(shù)據(jù)格式

定點小數(shù)運算

來自:http://www.eepw.com.cn/article/17893.htm

在DSP世界中,由于DSP芯片的限制,經(jīng)常使用定點小數(shù)運算。所謂定點小數(shù),實際上就是用整數(shù)來進行小數(shù)運算。下面先介紹定點小數(shù)的一些理論知識,然后以C語言為例,介紹一下定點小數(shù)運算的方法。在TI C5000 DSP系列中使用16比特為最小的儲存單位,所以我們就用16比特的整數(shù)來進行定點小數(shù)運算。 ? ? ? ?先從整數(shù)開始,16比特的儲存單位最多可以表示0x0000到0xffff,65536種狀態(tài),如果它表示C語言中的無符號整數(shù)的話,就是從0到65535。如果需要表示負數(shù)的話,那么最高位就是符號位,而剩下的15位可以表示32768種狀態(tài)。這里可以看出,對于計算機或者DSP芯片來說,符號并沒有什么特殊的儲存方式,其實是和數(shù)字一起儲存的。為了使得無論是無符號數(shù)還是符號數(shù),都可以使用同樣的加法減法規(guī)則,符號數(shù)中的負數(shù)用正數(shù)的補碼表示。

我們都知道-1 + 1 =0,而0x0001表示1,那么-1用什么來表示才能使得-1 + 1 =0呢?答案很簡單:0xffff?,F(xiàn)在就可以打開Windows的計算器,用16進制計算一下0xffff+0x0001,結(jié)果是0x10000。那么0x10000和0x0000等價麼,我們剛才說過用16比特來表達整數(shù),最高位的1是第17位,這一位是溢出位,在運算寄存器中沒有儲存這一位,所以結(jié)果是低16位,也就是0x0000?,F(xiàn)在我們知道負數(shù)的表達方式了。舉個例子:-100。首先我們需要知道100的16進制,用計算器轉(zhuǎn)換一下,可以知道是0x0064,那么-100就是0x10000 - 0x0064,用計算器算一下得0xff9c。還有一種簡單的轉(zhuǎn)換符號的方法,就是取反加一:把數(shù)x寫成二進制格式,每位0變1,1變0,最后把結(jié)果加1就是-x了。

好,復習了整數(shù)的相關(guān)知識之后,我們進入定點小數(shù)運算環(huán)節(jié)。所謂定點小數(shù),就是小數(shù)點的位置是固定的。我們是要用整數(shù)來表示定點小數(shù),由于小數(shù)點的位置是固定的,所以就沒有必要儲存它(如果儲存了小數(shù)點的位置,那就是浮點數(shù)了)。既然沒有儲存小數(shù)點的位置,那么計算機當然就不知道小數(shù)點的位置,所以這個小數(shù)點的位置是我們寫程序的人自己需要牢記的。

先以10進制為例。如果我們能夠計算12+34=46的話,當然也就能夠計算1.2+3.4 或者 0.12+0.34了。所以定點小數(shù)的加減法和整數(shù)的相同,并且和小數(shù)點的位置無關(guān)。乘法就不同了。 12*34=408,而1.2*3.4=4.08。這里1.2的小數(shù)點在第1位之前,而4.08的小數(shù)點在第2位之前,小數(shù)點發(fā)生了移動。所以在做乘法的時候,需要對小數(shù)點的位置進行調(diào)整?!可是既然我們是做定點小數(shù)運算,那就說小數(shù)點的位置不能動!!怎么解決這個矛盾呢,那就是舍棄最低位。 也就說1.2*3.4=4.1,這樣我們就得到正確的定點運算的結(jié)果了。所以在做定點小數(shù)運算的時候不僅需要牢記小數(shù)點的位置,還需要記住表達定點小數(shù)的有效位數(shù)。上面這個例子中,有效位數(shù)為2,小數(shù)點之后有一位。

現(xiàn)在進入二進制。我們的定點小數(shù)用16位二進制表達,最高位是符號位,那么有效位就是15位。小數(shù)點之后可以有0 - 15位。我們把小數(shù)點之后有n位叫做Qn,例如小數(shù)點之后有12位叫做Q12格式的定點小數(shù),而Q0就是我們所說的整數(shù)。

Q12的正數(shù)的最大值是 0 111 . 111111111111,第一個0是符號位,后面的數(shù)都是1,那么這個數(shù)是十進制的多少呢,很好運算,就是 0x7fff / 2^12 = 7.999755859375。對于Qn格式的定點小數(shù)的表達的數(shù)值就它的整數(shù)值除以2^n。在計算機中還是以整數(shù)來運算,我們把它想象成實際所表達的值的時候,進行這個運算。

反過來把一個實際所要表達的值x轉(zhuǎn)換Qn型的定點小數(shù)的時候,就是x*2^n了。例如 0.2的Q12型定點小數(shù)為:0.2*2^12 = 819.2,由于這個數(shù)要用整數(shù)儲存, 所以是819 即 0x0333。因為舍棄了小數(shù)部分,所以0x0333不是精確的0.2,實際上它是819/2^12 =0.199951171875。

我們用數(shù)學表達式做一下總結(jié):

x表示實際的數(shù)(*一個浮點數(shù)), q表示它的Qn型定點小數(shù)(一個整數(shù))。

q = (int) (x * 2^n)

x = (float)q/2^n

由以上公式我們可以很快得出定點小數(shù)的+-*/算法:

假設q1,q2,q3表達的值分別為x1,x2,x3

q3 = q1 + q2 ? 若 x3 = x1 + x2

q3 = q1 - q2 ? 若 x3 = x1 - x2

q3 = q1 * q2 / 2^n若 x3 = x1 * x2

q3 = q1 * 2^n / q2若 x3 = x1 / x2

我們看到加減法和一般的整數(shù)運算相同,而乘除法的時候,為了使得結(jié)果的小數(shù)點位不移動,對數(shù)值進行了移動。

用c語言來寫定點小數(shù)的乘法就是:

short q1,q2,q3;

....

q3=((long q1) * (long q2)) >> n;

由于/ 2^n和* 2^n可以簡單的用移位來計算,所以定點小數(shù)的運算比浮點小數(shù)要快得多。下面我們用一個例子來驗證一下上面的公式:

用Q12來計算2.1 * 2.2,先把2.1 2.2轉(zhuǎn)換為Q12定點小數(shù):

2.1 * 2^12 = 8601.6 = 8602

2.2 * 2^12 = 9011.2 = 9011

(8602 * 9011) >> 12 = 18923

18923的實際值是18923/2^12 = 4.619873046875 和實際的結(jié)果 4.62相差0.000126953125,對于一般的計算已經(jīng)足夠精確了。

第二部分dsp定點運算基本方法

來自:http://blog.csdn.net/maochengtao/article/details/9122115

一 DSP定點算數(shù)運算

1 數(shù)的定標

在定點DSP芯片中,采用定點數(shù)進行數(shù)值運算,其操作數(shù)一般采用整型數(shù)來表示。一個整型數(shù)的最大表示范圍取決于DSP芯片所給定的字長,一般為16位或24位。顯然,字長越長,所能表示的數(shù)的范圍越大,精度也越高。如無特別說明,本書均以16位字長為例。

DSP芯片的數(shù)以2的補碼形式表示。每個16位數(shù)用一個符號位來表示數(shù)的正負,0表示數(shù)值為正,l則表示數(shù)值為負。其余15位表示數(shù)值的大小。因此,

二進制數(shù)0010000000000011b=8195

二進制數(shù)1111111111111100b= -4

對DSP芯片而言,參與數(shù)值運算的數(shù)就是16位的整型數(shù)。但在許多情況下,數(shù)學運算過程中的數(shù)不一定都是整數(shù)。那么,DSP芯片是如何處理小數(shù)的呢?應該說,DSP芯片本身無能為力。那么是不是說DSP芯片就不能處理各種小數(shù)呢?當然不是。這其中的關(guān)鍵就是由程序員來確定一個數(shù)的小數(shù)點處于16位中的哪一位。這就是數(shù)的定標。

通過設定小數(shù)點在16位數(shù)中的不同位置,就可以表示不同大小和不同精度的小數(shù)了。數(shù)的定標有Q表示法和S表示法兩種。表1.1列出了一個16位數(shù)的16種Q表示、S表示及它們所能表示的十進制數(shù)值范圍。

從表1.1可以看出,同樣一個16位數(shù),若小數(shù)點設定的位置不同,它所表示的數(shù)也就不同。例如,

16進制數(shù)2000H=8192,用Q0表示

16進制數(shù)2000H=0.25,用Q15表示

但對于DSP芯片來說,處理方法是完全相同的。

從表1.1還可以看出,不同的Q所表示的數(shù)不僅范圍不同,而且精度也不相同。Q越大,數(shù)值范圍越小,但精度越高;相反,Q越小,數(shù)值范圍越大,但精度就越低。例如,Q0 的數(shù)值范圍是一32768到+32767,其精度為1,而Q15的數(shù)值范圍為-1到0.9999695,精度為1/32768=0.00003051。因此,對定點數(shù)而言,數(shù)值范圍與精度是一對矛盾,一個變量要想能夠表示比較大的數(shù)值范圍,必須以犧牲精度為代價;而想精度提高,則數(shù)的表示范圍就相應地減小。在實際的定點算法中,為了達到最佳的性能,必須充分考慮到這一點。

浮點數(shù)與定點數(shù)的轉(zhuǎn)換關(guān)系可表示為:

浮點數(shù)(x)轉(zhuǎn)換為定點數(shù)(xq):xq=(int)x* 2Q

定點數(shù)(xq)轉(zhuǎn)換為浮點數(shù)(x):x=(float)xq*2-Q

例如,浮點數(shù)x=0.5,定標Q=15,則定點數(shù)xq=L0.5*32768J=16384,式中LJ表示下取整。反之,一個用Q=15表示的定點數(shù)16384,其浮點數(shù)為163幼*2-15=16384/32768=0.5。浮點數(shù)轉(zhuǎn)換為定點數(shù)時,為了降低截尾誤差,在取整前可以先加上0.5。

表1.1??? Q表示、S表示及數(shù)值范圍

Q表示??? S表示??? 十進制數(shù)表示范圍

Q15??? S0.15??? -1≤x≤0.9999695

Q14??? S1.14??? -2≤x≤1.9999390

Q13??? S2.13??? -4≤x≤3.9998779

Q12??? S3.12??? -8≤x≤7.9997559

Q11??? S4.11??? -16≤x≤15.9995117

Q10??? S5.10??? -32≤x≤31.9990234

Q9??? ?S6.9??? ?-64≤x≤63.9980469

Q8??? ?S7.8??? ?-128≤x≤127.9960938

Q7??? ?S8.7??? ?-256≤x≤255.9921875

Q6??? ?S9.6??? ?-512≤x≤511.9804375

Q5??? ?S10.5??? -1024≤x≤1023.96875

Q4??? ?S11.4??? -2048≤x≤2047.9375

Q3??? ?S12.3??? -4096≤x≤4095.875

Q2??? ?S13.2??? -8192≤x≤8191.75

Q1??? ?S14.1??? -16384≤x≤16383.5

Q0??? ?S15.0??? -32768≤x≤32767

2 高級語言:從浮點到定點

我們在編寫DSP模擬算法時,為了方便,一般都是采用高級語言(如C語言)來編寫模擬程序。程序中所用的變量一般既有整型數(shù),又有浮點數(shù)。如例1.1程序中的變量i是整型數(shù),而pi是浮點數(shù),hamwindow則是浮點數(shù)組。

例1.1 256點漢明窗計算

int i;+

float pi=3.14l59;

float hamwindow[256];

for(i=0;i<256;i++) hamwindow=0.54-0.46*cos(2.0*pi*i/255);

如果我們要將上述程序用某種足點DSP芯片來實現(xiàn),則需將上述程序改寫為DSP芯片的匯編語言程序。為了DSP程序調(diào)試的方便及模擬定點DSP實現(xiàn)時的算法性能,在編寫DSP匯編程序之前一般需將高級語言浮點算法改寫為高級語言定點算法。下面我們討論基本算術(shù)運算的定點實現(xiàn)方法。

2.1 加法/減法運算的C語言定點摸擬

設浮點加法運算的表達式為:

float x,y,z;

z=x+y;

將浮點加法/減法轉(zhuǎn)化為定點加法/減法時最重要的一點就是必須保證兩個操作數(shù)的定標

temp=x+temp;

z=temp>>(Qx-Qz),若Qx>=Qz

z=temp<<(Qz-Qx),若Qx<=Qz

例1.4結(jié)果超過16位的定點加法

設x=l5000,y=20000,則浮點運算值為z=x+y=35000,顯然z>32767,因此

Qx=1,Qy=0,Qz=0,則定點加法為:

x=30000;y=20000;

temp=20000<<1=40000;

temp=temp+x=40000+30000=70000;

z=70000L>>1=35000;

因為z的Q值為0,所以定點值z=35000就是浮點值,這里z是一個長整型數(shù)。當加法或加法的結(jié)果超過16位表示范圍時,如果程序員事先能夠了解到這種情況,并且需要保持運算精度時,則必須保持32位結(jié)果。如果程序中是按照16位數(shù)進行運算的,則超過16位實際上就是出現(xiàn)了溢出。如果不采取適當?shù)拇胧?,則數(shù)據(jù)溢出會導致運算精度的嚴重惡化。一般的定點DSP芯片都沒有溢出保護功能,當溢出保護功能有效時,一旦出現(xiàn)溢出,則累加器ACC的結(jié)果為最大的飽和值(上溢為7FFFH,下溢為8001H),從而達到防止溢出引起精度嚴重惡化的目的。

2.2乘法運算的C語言定點模擬

設浮點乘法運算的表達式為:

float x,y,z;

z=xy;

假設經(jīng)過統(tǒng)計后x的定標值為Qx,y的定標值為Qy,乘積z的定標值為Qz,則

z=xy

zq*2-Qx=xq*yq*2-(Qx+Qy)

zq=(xqyq)2Qz-(Qx+Qy)

所以定點表示的乘法為:

int x,y,z;

long temp;

temp=(long)x;

z=(temp*y)>>(Qx+Qy-Qz);

例1.5定點乘法。

設x=18.4,y=36.8,則浮點運算值為=18.4*36.8=677.12;

根據(jù)上節(jié),得Qx=10,Qy=9,Qz=5,所以

x=18841;y=18841;

temp=18841L;

z=(18841L*18841)>>(10+9-5)=354983281L>>14=21666;

因為z的定標值為5,故定點z=21666,即為浮點的z=21666/32=677.08。

2.3除法運算的C語言定點摸擬

設浮點除法運算的表達式為:

float x,y,z;

z=x/y;

假設經(jīng)過統(tǒng)計后被除數(shù)x的定標值為Qx,除數(shù)y的定標值為Qy,商z的定標值為Qz,則

z=x/y

zq*2-Qz=(xq*2-Qx)/(yq*2-Qy)

zq=(xq*2(Qz-Qx+Qy))/yq

所以定點表示的除法為:

int x,y,z;

long temp;

temp=(long)x;

z=(temp<<(Qz-Qx+Qy))/y;

例1.6定點除法。

設x=18.4,y=36.8,浮點運算值為z=x/y=18.4/36.8=0.5;

根據(jù)上節(jié),得Qx=10,Qy=9,Qz=15;所以有

z=18841,y=18841;

temp=(long)18841;

z=(18841L<<(15-10+9)/18841=3O8690944L/18841=16384;

因為商z的定標值為15,所以定點z=16384,即為浮點z=16384/215=0.5。

2.4程序變量的Q值確定

在前面幾節(jié)介紹的例子中,由于x,y,z的值都是已知的,因此從浮點變?yōu)槎c時Q值很好確定。在實際的DSP應用中,程序中參與運算的都是變量,那么如何確定浮點程序中變量的Q值呢?從前面的分析可以知道,確定變量的Q值實際上就是確定變量的動態(tài)范圍,動態(tài)范圍確定了,則Q值也就確定了。

設變量的絕對值的最大值為|max|,注意|max|必須小于或等于32767。取一個整數(shù)n,使?jié)M足

2n-1<|max|<2n

則有

2-Q=2-15*2n=2-(15-n)

Q=15-n

例如,某變量的值在-1至+1之間,即|max|<1,因此n=0,Q=15-n=15。

既然確定了變量的|max|就可以確定其Q值,那么變量的|max|又是如何確定的呢?一般來說,確定變量的|max|有兩種方法。一種是理論分析法,另一種是統(tǒng)計分析法。

1. 理論分析法

有些變量的動態(tài)范圍通過理論分析是可以確定的。例如:

(1)三角函數(shù)。y=sin(x)或y=cos(x),由三角函數(shù)知識可知,|y|<=1。

(2)漢明窗。y(n)=0.54一0.46cos[nπn/(N-1)],0<=n<=N-1。因為-1<=cos[2πn/(N-1)]<=1,所以0.08<=y(n)<=1.0。

(3)FIR卷積。y(n)=∑h(k)x(n-k),設∑|h(k)|=1.0,且x(n)是模擬信號12位量化值,即有|x(n)|<=211,則|y(n)|<=211。

(4)理論已經(jīng)證明,在自相關(guān)線性預測編碼(LPC)的程序設計中,反射系數(shù)ki滿足下列不等式:|ki|<1.0,i=1,2,...,p,p為LPC的階數(shù)。

2. 統(tǒng)計分析法

對于理論上無法確定范圍的變量,一般采用統(tǒng)計分析的方法來確定其動態(tài)范圍。所謂統(tǒng)計分析,就是用足夠多的輸入信號樣值來確定程序中變量的動態(tài)范圍,這里輸入信號一方面要有一定的數(shù)量,另一方面必須盡可能地涉及各種情況。例如,在語音信號分析中,統(tǒng)計分析時就必須來集足夠多的語音信號樣值,并且在所采集的語音樣值中,應盡可能地包含各種情況。如音量的大小,聲音的種類(男聲、女聲等)。只有這樣,統(tǒng)計出來的結(jié)果才能具有典型性。

當然,統(tǒng)計分析畢竟不可能涉及所有可能發(fā)生的情況,因此,對統(tǒng)計得出的結(jié)果在程序設計時可采取一些保護措施,如適當犧牲一些精度,Q值取比統(tǒng)計值稍大些,使用DSP芯片提供的溢出保護功能等。

2.5浮點至定點變換的C程序舉例

本節(jié)我們通過一個例子來說明C程序從浮點變換至定點的方法。這是一個對語音信號(0.3~3.4kHz)進行低通濾波的C語言程序,低通濾波的截止頻率為800Hz,濾波器采用19點的有限沖擊響應FIR濾波。語音信號的采樣頻率為8kHz,每個語音樣值按16位整型數(shù)存放在insp.dat文件中。

例1.7語音信號800Hz 19點FIR低通濾波C語言浮點程序。

#i nclude

const int length=180/*語音幀長為180點=22.5ms@8kHz采樣*/

void filter(int xin[],int xout[],int n,float h[]);/*濾波子程序說明*/

/*19點濾波器系數(shù)*/

static float h[19]=

{0.01218354,-0.009012882,-0.02881839,-0.04743239,-0.04584568,

-0.008692503,0.06446265,0.1544655,0.2289794,0.257883,

0.2289794,0.1544655,0.06446265,-0.008692503,-0.04584568,

-0.04743239,-0.02881839,-0.009012882,O.01218354};

static int xl[length+20];

/*低通濾波浮點子程序*/

void filter(int xin[],int xout[],int n,float h[])

{

int i,j;

float sum;

for(i=0;i

for(i=0;i<length;i++)

{

sum=0.0;

for(j=0;j<n;j++)sum+=h[j]*x1[i-j+n-1];

xout=(int)sum;

for(i=0;i<(n-l);i++)x1[n-i-2]=xin[length-1-i];

}

/*主程序*/

void main()

FILE *fp1,*fp2;

int ,indata[length],outdata[length];

fp1=fopen(insp.dat,"rb");/* 輸入語音文件*/

fp2=fopen(Outsp.dat,"wb");/* 濾波后語音文件*/

=0;

while(feof(fp1) ==0)

{

++;

printf(“=%d\n”,);

for(i=0;i<length;i++)indata=getw(fp1); /*取一幀語音數(shù)據(jù)*/

filter(indata,outdata,19,h);/*調(diào)用低通濾波子程序*/

for(i=0;i<length;i++)putw(outdata,fp2);/*將濾波后的樣值寫入文件*/

}

fcloseall();/*關(guān)閉文件*/

return(0);

}

例1.8語音信號800Hz l9點FIR低通濾波C語言定點程序。

#i nclude

const int length=180;

void filter (int xin[],int xout[],int n,int h[]);

static int h[19]={399,-296,-945,-1555,-1503,-285,2112,5061,7503,8450,

7503,5061,2112,-285,-1503,-1555,-945,-296,399};/*Q15*/

static int x1[length+20];

/*低通濾波定點子程序*/

void filter(int xin[],int xout[],int n,int h[])

int i,j;

long sum;

for(i=0;i<length;i++)x1[n+i-111=xin];

for(i=0;i<1ength;i++)

sum=0;

for(j=0;j<n;j++)sum+=(long)h[j]*x1[i-j+n-1];

xout=sum>>15;

for(i=0;i<(n-1);i++)x1[n-i-2]=xin[length-i-1];

}

主程序與浮點的完全一樣?!?/p>

3 DSP定點算術(shù)運算

定點DSP芯片的數(shù)值表示基于2的補碼表示形式。每個16位數(shù)用l個符號位、i個整數(shù)位和15-i個小數(shù)位來表示。因此:

00000010.10100000

表示的值為:

21+2-1+2-3=2.625

這個數(shù)可用Q8格式(8個小數(shù)位)來表示,其表示的數(shù)值范圍為-128至+l27.996,一個Q8定點數(shù)的小數(shù)精度為1/256=0.004。

雖然特殊情況(如動態(tài)范圍和精度要求)必須使用混合表示法。但是,更通常的是全部以Q15格式表示的小數(shù)或以Q0格式表示的整數(shù)來工作。這一點對于主要是乘法和累加的信號處理算法特別現(xiàn)實,小數(shù)乘以小數(shù)得小數(shù),整數(shù)乘以整數(shù)得整數(shù)。當然,乘積累加時可能會出現(xiàn)溢出現(xiàn)象,在這種情況下,程序員應當了解數(shù)學里面的物理過程以注意可能的溢出情況。下面我們來討論乘法、加法和除法的DSP定點運算,匯編程序以TMS320C25為例。

3.1定點乘法

兩個定點數(shù)相乘時可以分為下列三種情況:

1. 小數(shù)乘小數(shù)

例1.9 Q15*Q15=Q30

0.5*0.5=0.25

0.100000000000000;Q15

* 0.100000000000000;Q15

--------------------------------------------

00.010000000000000000000000000000=0.25;Q30

兩個Q15的小數(shù)相乘后得到一個Q30的小數(shù),即有兩個符號位。一般情況下相乘后得到的滿精度數(shù)不必全部保留,而只需保留16位單精度數(shù)。由于相乘后得到的高16位不滿15位的小數(shù)據(jù)度,為了達到15位精度,可將乘積左移一位,下面是上述乘法的TMS320C25程序:

LT OP1;OP1=4000H(0.5/Q15)

MPY OP2;oP2=4000H(0.5/Ql5)

PAC

SACH ANS,1;ANS=2000H(0.25/Q15)

2. 整數(shù)乘整數(shù)

例1.10 Q0*Q0=Q0

17*(-5)=-85

0000000000010001=l7

*1111111111111011=-5

-------------------------------------------

11111111111111111111111110101011=-85

3. 混合表示法

許多情況下,運算過程中為了既滿足數(shù)值的動態(tài)范圍又保證一定的精度,就必須采用Q0與Q15之間的表示法。比如,數(shù)值1.2345,顯然Q15無法表示,而若用Q0表示,則最接近的數(shù)是1,精度無法保證。因此,數(shù)1.2345最佳的表示法是Q14。

例1.11 1.5*0.75= 1.125

01.10000000000000=1.5;Q14

*00.11000000000000=0.75;Q14

---------------------------------------

0001.0010000000000000000000000000=1.125 Q28

Q14的最大值不大于2,因此,兩個Q14數(shù)相乘得到的乘積不大于4。

一般地,若一個數(shù)的整數(shù)位為i位,小數(shù)位為j位,另一個數(shù)的整數(shù)位為m位,小數(shù)位為n位,則這兩個數(shù)的乘積為(i+m)位整數(shù)位和(j+n)位小數(shù)位。這個乘積的最高16位可能的精度為(i+m)整數(shù)位和(15- i- m)小數(shù)位。

但是,若事先了解數(shù)的動態(tài)范圍,就可以增加數(shù)的精度。例如,程序員了解到上述乘積不會大于1.8,就可以用Q14數(shù)表示乘積,而不是理論上的最佳情況Q13。例3.11的TMS320C25程序如下:

LT OP1;OP1 = 6000H(1.5/Ql4)

MPY OP2;OP2 = 3000H(0.75/Q14)

PAC

SACH ANS,1;ANS=2400H(1.125/Q13)

上述方法,為了精度均對乘的結(jié)果舍位,結(jié)果所產(chǎn)生的誤差相當于減去一個LSB(最低位)。采用下面簡單的舍人方法,可使誤差減少二分之一。

LT OP1

MPY OP2

PAC

ADD ONE,14(上舍入)

SACH ANS,1

上述程序說明,不管ANS為正或負,所產(chǎn)生的誤差是l/2 LSB,其中存儲單元ONE的值為1。

3.2定點加法

乘的過程中,程序員可不考慮溢出而只需調(diào)整運算中的小數(shù)點。而加法則是一個更加復雜的過程。首先,加法運算必須用相同的Q點表示,其次,程序員或者允許其結(jié)果有足夠的高位以適應位的增長,或者必須準備解決溢出問題。如果操作數(shù)僅為16位長,其結(jié)果可用雙精度數(shù)表示。下面舉例說明16位數(shù)相加的兩種途徑。

1.保留32位結(jié)果

LAC OP1;(Q15)

ADD OP2;(Ql5)

SACH ANSHI ;(高16位結(jié)果)

SACL ANSLO :(低16位結(jié)果)

2.調(diào)整小數(shù)點保留16位結(jié)果

LAC OP1,15;(Q14數(shù)用ACCH表示)

ADD OP2,15;(Q14數(shù)用ACCH表示)

SACH ANS;(Q14)

加法運算最可能出現(xiàn)的問題是運算結(jié)果溢出。TMS320提供了檢查溢出的專用指令BV,此外,使用溢出保護功能可使累加結(jié)果溢出時累加器飽和為最大的整數(shù)或負數(shù)。當然,即使如此,運算精度還是大大降低。因此,最好的方法是完全理解基本的物理過程并注意選擇數(shù)的表達方式。

3.3定點除法

在通用DSP芯片中,一般不提供單周期的除法指令,為此必須采用除法子程序來實現(xiàn)。二進制除法是乘法的逆運算。乘法包括一系列的移位和加法,而除法可分解為一系列的減法和移位。下面我們來說明除法的實現(xiàn)過程。

設累加器為8位,且除法運算為10除以3。除的過程包括與被除法有關(guān)的除數(shù)逐步移位,在每一步進行減法運算,如果能減則將位插入商中。

(1)除數(shù)的最低有效位對齊被除數(shù)的最高有效位。

0000l0l0

- 00011000

--------------------------------------

11110010

(2)由于減法結(jié)果為負,放棄減法結(jié)果,將被除數(shù)左移一位,再減。

00010100

- 00011000

----------------------------------------

11111000

(3)結(jié)果仍為負,放棄減法結(jié)果,被除數(shù)左移一位,再減。

00101000

-?? 00011000

------------------------------------------

00010000

(4)結(jié)果為正,將減法結(jié)果左移一位后加1,作最后一次減。

00100001

-?? 00011000

----------------------------------------

00001001

(5)結(jié)果為正,將結(jié)果左移一位加1 得最后結(jié)果。高4位代表余數(shù),低4位表示商。

00010011

即,商為0011= 3.余數(shù)為0001= 1。

TMS320沒有專門的除法指令,但使用條件減指令SUBC可以完成有效靈活的除法功能。使用這一指令的唯一限制是兩個操作數(shù)必須為正。程序員必須事先了解其可能的運算數(shù)的特性,如其商是否可以用小數(shù)表示及商的精度是否可被計算出來。這里每一種考慮可影響如何使用SUBC指令的問題。下面我們給出兩種不同情況下的TMS320C25除法程序。

(1)分子小于分母

DIV_A:

LT NUMERA

MPY DENOM

PAC

SACH TEMSGN;取商的符號

LAC DENOM

ABS

SACL DENOM;使分母為正

ZALH NUMERA; 分子為正

ABS

RPTK 14

SUBC DENOM;除循環(huán)15次

SACL QUOT

LAC TEMSGN

BGEZ A1;若符號為正,則完成

ZAC

SUB QUOT

SACL QUOT;若為負,則商為負

A1: RET

這個程序中,分子在NUMERA中,分母在DENOM中,商存在QUOT中,TEMSGN為暫存單元。

(2)規(guī)定商的精度

DIV_B:

LT NUMERA

MPY DENOM

PAC

SACH TEMSGN;取商的符號

LAC DENOM

ABS

SACL DENOM; 使分母為正

LACK 15

ADD FRAC

SACL FRAC;計算循環(huán)計數(shù)器

LAC NUMERA

ABS ; 使分子為正

RPT FRAC

SUBC DENOM; 除循環(huán)16+FRAC次

SACL QUOT

LAC TEMSGN

BGEZ B1;若符號為正,則完成

ZAC

SUB QUOT

SACL QUOT;若為負,則商為負

B1: RET

與DIV_A相同,這個程序中,分子在NUMERA中,分母在DENOM中,商存在QUOT中,TEMSGN為暫存單元。FRAC中規(guī)定商的精度,如商的精度為Q13,則調(diào)用程序前FRAC單元中的值應為13。

4 非線性運算的定點快速實現(xiàn)

在數(shù)值運算中,除基本的加減乘除運算外,還有其它許多非線性運算,如,對數(shù)運算,開方運算,指數(shù)運算,三角函數(shù)運算等,實現(xiàn)這些非線性運算的方法一般有:(1)調(diào)用DSP編譯系統(tǒng)的庫函數(shù);(2)查表法;(3)混合法。下面我們分別介紹這三種方法。

1.調(diào)用DSP編譯系統(tǒng)的庫函數(shù)

TMS320C2X/C5X的C編譯器提供了比較豐富的運行支持庫函數(shù)。在這些庫函數(shù)中,包含了諸如對數(shù)、開方、三角函數(shù)、指數(shù)等常用的非線性函數(shù)。在C程序中(也可在匯編程序中)只要采用與庫函數(shù)相同的變量定義,就可以直接調(diào)用。例如,在庫函數(shù)中,定義了以10為底的常用對數(shù)log10():

#i nclude<math.h>

double,log10(double x);

在C程序中按如下方式調(diào)用:

float x,y;

X=10.0;

y=log10(x);

從上例可以看出,庫函數(shù)中的常用對數(shù)log10()要求的輸入值為浮點數(shù),返回值也為浮點數(shù),運算的精度完全可以保證。直接調(diào)用庫函數(shù)非常方便,但由于運算量大,很難在實時DSP中得到應用。

2.查表法

在實時DSP應用中實現(xiàn)非線性運算,一般都采取適當降低運算精度來提高程序的運算速度。查表法是快速實現(xiàn)非線性運算最常用的方法。采用這種方法必須根據(jù)自變量的范圍和精度要求制作一張表格。顯然輸人的范圍越大,精度要求越高,則所需的表格就越大,即存儲量也越大。查表法求值所需的計算就是根據(jù)輸入值確定表的地址,根據(jù)地址就可得到相應的值,因而運算量較小。查表法比較適合于非線性函數(shù)是周期函數(shù)或已知非線性函數(shù)輸入值范圍這兩種情況、例1.12和例1. 13分別說明這兩種情況。

例1.12 已知正弦函數(shù)y=cos(x),制作一個512點表格,并說明查表方法。由于正弦函數(shù)是周期函數(shù),函數(shù)值在-1至+1之間,用查表法比較合適。由于Q15的表示范圍為1-至32767/32768之間,原則上講-1至+1的范圍必須用Q14表示。但一般從方便和總體精度考慮,類似情況仍用Q15表示,此時+1用32767來表示。

(1)產(chǎn)生5l2點值的C語言程序如下所示。

#define N 512

#define pi 3.14l59

int sin_tab[5l2];

void main()

{

int i;

for(i=0;i<N;i++)sin_tab=(int)(32767*sin(2*pi*i/N));

(2)查表

查表實際上就是根據(jù)輸人值確定表的地址。設輸入x在0~2π之間,則x對應于512點表的地址為:index=(int)(512*x/2π),則y=sin(x)=sin_tab[index]如果x用Q12定點數(shù)表示,將512/2π用Q8表示為20861,則計算正弦表的地址的公式為。

index=(x*20861L)>>20;

例1.12用查表法求以2為底的對數(shù),已知自變量值范圍為0.5-1,要求將自變量范圍均勻劃分為10等分。試制作這個表格并說明查表方法。

(1)作表:

y=log2(x),由于x在0.5到1之間,因此y在-1到0之間,x和y均可用Q15表示。由于對x均勻劃分為10段,因此,10段對應于輸入x的范圍如表3.2所示。若每一段的對數(shù)值都取第一點的對數(shù)值,則表中第一段的對數(shù)值為y0(Q15)=(int)(log(O.5)*32768),第二段的對數(shù)值為y1(Q15)=(int)(log2(0.55)*32768),依次類推,如表3.2所示。

(2)查表:

查表時,先根據(jù)輸人值計算表的地址,計算方法為:

index=((x-16384)*20)>>15;

式中, index就是查表用的地址。例如,已知輸人x=26869,則index=6,因此,y= -10549。

表1.2 logtab0 10點對數(shù)表

地址??? 輸入值??? 對數(shù)值(Q15)

0??? 0.50-0.55??? -32768

1??? 0.55-0.60??? -28262

2??? 0.60-0.65??? -24149

3??? 0.65-0.70??? -20365

4??? 0.70-0.75??? -16862

5??? 0.75-0.80??? -13600

6??? 0.80-0.85??? -10549

7??? 0.85-0.90??? -7683

8??? 0.90-0.95??? -4981

9??? 0.95-1.00??? -2425

3.混合法

(1)提高查表法的精度

上述方法查表所得結(jié)果的精度隨表的大小而變化,表越大,則精度越高,但存儲量也越大。當系統(tǒng)的存儲量有限而精度要求也較高時,查表法就不太適合。那么能否在適當增加運算量的情況下提高非線性運算的精度呢?下面介紹一種查表結(jié)合少量運算來計算非線性函數(shù)的混合法,這種方法適用于在輸入變量的范圍內(nèi)函數(shù)呈單調(diào)變化的情形?;旌戏ㄊ窃诓楸淼幕A上來用計算的方法以提高當輸入值處于表格兩點之間時的精度。提高精度的一個簡便方法是采用折線近似法,如圖1.1所示。

圖1.1提高精度的折線近似法”

仍以求以2為底的對數(shù)為例(例1.12)。設輸入值為x,則精確的對數(shù)值為y,在表格值的兩點之間作一直線,用y'作為y的近似值,則有:

y'=y0+△y

其中y0由查表求得。現(xiàn)在只需在查表求得y0的基礎上增加△y既可?!鱵的計算方法如下:?????????????????? △y=(△x/△x0)△y=△x(△y0/△x0)

其中△y0/△x0對每一段來說是一個恒定值,可作一個表格直接查得。此外計算此時需用到每段橫坐標的起始值,這個值也可作一個表格。這佯共有三個大小均為10的表格,分別為存儲每段起點對數(shù)值的表logtab0、存儲每段△y0/△x0值的表logtab1和存儲每段輸入起始值x0的表logtab2,表logtab1和表logtab2可用下列兩個數(shù)組表示。

int logtab1[10]={22529,20567,18920,17517,16308,

15255,14330,13511,12780,12124};/*△y0/△x0:Q13*/

int logtab2[10]={16384,18022,19660,21299,22938,

24576,26214,27853,29491,31130};/*x0:Q15*/

綜上所述,采用混合法計算對數(shù)值的方法可歸納為:

(1)根據(jù)輸人值,計算查表地址:index=((x-16384)*20)>>15;

(2)查表得y0=logtab0[index];

(3)計算△x=x-logtab2[index];

(4)計算△y=(△x*logtab1[index])>>13;

(5)計算得結(jié)果y=y0+△y。

例1.13已知x=0.54,求log2(x)。

0.54的精確對數(shù)值為y=log2(0.54)=-0.889。

混合法求對數(shù)值的過程為:

(1)定標Q15,定標值x=0.54*32768=17694;

(2)表地址index=((x-16384)*20)>>15=0;

(3)查表得y0=logtab0[0]=-32768;

(4)計算△x=x-logtab2[0]=17694-16384=1310;

(5)計算△y=(△xlogtab1[0]>>13=(13l0*22529L)>>13=3602

(6)計算結(jié)果y=y0+△y=-32768+3602=-29166。

結(jié)果y為Q15定標,析算成浮點數(shù)為-29166/32768=-0.89,可見精度較高。

(2)擴大自變量范圍

如上所述,查表法比較適用于周期函數(shù)或自變量的動態(tài)范圍不是太大的情形。對于像對數(shù)這樣的非線性函數(shù),輸入值和函數(shù)值的變化范圍都很大。如果輸入值的變化范圍很大,則作表就比較困難。那么能否比較好地解決這個問題,即不便表格太大,又能得到比較高的精度呢?下面我們來討論一種切實可行的方法。

設x是一個大于0.5的數(shù),則x可以表示為下列形式:

x=m*2e

式中,0.5<=m<=1.0,e為整數(shù)。則求x的對數(shù)可以表示為:

log2(x)=log2(m*2e)=log2(m)+log2(2e)=e+log2(m)

也就是說,求x的對數(shù)實際上只要求m的對數(shù)就可以了,而由于m的數(shù)值在0.5和1.0之間,用上面介紹的方法是完全可以實現(xiàn)的。例如:

log2(10000)=log2(0.61035*214)=log2(0.61035)+14 =13.2877

可見,如果一個數(shù)可以用比較簡便的方法表示為上面的形式,則求任意大小數(shù)的對數(shù)也比較方便的。TMS320C2X/C5X指令集提供了一條用于對ACC中的數(shù)進行規(guī)格化的指令NORM,該指令的作用就是使累加器中的數(shù)左移,直至數(shù)的最高位被移至累加器的第30位。例如,對數(shù)值10000進行規(guī)格化的TMS320C25程序為。

LAC #10000

SACL TEMP

ZALH TEMP

LAR AR1,#0FH

RPT 14

NORM * -

上述程序執(zhí)行后,AR1=#0eH,ACCH=2000(10進制)。對一個16位整數(shù)x進行上述程序處理實際上就是作這樣一個等效變換:

x=[(x*2e)/32768]*215-Q

其中,寄存器AR1包含的值為15-Q累加器ACC高16位包含的值為x.2Q,其數(shù)值在16384至32768之間。

例1.14實現(xiàn)以2為底的對數(shù)的C定點模擬程序。

int logtab0[10]={-32768,-28262,-24149,-20365,-16862,

-13600),-1O549,-7683,-4981,-2425};/*Q15*/

int logtab1[10]={122529,20567,18920,175l7,16308,

15255,14330,13511,12780,12124};/*Q13*/

int logtab2[10]={16384,l8022,19660,21299,22938,

24576,26214,27853,29491,31130};/*Q15*/

int log2_fast(int Am)

{

int point,point1;

int index,x0,dx,dy,y;

point=0;

while(Am<16384){point++;Am=Am<<1;}/*對Am進行規(guī)格化*/

point1=(15-point-4)*512;/*輸入為Q4,輸出為Q9*/

index=((Am-16384)*20L)>>15;/*求查表地址*/

dx=Am-logtab2[index];

dy=((long)dx*logtab1[index])>>13;

y=(dy+longtab0[index])>>6;/*Q9*/

y=point1+y;

return(y);

}

上述程序中,輸入值Am采用Q4表示,輸出采用Q9表示,如果輸入輸出的Q值與上面程序中的不同,則應作相應的修改。

以上討論了DSP芯片進行定點運算所涉及的一些基本問題,這些問題包括:數(shù)的定標,DSP程序的定點模擬,DSP芯片的足點運算以及定點實現(xiàn)非線性函數(shù)的快速實現(xiàn)方法等。充分理解這些問題對于用定點芯片實現(xiàn)DSP算法具有非常重要的作用。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

  • longaaaa =14200666; Console.WriteLine(aaaa.ToString("N0")...
    魚落于天閱讀 1,052評論 0 1
  • TF API數(shù)學計算tf...... :math(1)剛開始先給一個運行實例。tf是基于圖(Graph)的計算系統(tǒng)...
    MachineLP閱讀 4,073評論 0 1
  • 第一章數(shù)和數(shù)的運算 一概念 (一)整數(shù) 1整數(shù)的意義 自然數(shù)和0都是整數(shù)。 2自然數(shù) 我們在數(shù)物體的時候,用來表示...
    meychang閱讀 2,847評論 0 5
  • 1 關(guān)鍵字 1.1 關(guān)鍵字的概述 Java的關(guān)鍵字對java的編譯器有特殊的意義,他們用來表示一種數(shù)據(jù)類型,或...
    哈哈哎呦喂閱讀 788評論 0 0
  • 在我們國家有著很多關(guān)于愛情的傳說和許多愛情圣地, 有著許多愛情可歌可泣,讓人情不自禁的被他們的故事所感染 。 ...
    6178f6486e20閱讀 361評論 0 0

友情鏈接更多精彩內(nèi)容