亚洲精品一区乳污,色m一区在线,欧美精品第一页

定點小數(shù)運算

來自：http://www.eepw.com.cn/article/17893.htm

在DSP世界中，由于DSP芯片的限制,經(jīng)常使用定點小數(shù)運算。所謂定點小數(shù)，實際上就是用整數(shù)來進行小數(shù)運算。下面先介紹定點小數(shù)的一些理論知識，然后以C語言為例，介紹一下定點小數(shù)運算的方法。在TI C5000 DSP系列中使用16比特為最小的儲存單位，所以我們就用16比特的整數(shù)來進行定點小數(shù)運算。 ? ? ? ?先從整數(shù)開始，16比特的儲存單位最多可以表示0x0000到0xffff，65536種狀態(tài)，如果它表示C語言中的無符號整數(shù)的話，就是從0到65535。如果需要表示負數(shù)的話，那么最高位就是符號位，而剩下的15位可以表示32768種狀態(tài)。這里可以看出，對于計算機或者DSP芯片來說，符號并沒有什么特殊的儲存方式，其實是和數(shù)字一起儲存的。為了使得無論是無符號數(shù)還是符號數(shù)，都可以使用同樣的加法減法規(guī)則，符號數(shù)中的負數(shù)用正數(shù)的補碼表示。

我們都知道-1 + 1 =0，而0x0001表示1，那么-1用什么來表示才能使得-1 + 1 =0呢？答案很簡單：0xffff?，F(xiàn)在就可以打開Windows的計算器，用16進制計算一下0xffff+0x0001，結(jié)果是0x10000。那么0x10000和0x0000等價麼，我們剛才說過用16比特來表達整數(shù)，最高位的1是第17位，這一位是溢出位，在運算寄存器中沒有儲存這一位，所以結(jié)果是低16位，也就是0x0000?，F(xiàn)在我們知道負數(shù)的表達方式了。舉個例子：-100。首先我們需要知道100的16進制，用計算器轉(zhuǎn)換一下，可以知道是0x0064，那么-100就是0x10000 - 0x0064，用計算器算一下得0xff9c。還有一種簡單的轉(zhuǎn)換符號的方法，就是取反加一：把數(shù)x寫成二進制格式，每位0變1，1變0，最后把結(jié)果加1就是-x了。

好，復習了整數(shù)的相關(guān)知識之后，我們進入定點小數(shù)運算環(huán)節(jié)。所謂定點小數(shù)，就是小數(shù)點的位置是固定的。我們是要用整數(shù)來表示定點小數(shù)，由于小數(shù)點的位置是固定的，所以就沒有必要儲存它（如果儲存了小數(shù)點的位置，那就是浮點數(shù)了）。既然沒有儲存小數(shù)點的位置，那么計算機當然就不知道小數(shù)點的位置，所以這個小數(shù)點的位置是我們寫程序的人自己需要牢記的。

先以10進制為例。如果我們能夠計算12+34=46的話，當然也就能夠計算1.2+3.4 或者 0.12+0.34了。所以定點小數(shù)的加減法和整數(shù)的相同，并且和小數(shù)點的位置無關(guān)。乘法就不同了。 12*34=408，而1.2*3.4=4.08。這里1.2的小數(shù)點在第1位之前，而4.08的小數(shù)點在第2位之前，小數(shù)點發(fā)生了移動。所以在做乘法的時候，需要對小數(shù)點的位置進行調(diào)整？！可是既然我們是做定點小數(shù)運算，那就說小數(shù)點的位置不能動！！怎么解決這個矛盾呢，那就是舍棄最低位。也就說1.2*3.4=4.1，這樣我們就得到正確的定點運算的結(jié)果了。所以在做定點小數(shù)運算的時候不僅需要牢記小數(shù)點的位置，還需要記住表達定點小數(shù)的有效位數(shù)。上面這個例子中，有效位數(shù)為2，小數(shù)點之后有一位。

現(xiàn)在進入二進制。我們的定點小數(shù)用16位二進制表達，最高位是符號位，那么有效位就是15位。小數(shù)點之后可以有0 - 15位。我們把小數(shù)點之后有n位叫做Qn，例如小數(shù)點之后有12位叫做Q12格式的定點小數(shù)，而Q0就是我們所說的整數(shù)。

Q12的正數(shù)的最大值是 0 111 . 111111111111，第一個0是符號位，后面的數(shù)都是1，那么這個數(shù)是十進制的多少呢，很好運算，就是 0x7fff / 2^12 = 7.999755859375。對于Qn格式的定點小數(shù)的表達的數(shù)值就它的整數(shù)值除以2^n。在計算機中還是以整數(shù)來運算，我們把它想象成實際所表達的值的時候，進行這個運算。

反過來把一個實際所要表達的值x轉(zhuǎn)換Qn型的定點小數(shù)的時候，就是x*2^n了。例如 0.2的Q12型定點小數(shù)為：0.2*2^12 = 819.2，由于這個數(shù)要用整數(shù)儲存，所以是819 即 0x0333。因為舍棄了小數(shù)部分，所以0x0333不是精確的0.2，實際上它是819/2^12 =0.199951171875。

我們用數(shù)學表達式做一下總結(jié)：

x表示實際的數(shù)（*一個浮點數(shù)）， q表示它的Qn型定點小數(shù)（一個整數(shù)）。

q = (int) (x * 2^n)

x = (float)q/2^n

由以上公式我們可以很快得出定點小數(shù)的+-*/算法：

假設q1，q2，q3表達的值分別為x1，x2，x3

q3 = q1 + q2 ? 若 x3 = x1 + x2

q3 = q1 - q2 ? 若 x3 = x1 - x2

q3 = q1 * q2 / 2^n若 x3 = x1 * x2

q3 = q1 * 2^n / q2若 x3 = x1 / x2

我們看到加減法和一般的整數(shù)運算相同，而乘除法的時候，為了使得結(jié)果的小數(shù)點位不移動，對數(shù)值進行了移動。

用c語言來寫定點小數(shù)的乘法就是：

short q1,q2,q3;

....

q3=((long q1) * (long q2)) >> n;

由于/ 2^n和* 2^n可以簡單的用移位來計算，所以定點小數(shù)的運算比浮點小數(shù)要快得多。下面我們用一個例子來驗證一下上面的公式：

用Q12來計算2.1 * 2.2，先把2.1 2.2轉(zhuǎn)換為Q12定點小數(shù)：

2.1 * 2^12 = 8601.6 = 8602

2.2 * 2^12 = 9011.2 = 9011

(8602 * 9011) >> 12 = 18923

18923的實際值是18923/2^12 = 4.619873046875 和實際的結(jié)果 4.62相差0.000126953125，對于一般的計算已經(jīng)足夠精確了。

第二部分dsp定點運算基本方法

來自：http://blog.csdn.net/maochengtao/article/details/9122115

一 DSP定點算數(shù)運算

1 數(shù)的定標

在定點DSP芯片中，采用定點數(shù)進行數(shù)值運算，其操作數(shù)一般采用整型數(shù)來表示。一個整型數(shù)的最大表示范圍取決于DSP芯片所給定的字長，一般為16位或24位。顯然，字長越長，所能表示的數(shù)的范圍越大，精度也越高。如無特別說明，本書均以16位字長為例。

DSP芯片的數(shù)以2的補碼形式表示。每個16位數(shù)用一個符號位來表示數(shù)的正負，0表示數(shù)值為正，l則表示數(shù)值為負。其余15位表示數(shù)值的大小。因此，

二進制數(shù)0010000000000011b=8195

二進制數(shù)1111111111111100b= -4

對DSP芯片而言，參與數(shù)值運算的數(shù)就是16位的整型數(shù)。但在許多情況下，數(shù)學運算過程中的數(shù)不一定都是整數(shù)。那么，DSP芯片是如何處理小數(shù)的呢？應該說，DSP芯片本身無能為力。那么是不是說DSP芯片就不能處理各種小數(shù)呢？當然不是。這其中的關(guān)鍵就是由程序員來確定一個數(shù)的小數(shù)點處于16位中的哪一位。這就是數(shù)的定標。

通過設定小數(shù)點在16位數(shù)中的不同位置，就可以表示不同大小和不同精度的小數(shù)了。數(shù)的定標有Q表示法和S表示法兩種。表1.1列出了一個16位數(shù)的16種Q表示、S表示及它們所能表示的十進制數(shù)值范圍。

從表1.1可以看出，同樣一個16位數(shù)，若小數(shù)點設定的位置不同，它所表示的數(shù)也就不同。例如，

16進制數(shù)2000H=8192，用Q0表示

16進制數(shù)2000H=0.25，用Q15表示

但對于DSP芯片來說，處理方法是完全相同的。

從表1.1還可以看出，不同的Q所表示的數(shù)不僅范圍不同，而且精度也不相同。Q越大，數(shù)值范圍越小，但精度越高；相反，Q越小，數(shù)值范圍越大，但精度就越低。例如，Q0 的數(shù)值范圍是一32768到+32767，其精度為1，而Q15的數(shù)值范圍為-1到0.9999695，精度為1/32768=0.00003051。因此，對定點數(shù)而言，數(shù)值范圍與精度是一對矛盾，一個變量要想能夠表示比較大的數(shù)值范圍，必須以犧牲精度為代價；而想精度提高，則數(shù)的表示范圍就相應地減小。在實際的定點算法中，為了達到最佳的性能，必須充分考慮到這一點。

浮點數(shù)與定點數(shù)的轉(zhuǎn)換關(guān)系可表示為：

浮點數(shù)(x)轉(zhuǎn)換為定點數(shù)(xq)：xq=(int)x* 2Q

定點數(shù)(xq)轉(zhuǎn)換為浮點數(shù)(x)：x=(float)xq*2-Q

例如，浮點數(shù)x=0.5，定標Q=15，則定點數(shù)xq=L0.5*32768J=16384，式中LJ表示下取整。反之，一個用Q=15表示的定點數(shù)16384，其浮點數(shù)為163幼*2-15=16384/32768=0.5。浮點數(shù)轉(zhuǎn)換為定點數(shù)時，為了降低截尾誤差，在取整前可以先加上0.5。

表1.1??? Q表示、S表示及數(shù)值范圍

Q表示??? S表示??? 十進制數(shù)表示范圍

Q15??? S0.15??? -1≤x≤0.9999695

Q14??? S1.14??? -2≤x≤1.9999390

Q13??? S2.13??? -4≤x≤3.9998779

Q12??? S3.12??? -8≤x≤7.9997559

Q11??? S4.11??? -16≤x≤15.9995117

Q10??? S5.10??? -32≤x≤31.9990234

Q9??? ?S6.9??? ?-64≤x≤63.9980469

Q8??? ?S7.8??? ?-128≤x≤127.9960938

Q7??? ?S8.7??? ?-256≤x≤255.9921875

Q6??? ?S9.6??? ?-512≤x≤511.9804375

Q5??? ?S10.5??? -1024≤x≤1023.96875

Q4??? ?S11.4??? -2048≤x≤2047.9375

Q3??? ?S12.3??? -4096≤x≤4095.875

Q2??? ?S13.2??? -8192≤x≤8191.75

Q1??? ?S14.1??? -16384≤x≤16383.5

Q0??? ?S15.0??? -32768≤x≤32767

2 高級語言：從浮點到定點

我們在編寫DSP模擬算法時，為了方便，一般都是采用高級語言(如C語言)來編寫模擬程序。程序中所用的變量一般既有整型數(shù)，又有浮點數(shù)。如例1.1程序中的變量i是整型數(shù)，而pi是浮點數(shù)，hamwindow則是浮點數(shù)組。

例1.1 256點漢明窗計算

int i；+

float pi=3.14l59；

float hamwindow[256]；

for(i=0；i<256；i++) hamwindow=0.54-0.46*cos(2.0*pi*i/255)；

如果我們要將上述程序用某種足點DSP芯片來實現(xiàn)，則需將上述程序改寫為DSP芯片的匯編語言程序。為了DSP程序調(diào)試的方便及模擬定點DSP實現(xiàn)時的算法性能，在編寫DSP匯編程序之前一般需將高級語言浮點算法改寫為高級語言定點算法。下面我們討論基本算術(shù)運算的定點實現(xiàn)方法。

2.1 加法/減法運算的C語言定點摸擬

設浮點加法運算的表達式為：

float x，y，z；

z=x+y；

將浮點加法/減法轉(zhuǎn)化為定點加法/減法時最重要的一點就是必須保證兩個操作數(shù)的定標

temp=x+temp；

z=temp>>(Qx-Qz)，若Qx>=Qz

z=temp<<(Qz-Qx)，若Qx<=Qz

例1.4結(jié)果超過16位的定點加法

設x=l5000，y=20000，則浮點運算值為z=x+y=35000，顯然z>32767，因此

Qx=1，Qy=0，Qz=0，則定點加法為：

x=30000；y=20000；

temp=20000<<1=40000；

temp=temp+x=40000+30000=70000；

z=70000L>>1=35000；

因為z的Q值為0，所以定點值z=35000就是浮點值，這里z是一個長整型數(shù)。當加法或加法的結(jié)果超過16位表示范圍時，如果程序員事先能夠了解到這種情況，并且需要保持運算精度時，則必須保持32位結(jié)果。如果程序中是按照16位數(shù)進行運算的，則超過16位實際上就是出現(xiàn)了溢出。如果不采取適當?shù)拇胧?，則數(shù)據(jù)溢出會導致運算精度的嚴重惡化。一般的定點DSP芯片都沒有溢出保護功能，當溢出保護功能有效時，一旦出現(xiàn)溢出，則累加器ACC的結(jié)果為最大的飽和值(上溢為7FFFH，下溢為8001H)，從而達到防止溢出引起精度嚴重惡化的目的。

2.2乘法運算的C語言定點模擬

設浮點乘法運算的表達式為：

float x，y，z；

z=xy；

假設經(jīng)過統(tǒng)計后x的定標值為Qx，y的定標值為Qy，乘積z的定標值為Qz，則

z=xy

zq*2-Qx=xq*yq*2-(Qx+Qy)

zq=(xqyq)2Qz-(Qx+Qy)

所以定點表示的乘法為：

int x，y，z；

long temp；

temp=(long)x；

z=(temp*y)>>(Qx+Qy-Qz)；

例1.5定點乘法。

設x=18.4，y=36.8，則浮點運算值為=18.4*36.8=677.12；

根據(jù)上節(jié)，得Qx=10，Qy=9，Qz=5，所以

x=18841；y=18841；

temp=18841L；

z=(18841L*18841)>>(10+9-5)=354983281L>>14=21666；

因為z的定標值為5，故定點z=21666，即為浮點的z=21666/32=677.08。

2.3除法運算的C語言定點摸擬

設浮點除法運算的表達式為：

float x，y，z；

z=x/y；

假設經(jīng)過統(tǒng)計后被除數(shù)x的定標值為Qx，除數(shù)y的定標值為Qy，商z的定標值為Qz，則

z=x/y

zq*2-Qz=(xq*2-Qx)/(yq*2-Qy)

zq=(xq*2(Qz-Qx+Qy))/yq

所以定點表示的除法為：

int x，y，z；

long temp；

temp=(long)x；

z=(temp<<(Qz-Qx+Qy))/y；

例1.6定點除法。

設x=18.4，y=36.8，浮點運算值為z=x/y=18.4/36.8=0.5；

根據(jù)上節(jié)，得Qx=10，Qy=9，Qz=15；所以有

z=18841，y=18841；

temp=(long)18841；

z=(18841L<<(15-10+9)/18841=3O8690944L/18841=16384；

因為商z的定標值為15，所以定點z=16384，即為浮點z=16384/215=0.5。

2.4程序變量的Q值確定

在前面幾節(jié)介紹的例子中，由于x，y，z的值都是已知的，因此從浮點變?yōu)槎c時Q值很好確定。在實際的DSP應用中，程序中參與運算的都是變量，那么如何確定浮點程序中變量的Q值呢？從前面的分析可以知道，確定變量的Q值實際上就是確定變量的動態(tài)范圍，動態(tài)范圍確定了，則Q值也就確定了。

設變量的絕對值的最大值為|max|，注意|max|必須小于或等于32767。取一個整數(shù)n，使?jié)M足

2n-1<|max|<2n

則有

2-Q=2-15*2n=2-(15-n)

Q=15-n

例如，某變量的值在-1至+1之間，即|max|<1，因此n=0，Q=15-n=15。

既然確定了變量的|max|就可以確定其Q值，那么變量的|max|又是如何確定的呢？一般來說，確定變量的|max|有兩種方法。一種是理論分析法，另一種是統(tǒng)計分析法。

1. 理論分析法

有些變量的動態(tài)范圍通過理論分析是可以確定的。例如：

(1)三角函數(shù)。y=sin(x)或y=cos(x)，由三角函數(shù)知識可知，|y|<=1。

(2)漢明窗。y(n)=0.54一0.46cos[nπn/(N-1)]，0<=n<=N-1。因為-1<=cos[2πn/(N-1)]<=1，所以0.08<=y(n)<=1.0。

(3)FIR卷積。y(n)=∑h(k)x(n-k)，設∑|h(k)|=1.0，且x(n)是模擬信號12位量化值，即有|x(n)|<=211，則|y(n)|<=211。

(4)理論已經(jīng)證明，在自相關(guān)線性預測編碼(LPC)的程序設計中，反射系數(shù)ki滿足下列不等式：|ki|<1.0，i=1，2，...，p，p為LPC的階數(shù)。

2. 統(tǒng)計分析法

對于理論上無法確定范圍的變量，一般采用統(tǒng)計分析的方法來確定其動態(tài)范圍。所謂統(tǒng)計分析，就是用足夠多的輸入信號樣值來確定程序中變量的動態(tài)范圍，這里輸入信號一方面要有一定的數(shù)量，另一方面必須盡可能地涉及各種情況。例如，在語音信號分析中，統(tǒng)計分析時就必須來集足夠多的語音信號樣值，并且在所采集的語音樣值中，應盡可能地包含各種情況。如音量的大小，聲音的種類(男聲、女聲等)。只有這樣，統(tǒng)計出來的結(jié)果才能具有典型性。

當然，統(tǒng)計分析畢竟不可能涉及所有可能發(fā)生的情況，因此，對統(tǒng)計得出的結(jié)果在程序設計時可采取一些保護措施，如適當犧牲一些精度，Q值取比統(tǒng)計值稍大些，使用DSP芯片提供的溢出保護功能等。

2.5浮點至定點變換的C程序舉例

本節(jié)我們通過一個例子來說明C程序從浮點變換至定點的方法。這是一個對語音信號(0.3~3.4kHz)進行低通濾波的C語言程序，低通濾波的截止頻率為800Hz，濾波器采用19點的有限沖擊響應FIR濾波。語音信號的采樣頻率為8kHz，每個語音樣值按16位整型數(shù)存放在insp.dat文件中。

例1.7語音信號800Hz 19點FIR低通濾波C語言浮點程序。

＃i nclude

const int length=180/*語音幀長為180點=22.5ms＠8kHz采樣*/

void filter(int xin[]，int xout[]，int n，float h[])；/*濾波子程序說明*/

/*19點濾波器系數(shù)*/

static float h[19]=

{0.01218354，-0.009012882，-0.02881839，-0.04743239，-0.04584568，

-0.008692503，0.06446265，0.1544655，0.2289794，0.257883，

0.2289794，0.1544655，0.06446265，-0.008692503，-0.04584568，

-0.04743239，-0.02881839，-0.009012882，O.01218354}；

static int xl[length+20]；

/*低通濾波浮點子程序*/

void filter(int xin[]，int xout[]，int n，float h[])

{

int i，j；

float sum；

for(i=0；i

for(i=0；i＜length；i++)

{

sum=0.0；

for(j=0；j＜n；j++)sum+=h[j]*x1[i-j+n-1]；

xout=(int)sum；

for(i=0；i＜(n-l)；i++)x1[n-i-2]=xin[length-1-i]；

}

/*主程序*/

void main()

FILE *fp1，*fp2；

int ，indata[length]，outdata[length]；

fp1=fopen(insp.dat，"rb")；/* 輸入語音文件*/

fp2=fopen(Outsp.dat，"wb")；/* 濾波后語音文件*/

=0；

while(feof(fp1) ==0)

{

++；

printf(“=％d＼n”，)；

for(i=0；i＜length；i++)indata=getw(fp1)； /*取一幀語音數(shù)據(jù)*/

filter(indata，outdata，19，h)；/*調(diào)用低通濾波子程序*/

for(i=0；i＜length；i++)putw(outdata，fp2)；/*將濾波后的樣值寫入文件*/

}

fcloseall()；/*關(guān)閉文件*/

return(0)；

}

例1.8語音信號800Hz l9點FIR低通濾波C語言定點程序。

＃i nclude

const int length=180；

void filter (int xin[]，int xout[]，int n，int h[])；

static int h[19]={399，-296，-945，-1555，-1503，-285，2112，5061，7503，8450，

7503，5061，2112，-285，-1503，-1555，-945，-296，399}；/*Q15*/

static int x1[length+20]；

/*低通濾波定點子程序*/

void filter(int xin[]，int xout[]，int n，int h[])

int i，j；

long sum；

for(i=0；i＜length；i++)x1[n＋i-111=xin]；

for(i=0；i＜1ength；i++)

sum=0；

for(j=0；j＜n；j++)sum+=(long)h[j]*x1[i-j＋n-1]；

xout=sum>>15；

for(i=0；i＜(n-1)；i＋＋)x1[n-i-2]=xin[length-i-1]；

}

主程序與浮點的完全一樣?！?/p>

3 DSP定點算術(shù)運算

定點DSP芯片的數(shù)值表示基于2的補碼表示形式。每個16位數(shù)用l個符號位、i個整數(shù)位和15-i個小數(shù)位來表示。因此：

00000010.10100000

表示的值為：

21＋2-1＋2-3=2.625

這個數(shù)可用Q8格式(8個小數(shù)位)來表示，其表示的數(shù)值范圍為-128至＋l27.996，一個Q8定點數(shù)的小數(shù)精度為1/256=0.004。

雖然特殊情況(如動態(tài)范圍和精度要求)必須使用混合表示法。但是，更通常的是全部以Q15格式表示的小數(shù)或以Q0格式表示的整數(shù)來工作。這一點對于主要是乘法和累加的信號處理算法特別現(xiàn)實，小數(shù)乘以小數(shù)得小數(shù)，整數(shù)乘以整數(shù)得整數(shù)。當然，乘積累加時可能會出現(xiàn)溢出現(xiàn)象，在這種情況下，程序員應當了解數(shù)學里面的物理過程以注意可能的溢出情況。下面我們來討論乘法、加法和除法的DSP定點運算，匯編程序以TMS320C25為例。

3.1定點乘法

兩個定點數(shù)相乘時可以分為下列三種情況：

1. 小數(shù)乘小數(shù)

例1.9 Q15*Q15=Q30

0.5*0.5=0.25

0.100000000000000；Q15

* 0.100000000000000；Q15

--------------------------------------------

00.010000000000000000000000000000=0.25；Q30

兩個Q15的小數(shù)相乘后得到一個Q30的小數(shù)，即有兩個符號位。一般情況下相乘后得到的滿精度數(shù)不必全部保留，而只需保留16位單精度數(shù)。由于相乘后得到的高16位不滿15位的小數(shù)據(jù)度，為了達到15位精度，可將乘積左移一位，下面是上述乘法的TMS320C25程序：

LT OP1；OP1=4000H(0.5/Q15)

MPY OP2；oP2=4000H(0.5/Ql5)

PAC

SACH ANS，1；ANS=2000H(0.25/Q15)

2. 整數(shù)乘整數(shù)

例1.10 Q0*Q0=Q0

17*(-5)=-85

0000000000010001=l7

*1111111111111011=-5

-------------------------------------------

11111111111111111111111110101011=-85

3. 混合表示法

許多情況下，運算過程中為了既滿足數(shù)值的動態(tài)范圍又保證一定的精度，就必須采用Q0與Q15之間的表示法。比如，數(shù)值1.2345，顯然Q15無法表示，而若用Q0表示，則最接近的數(shù)是1，精度無法保證。因此，數(shù)1.2345最佳的表示法是Q14。

例1.11 1.5*0.75= 1.125

01.10000000000000=1.5；Q14

*00.11000000000000=0.75；Q14

---------------------------------------

0001.0010000000000000000000000000=1.125 Q28

Q14的最大值不大于2，因此，兩個Q14數(shù)相乘得到的乘積不大于4。

一般地，若一個數(shù)的整數(shù)位為i位，小數(shù)位為j位，另一個數(shù)的整數(shù)位為m位，小數(shù)位為n位，則這兩個數(shù)的乘積為(i+m)位整數(shù)位和(j+n)位小數(shù)位。這個乘積的最高16位可能的精度為(i＋m)整數(shù)位和(15- i- m)小數(shù)位。

但是，若事先了解數(shù)的動態(tài)范圍，就可以增加數(shù)的精度。例如，程序員了解到上述乘積不會大于1.8，就可以用Q14數(shù)表示乘積，而不是理論上的最佳情況Q13。例3.11的TMS320C25程序如下：

LT OP1；OP1 = 6000H(1.5/Ql4)

MPY OP2；OP2 = 3000H(0.75/Q14)

PAC

SACH ANS，1；ANS=2400H(1.125/Q13)

上述方法，為了精度均對乘的結(jié)果舍位，結(jié)果所產(chǎn)生的誤差相當于減去一個LSB(最低位)。采用下面簡單的舍人方法，可使誤差減少二分之一。

LT OP1

MPY OP2

PAC

ADD ONE，14(上舍入)

SACH ANS，1

上述程序說明，不管ANS為正或負，所產(chǎn)生的誤差是l/2 LSB，其中存儲單元ONE的值為1。

3.2定點加法

乘的過程中，程序員可不考慮溢出而只需調(diào)整運算中的小數(shù)點。而加法則是一個更加復雜的過程。首先，加法運算必須用相同的Q點表示，其次，程序員或者允許其結(jié)果有足夠的高位以適應位的增長，或者必須準備解決溢出問題。如果操作數(shù)僅為16位長，其結(jié)果可用雙精度數(shù)表示。下面舉例說明16位數(shù)相加的兩種途徑。

1.保留32位結(jié)果

LAC OP1；(Q15)

ADD OP2；(Ql5)

SACH ANSHI ；(高16位結(jié)果)

SACL ANSLO ：(低16位結(jié)果)

2.調(diào)整小數(shù)點保留16位結(jié)果

LAC OP1，15；(Q14數(shù)用ACCH表示)

ADD OP2，15；(Q14數(shù)用ACCH表示)

SACH ANS；(Q14)

加法運算最可能出現(xiàn)的問題是運算結(jié)果溢出。TMS320提供了檢查溢出的專用指令BV，此外，使用溢出保護功能可使累加結(jié)果溢出時累加器飽和為最大的整數(shù)或負數(shù)。當然，即使如此，運算精度還是大大降低。因此，最好的方法是完全理解基本的物理過程并注意選擇數(shù)的表達方式。

3.3定點除法

在通用DSP芯片中，一般不提供單周期的除法指令，為此必須采用除法子程序來實現(xiàn)。二進制除法是乘法的逆運算。乘法包括一系列的移位和加法，而除法可分解為一系列的減法和移位。下面我們來說明除法的實現(xiàn)過程。

設累加器為8位，且除法運算為10除以3。除的過程包括與被除法有關(guān)的除數(shù)逐步移位，在每一步進行減法運算，如果能減則將位插入商中。

(1)除數(shù)的最低有效位對齊被除數(shù)的最高有效位。

0000l0l0

- 00011000

--------------------------------------

11110010

(2)由于減法結(jié)果為負，放棄減法結(jié)果，將被除數(shù)左移一位，再減。

00010100

- 00011000

----------------------------------------

11111000

(3)結(jié)果仍為負，放棄減法結(jié)果，被除數(shù)左移一位，再減。

00101000

-?? 00011000

------------------------------------------

00010000

(4)結(jié)果為正，將減法結(jié)果左移一位后加1，作最后一次減。

00100001

-?? 00011000

----------------------------------------

00001001

(5)結(jié)果為正，將結(jié)果左移一位加1 得最后結(jié)果。高4位代表余數(shù)，低4位表示商。

00010011

即，商為0011= 3.余數(shù)為0001= 1。

TMS320沒有專門的除法指令，但使用條件減指令SUBC可以完成有效靈活的除法功能。使用這一指令的唯一限制是兩個操作數(shù)必須為正。程序員必須事先了解其可能的運算數(shù)的特性，如其商是否可以用小數(shù)表示及商的精度是否可被計算出來。這里每一種考慮可影響如何使用SUBC指令的問題。下面我們給出兩種不同情況下的TMS320C25除法程序。

(1)分子小于分母

DIV_A：

LT NUMERA

MPY DENOM

PAC

SACH TEMSGN；取商的符號

LAC DENOM

ABS

SACL DENOM；使分母為正

ZALH NUMERA；分子為正

ABS

RPTK 14

SUBC DENOM；除循環(huán)15次

SACL QUOT

LAC TEMSGN

BGEZ A1；若符號為正，則完成

ZAC

SUB QUOT

SACL QUOT；若為負，則商為負

A1： RET

這個程序中，分子在NUMERA中，分母在DENOM中，商存在QUOT中，TEMSGN為暫存單元。

(2)規(guī)定商的精度

DIV_B:

LT NUMERA

MPY DENOM

PAC

SACH TEMSGN；取商的符號

LAC DENOM

ABS

SACL DENOM; 使分母為正

LACK 15

ADD FRAC

SACL FRAC；計算循環(huán)計數(shù)器

LAC NUMERA

ABS ; 使分子為正

RPT FRAC

SUBC DENOM; 除循環(huán)16＋FRAC次

SACL QUOT

LAC TEMSGN

BGEZ B1;若符號為正，則完成

ZAC

SUB QUOT

SACL QUOT；若為負，則商為負

B1： RET

與DIV_A相同，這個程序中，分子在NUMERA中，分母在DENOM中，商存在QUOT中，TEMSGN為暫存單元。FRAC中規(guī)定商的精度，如商的精度為Q13，則調(diào)用程序前FRAC單元中的值應為13。

4 非線性運算的定點快速實現(xiàn)

在數(shù)值運算中，除基本的加減乘除運算外，還有其它許多非線性運算，如，對數(shù)運算，開方運算，指數(shù)運算，三角函數(shù)運算等，實現(xiàn)這些非線性運算的方法一般有：(1)調(diào)用DSP編譯系統(tǒng)的庫函數(shù)；(2)查表法；(3)混合法。下面我們分別介紹這三種方法。

1.調(diào)用DSP編譯系統(tǒng)的庫函數(shù)

TMS320C2X/C5X的C編譯器提供了比較豐富的運行支持庫函數(shù)。在這些庫函數(shù)中，包含了諸如對數(shù)、開方、三角函數(shù)、指數(shù)等常用的非線性函數(shù)。在C程序中(也可在匯編程序中)只要采用與庫函數(shù)相同的變量定義，就可以直接調(diào)用。例如，在庫函數(shù)中，定義了以10為底的常用對數(shù)log10()：

＃i nclude＜math.h＞

double，log10(double x)；

在C程序中按如下方式調(diào)用：

float x，y;

X=10.0;

y=log10(x)；

從上例可以看出，庫函數(shù)中的常用對數(shù)log10()要求的輸入值為浮點數(shù)，返回值也為浮點數(shù)，運算的精度完全可以保證。直接調(diào)用庫函數(shù)非常方便，但由于運算量大，很難在實時DSP中得到應用。

2.查表法

在實時DSP應用中實現(xiàn)非線性運算，一般都采取適當降低運算精度來提高程序的運算速度。查表法是快速實現(xiàn)非線性運算最常用的方法。采用這種方法必須根據(jù)自變量的范圍和精度要求制作一張表格。顯然輸人的范圍越大，精度要求越高，則所需的表格就越大，即存儲量也越大。查表法求值所需的計算就是根據(jù)輸入值確定表的地址，根據(jù)地址就可得到相應的值，因而運算量較小。查表法比較適合于非線性函數(shù)是周期函數(shù)或已知非線性函數(shù)輸入值范圍這兩種情況、例1.12和例1. 13分別說明這兩種情況。

例1.12 已知正弦函數(shù)y=cos(x)，制作一個512點表格，并說明查表方法。由于正弦函數(shù)是周期函數(shù)，函數(shù)值在-1至+1之間，用查表法比較合適。由于Q15的表示范圍為1-至32767/32768之間，原則上講-1至＋1的范圍必須用Q14表示。但一般從方便和總體精度考慮，類似情況仍用Q15表示，此時+1用32767來表示。

(1)產(chǎn)生5l2點值的C語言程序如下所示。

#define N 512

#define pi 3.14l59

int sin_tab[5l2]；

void main()

{

int i;

for(i=0；i＜N；i++)sin_tab=(int)(32767*sin(2*pi*i/N))；

(2)查表

查表實際上就是根據(jù)輸人值確定表的地址。設輸入x在0~2π之間，則x對應于512點表的地址為：index=(int)(512*x/2π)，則y=sin(x)=sin_tab[index]如果x用Q12定點數(shù)表示，將512/2π用Q8表示為20861，則計算正弦表的地址的公式為。

index=(x*20861L)>>20；

例1.12用查表法求以2為底的對數(shù)，已知自變量值范圍為0.5-1，要求將自變量范圍均勻劃分為10等分。試制作這個表格并說明查表方法。

(1)作表：

y=log2(x)，由于x在0.5到1之間，因此y在-1到0之間，x和y均可用Q15表示。由于對x均勻劃分為10段，因此，10段對應于輸入x的范圍如表3.2所示。若每一段的對數(shù)值都取第一點的對數(shù)值，則表中第一段的對數(shù)值為y0(Q15)=(int)(log(O.5)*32768)，第二段的對數(shù)值為y1(Q15)=(int)(log2(0.55)*32768)，依次類推，如表3.2所示。

(2)查表：

查表時，先根據(jù)輸人值計算表的地址，計算方法為：

index=((x-16384)*20)>>15；

式中， index就是查表用的地址。例如，已知輸人x=26869，則index=6，因此，y= -10549。

表1.2 logtab0 10點對數(shù)表

地址??? 輸入值??? 對數(shù)值(Q15)

0??? 0.50-0.55??? -32768

1??? 0.55-0.60??? -28262

2??? 0.60-0.65??? -24149

3??? 0.65-0.70??? -20365

4??? 0.70-0.75??? -16862

5??? 0.75-0.80??? -13600

6??? 0.80-0.85??? -10549

7??? 0.85-0.90??? -7683

8??? 0.90-0.95??? -4981

9??? 0.95-1.00??? -2425

3.混合法

(1)提高查表法的精度

上述方法查表所得結(jié)果的精度隨表的大小而變化，表越大，則精度越高，但存儲量也越大。當系統(tǒng)的存儲量有限而精度要求也較高時，查表法就不太適合。那么能否在適當增加運算量的情況下提高非線性運算的精度呢？下面介紹一種查表結(jié)合少量運算來計算非線性函數(shù)的混合法，這種方法適用于在輸入變量的范圍內(nèi)函數(shù)呈單調(diào)變化的情形?；旌戏ㄊ窃诓楸淼幕A上來用計算的方法以提高當輸入值處于表格兩點之間時的精度。提高精度的一個簡便方法是采用折線近似法，如圖1.1所示。

圖1.1提高精度的折線近似法”

仍以求以2為底的對數(shù)為例(例1.12)。設輸入值為x，則精確的對數(shù)值為y，在表格值的兩點之間作一直線，用y'作為y的近似值，則有：

y'=y0＋△y

其中y0由查表求得。現(xiàn)在只需在查表求得y0的基礎上增加△y既可?！鱵的計算方法如下：?????????????????? △y=(△x/△x0)△y=△x(△y0/△x0)

其中△y0/△x0對每一段來說是一個恒定值，可作一個表格直接查得。此外計算此時需用到每段橫坐標的起始值，這個值也可作一個表格。這佯共有三個大小均為10的表格，分別為存儲每段起點對數(shù)值的表logtab0、存儲每段△y0/△x0值的表logtab1和存儲每段輸入起始值x0的表logtab2，表logtab1和表logtab2可用下列兩個數(shù)組表示。

int logtab1[10]={22529，20567，18920，17517，16308，

15255，14330，13511，12780，12124}；/*△y0/△x0：Q13*/

int logtab2[10]={16384，18022，19660，21299，22938，

24576，26214，27853，29491，31130}；/*x0：Q15*/

綜上所述，采用混合法計算對數(shù)值的方法可歸納為：

(1)根據(jù)輸人值，計算查表地址：index=((x-16384)*20)>>15；

(2)查表得y0=logtab0[index]；

(3)計算△x=x-logtab2[index]；

(4)計算△y=(△x*logtab1[index])>>13；

(5)計算得結(jié)果y=y0＋△y。

例1.13已知x=0.54，求log2(x)。

0.54的精確對數(shù)值為y=log2(0.54)=-0.889。

混合法求對數(shù)值的過程為：

(1)定標Q15，定標值x=0.54*32768=17694；

(2)表地址index=((x-16384)*20)>>15=0；

(3)查表得y0=logtab0[0]=-32768；

(4)計算△x=x-logtab2[0]=17694-16384=1310；

(5)計算△y=(△xlogtab1[0]>>13=(13l0*22529L)>>13=3602

(6)計算結(jié)果y=y0＋△y=-32768＋3602=-29166。

結(jié)果y為Q15定標，析算成浮點數(shù)為-29166/32768=-0.89，可見精度較高。

(2)擴大自變量范圍

如上所述，查表法比較適用于周期函數(shù)或自變量的動態(tài)范圍不是太大的情形。對于像對數(shù)這樣的非線性函數(shù)，輸入值和函數(shù)值的變化范圍都很大。如果輸入值的變化范圍很大，則作表就比較困難。那么能否比較好地解決這個問題，即不便表格太大，又能得到比較高的精度呢？下面我們來討論一種切實可行的方法。

設x是一個大于0.5的數(shù)，則x可以表示為下列形式：

x=m*2e

式中，0.5<=m<=1.0，e為整數(shù)。則求x的對數(shù)可以表示為：

log2(x)=log2(m*2e)=log2(m)＋log2(2e)=e＋log2(m)

也就是說，求x的對數(shù)實際上只要求m的對數(shù)就可以了，而由于m的數(shù)值在0.5和1.0之間，用上面介紹的方法是完全可以實現(xiàn)的。例如：

log2(10000)=log2(0.61035*214)=log2(0.61035)+14 =13.2877

可見，如果一個數(shù)可以用比較簡便的方法表示為上面的形式，則求任意大小數(shù)的對數(shù)也比較方便的。TMS320C2X/C5X指令集提供了一條用于對ACC中的數(shù)進行規(guī)格化的指令NORM，該指令的作用就是使累加器中的數(shù)左移，直至數(shù)的最高位被移至累加器的第30位。例如，對數(shù)值10000進行規(guī)格化的TMS320C25程序為。

LAC #10000

SACL TEMP

ZALH TEMP

LAR AR1，#0FH

RPT 14

NORM * -

上述程序執(zhí)行后，AR1=#0eH，ACCH=2000(10進制)。對一個16位整數(shù)x進行上述程序處理實際上就是作這樣一個等效變換：

x=[(x*2e)/32768]*215-Q

其中，寄存器AR1包含的值為15-Q累加器ACC高16位包含的值為x.2Q，其數(shù)值在16384至32768之間。

例1.14實現(xiàn)以2為底的對數(shù)的C定點模擬程序。

int logtab0[10]={-32768，-28262，-24149，-20365，-16862，

-13600)，-1O549，-7683，-4981，-2425};/*Q15*/

int logtab1[10]={122529，20567，18920，175l7，16308，

15255，14330，13511，12780，12124};/*Q13*/

int logtab2[10]={16384，l8022，19660，21299，22938，

24576，26214，27853，29491，31130};/*Q15*/

int log2_fast(int Am)

{

int point，point1；

int index，x0，dx，dy，y;

point=0；

while(Am＜16384){point＋＋；Am=Am＜＜1；}/*對Am進行規(guī)格化*/

point1=(15-point-4)*512；/*輸入為Q4，輸出為Q9*/

index=((Am-16384)*20L)＞＞15；/*求查表地址*/

dx=Am-logtab2[index]；

dy=((long)dx*logtab1[index])＞＞13；

y=(dy＋longtab0[index])＞＞6；/*Q9*/

y=point1＋y;

return(y)；

}

上述程序中，輸入值Am采用Q4表示，輸出采用Q9表示，如果輸入輸出的Q值與上面程序中的不同，則應作相應的修改。

以上討論了DSP芯片進行定點運算所涉及的一些基本問題，這些問題包括：數(shù)的定標，DSP程序的定點模擬，DSP芯片的足點運算以及定點實現(xiàn)非線性函數(shù)的快速實現(xiàn)方法等。充分理解這些問題對于用定點芯片實現(xiàn)DSP算法具有非常重要的作用。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

浮點定點數(shù)據(jù)格式

浮點定點數(shù)據(jù)格式

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

浮點定點數(shù)據(jù)格式

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av