基于IEEE 754的浮點數存儲格式分析研究
0引言
本文引用地址:http://www.104case.com/article/202294.htmIEEE(Institute of Electrical and Electronics Engineers,電子電氣工程師協會)在I985年制定的IEEE 754(IEEE Standard for Binary Floating-Point Arithmetic, ANSI/IEEE Std 754-1985 )二進制浮點運算規范,是浮點運算部件事實上的工業標準。許多計算機用戶有機會在Intel x86和SPARC 或Power PC機之間交換二進制數據,所以對照Intel x86和SPARC結構計算機的數據表示及相關程序設計語言,討論IEEE 754浮點數存儲格式的細節是有意義的。
本文對浮點數、IEEE 754浮點數的表示方法、規格化處理等進行了分析,重點分析、比較了Intel x86和SPARC結構計算機IEEE 754浮點數的存儲格式。
1 浮點數
在計算機系統的發展過程中,曾經提出過多種方法表示實數,但是到目前為止使用最廣泛的是浮點表示法。相對于定點數而言,浮點數利用指數使小數點的位置可以根據需要而上下浮動,從而可以靈活地表達更大范圍的實數。
浮點數表示法利用科學計數法來表達實數。通常,將浮點數表示為 ± d.dd…d ×βe,其中d.dd… d 稱為有效數字(significand),它具有 p 個數字(稱p位有效數字精度),β為基數(Base),e為指數(Exponent),±表示實數的正負[1,2]。更精確地,± d0.d1d2…dp-1 × βe, 表示以下數
±(d0+d1β-1+… +dp-1β-(p-1))βe,(0≤di<β)。
對實數的浮點表示僅作如上的規定是不夠的,因為同一實數的浮點表示還不是唯一的。例如,1.0×102 ,0.1 ×103 ,和0.01 ×104 都可以表示100.0。為了達到表示單一性的目的,有必要對其作進一步的規范。規定有效數字的最高位(即前導有效位)必須非零,即0<d0<β。符合該標準的數稱為規格化數(Normalized Numbers),否則稱為非規格化數(Denormalized Numbers)。
2 IEEE 754浮點數與其浮點格式 2.1 實數的IEEE 754表示形式
一個實數V在IEEE 754標準中可以用V=(-1)s×M×2E 的形式表示[3,4],說明如下:
(1)符號s(sign)決定實數是正數(s=0)還是負數(s=1),對數值0的符號位特殊處理。
(2)有效數字M(significand)是二進制小數,M的取值范圍在1≤M<2或0≤M<1。
(3)指數E(exponent)是2的冪,它的作用是對浮點數加權。
2.2 浮點格式
浮點格式是一種數據結構,它規定了構成浮點數的各個字段,這些字段的布局,及其算術解釋[2]。IEEE 754浮點數的數據位被劃分為3個字段,對以上參數值進行編碼:
(1)一個單獨的符號位s直接編碼符號s。
(2)k位的偏置指數e(e=ek-1…e1e0)編碼指數E,移碼表示。
(3)n位的小數f(fraction)(f=fn-1…f1f0)編碼有效數字M,原碼表示。
2.3 浮點數的分類
根據偏置指數e的值,被編碼的浮點數可分成三種類型。
(1)規格化數
當有效數字M在范圍1≤M<2中且指數e的位模式ek-1…e1e0既不全是0也不全是1時,浮點格式所表示的數都屬于規格化數。這種情況中小數f(0≤f<1 ) 的二進制表示為0. fn-1…f1f0。有效數字M=1+f,即M=1. fn-1…f1f0 (其中小數點左側的數值位稱為前導有效位) 。我們總是能調整指數E,使得有效數字M在范圍1≤M<2中,這樣有效數字的前導有效位總是1,因此該位不需顯示表示出來,只需通過指數隱式給出。
需要特別指出的是指數E要加上一個偏置值Bias,轉換成無符號的偏置指數e,也就是說指數E要以移碼的形式在存放計算機中。且e、E和Bias三者的對應關系為e=E+Bias,其中Bias=2k-1-1。
(2)非規格化數
當指數e的位模式ek-1…e1e0全為零(即e=0)時,浮點格式所表示的數是非規格化數。這種情況下,E=1-Bais,有效數字M=f=0. fn-1…f1f0 ,有效數字的前導有效位為0。
非規格化數的引入有兩個目的。其一是它提供了一種表示數值0的方法,其二是它可用來表示那些非常接近于0.0的數。
(3)特殊數
當指數e的位模式ek-1…e1e0全為1時,小數f的位模式fn-1…f1f0全為0(即f=0)時,該浮點格式所表示的值表示無窮,s=0 時是+∞,s=1時是-∞。
當指數e的位模式ek-1…e1e0全為1時,小數f的位模式fn-1…f1f0不為0(fn-1、…、f1、f0、至少有一個非零即f≠0)時,該浮點格式所表示的值被稱為NaN(Not a Number)。比如當計算 或∞-∞時用作返回值,或者用于表示未初始化的數據。
3 IEEE 754浮點存儲格式
與浮點格式對應,浮點存儲格式規定了浮點格式在存儲器中如何存放。IEEE標準定義了這些浮點存儲格式,但具體選擇哪種存儲格式由實現工具(程序設計語言)決定。
匯編語言軟件有時取決于所使用的存儲格式,但更高級的語言通常僅處理浮點數據類型的語言概念。這些浮點數據類型在不同高級語言中有不同的名字,相應的IEEE格式如表1。
表1 IEEE 格式和語言類型
IEEE 754標準準確地定義了單精度和雙精度浮點格式,并為這兩種基本格式的分別定義了擴展格式,表1里擴展雙精度格式是IEEE標準定義的擴展雙精度類中的一種。
下面詳細討論在Intel x86和SPARC平臺上使用的三種IEEE浮點存儲格式。
3.1 單精度格式
IEEE單精度浮點格式共32位,包含三個構成字段:23位小數f,8位偏置指數e,1位符號s。將這些字段連續存放在一個32位字里,并對其進行編碼。其中0:22位包含23位的小數f; 23:30位包含8位指數e;第31位包含符號s。如圖1所示。
圖1 單精度存儲格式
評論