新聞中心

        EEPW首頁 > 嵌入式系統 > 設計應用 > 一種CORDIC協處理器核的設計與實現

        一種CORDIC協處理器核的設計與實現

        作者: 時間:2016-09-12 來源:網絡 收藏

        隨著航天技術的發展,航天任務對于導航計算機的性能要求越來越高。導航計算機除了要對傳感器數據進行采集,與控制系統進行實時通訊,還要能進行實時的計算。盡管目前航天任務中使用的處理器芯片性能越來越強,但大多數CPU并沒有處理常用超越函數(sin,cos,arctan,exp,sqrt,ln等)的專用指令。而通過純軟件循環迭代求解超越函數往往需要CPU數十甚至上百個周期,這極大降低了導航計算機的實時性。本文提出了一種高實時性、低復雜度的核,提供了高吞吐率的超越函數運算能力,從而提高了導航計算機的并行運算能力。此使用verilog編寫,由于其資源占用率低,可以非常容易地被集成入各種航天用中。

        本文引用地址:http://www.104case.com/article/201609/303786.htm

        1 算法

        1.1 旋轉

        CORDIC算法最早由Volder提出,用于求解一般三角函數,之后由Walther改進,使得CORDIC可以用于計算雙曲函數和進行乘除運算。由于幾乎所有的通用CPU都具有硬件乘法除法功能,因此對數坐標模式所提供的乘除功能很少被實際使用,故CORDIC算法的主要應用是三角函數和雙曲函數的運算。CORDIC的基本思想是通過一系列預定大小角度的旋轉,使得輸入向量被旋轉到所期望的位置,從而求解出一系列函數。CORDIC的旋轉方程可以表示為

        一種CORDIC協處理器核的設計與實現

        其中m為1時CORIDC工作在圓坐標系下,m為-1時工作在雙曲坐標系下。dn為1時向量按順時針方向旋轉,當dn為-1時按逆時針方向旋轉。

        雖然每一步迭代只需要進行加減操作和固定位的移位操作,但由(1)可知,CORIDC每一次旋轉都會改變向量的模。所以為了得到正確的向量分量x和y,需要補償旋轉后的向量,而由于向量模的變化與旋轉的方向無關,這可以通過一個常數乘法器實現。補償常數為:

        一種CORDIC協處理器核的設計與實現

        CORDIC每次旋轉的方向由工作模式決定。在旋轉模式下,CORDIC試圖讓向量與x軸之間的夾角z趨近于0。在向量模式下,CORDIC試圖讓向量的y分量趨近于0。故每次旋轉的方向由運行模式和向量的yz分量符號決定:

        一種CORDIC協處理器核的設計與實現

        綜上,各個模式下CORDIC的迭代結果以及可實現的函數如表1所示。

        一種CORDIC協處理器核的設計與實現

        1.2 收斂性

        Cordic能輸出正確結果的前提是旋轉結束時向量能夠被旋轉到預期的位置(在誤差范圍內),即旋轉收斂。可以通過遞歸證明的是,對于圓坐標模式,對于任意n總有

        一種CORDIC協處理器核的設計與實現

        2 系統實現

        為了保證能夠提供足夠的計算吞吐量并使的計算延遲可預測,本文使用流水線實現整個CORDIC核。協處理器的流水線結構如圖1所示。

        一種CORDIC協處理器核的設計與實現

        2.1 系統輸入

        協處理器核從輸入FIF0獲得初始輸入數據,包括3個坐標分量以及1個控制命令字。輸入參數的格式為1位符號位,2位整數位,小數位的位數作為的參數可以在例化時調整。這樣的輸入格式使得此可以容易地被應用于使用定點運算的許多DSP處理器。對于浮點數運算,實際上CPU可以通過簡單的移位縮放操作使得輸入范圍外的xyz分量落到協處理器可接受的范圍內,這是由于規格化浮點數的尾數本來就在區間[1,2)內。相對的,已有的很多CORDIC協處理器實現使用了浮點數進行中間運算,然而這不僅顯著地增加了資源的使用,而且使得每一個CORDIC旋轉需要通過多級流水線完成,增大了每個運算的延遲。

        此外,為了降低CPU和協處理器之間交互次數,本IP核允許CPU在計算某些函數時不對所有的輸入寄存器進行寫入。對于輸入參數少于3個的函數,協處理器自動生成其他分量的輸入。比如對于cos(x),CPU只需要對協處理器的a0寄存器和控制字寄存器寫入即可觸發cos(x)的運算,CORDIC協處理器會自動把x分量初始化成2.0,y分量初始化成0,z分量初始化成a0。對于有效位數較小的配置如18位,可以進一步將控制命令字和a0放到同一個32位寄存器中,則對于單輸入函數,CPU只需向一個地址寫入數據即可完成操作。18位數據精度時的輸入寄存器格式如圖2所示。

        一種CORDIC協處理器核的設計與實現

        2.2 預處理單元

        如表1所示,CORDIC的運算結果并不直接對應所要求的函數,故需要對與輸入參數進行處理。例如對于ln(a)和sqrt(a)運算,需要令x=a+1,y=a-1,對于cos(x),sin(x)等運算,需要生成相應的其他分量輸入。此外,由于雙曲坐標的性質,arctanh1并不存在,故雙曲坐標模式只能從i=1開始迭代,而圓坐標系可以從i=0開始迭代,這導致了兩種模式的旋轉過程不同。為了能用同一個流水線實現2種模式的操作,本文令所有模式都從i=1開始迭代。但這樣會導致在圓坐標模式下的收斂域過小,只有。解決的辦法是在預處理單元加入象限折疊,即通過三角函數關系,將[-π,π]上的向量折疊到[0,π/4]上,再在后處理單元對結果進行修正。

        2.3 旋轉單元

        旋轉單元是CORDIC協處理器的核心,實現(1)所描述的向量旋轉操作。其結構如圖3所示。

        一種CORDIC協處理器核的設計與實現
        上一頁 1 2 下一頁

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 望都县| 迁安市| 曲麻莱县| 淮北市| 化德县| 株洲县| 延边| 大田县| 沐川县| 尚义县| 河津市| 嘉兴市| 浦江县| 鄢陵县| 新兴县| 蓬莱市| 南昌市| 邳州市| 延边| 镇雄县| 罗山县| 南京市| 赞皇县| 红河县| 濮阳市| 白山市| 定西市| 泰和县| 澄城县| 莱州市| 军事| 应城市| 延安市| 闽侯县| 布拖县| 奎屯市| 和硕县| 庄河市| 泗洪县| 白城市| 福鼎市|