鋰離子電池管理芯片的研究及其低功耗設計 ― 數?;旌想娐返牡凸脑O計方法(一)
這種有選擇地關斷空閑的子系統,降低功耗的效果十分顯著,如在PC系統級功耗管理中,最常見的是將無執行任務的硬盤和顯示器關斷以節省功耗。
這種方案的局限性在于,在功耗狀態切換過程中,通常有延遲,喚醒處于睡眠狀態的子系統也需要更多的能量。因此,DPM技術需要解決以下問題:一是何時將子系統關斷,關斷多久;二是是否值得關斷,即恢復狀態是否需要更多的能量。這些都是判決策略需要研究的內容,目前最常用的方法可分為三種:基于超時(Timeout)的方法、基于預估算(Predictive)的方法、基于隨機理論(Stochastic)的方法。
和上述改變子系統的功耗狀態不同,動態電壓等比例變化(Dynamic Voltage Scaling, DVS)技術是根據系統的工作狀態,基于區間(Interval-based)或基于線程(Thread-based)來預測系統負載[33,34],動態地改變系統的工作電壓。動態電壓和頻率等比例變化(Dynamic Voltage and Frequency Scaling)技術則是同時改變工作電壓和頻率,獲得最低的系統功耗。
和靜態低功耗設計相比,DPM技術由于要預測系統和負載、系統和電源的關系,動態地調整工作狀態、電壓和頻率,對系統工作狀態的建模、預測算法都更復雜,有更多的工作急待開展,但是可以肯定的是,DPM技術降低功耗的效果也更顯著。
2寄存器傳輸級
作為綜合(排序和分配)的高層次結構,RTL層次將包含一個控制部分(也稱控制器)和一個操作部分(也稱數據通路),如圖2.1. 3所示。

數據通路以寄存器為特征,而控制器是由組合邏輯來實現,因此,RTL級低功耗設計的對象將是時序和組合邏輯,這可以采用硬件描述語言VHDL和VERILOG來實現。另外,RTL的抽象層次決定了它不可能涉及電源電壓和電容,因此降低功耗的途徑主要是降低開關活動因子,即減小寄存器和組合邏輯的跳變頻率。
1)操作數
在RTL層次,操作數分離(Operand Isolation )是針對組合邏輯最常用的低功耗技術,其本質是在組合邏輯模塊間加入一個鎖存器,當鎖存器的使能無效時,寄存器保存值不加以更新,組合路徑被隔斷[36,37]。只有在進行有效運算時,組合邏輯才有耗能的跳變產生,這樣便降低了此模塊的功耗。
操作數變形(Operand Transformation)有時也稱為數據通路的重排序,即是指在不影響邏輯功能的條件下,以翻轉頻率最低為策略,對電路單元重新排序來降低功耗的技術。
2)門控時鐘技術
目前,門控時鐘(Clock-gated)技術被認為是最有效的降低功耗的方法之一,所控制的對象不僅可以是寄存器、鎖存器、時鐘產生電路等,甚至還可以利用門控時鐘分布來控制子系統。
以寄存器為例,門控時鐘的基本思想是,通過一個門控或使能信號來控制時鐘,即在所謂的門控時鐘單元的輸出端產生一個“門控時鐘”信號,代替寄存器原有的時鐘輸入信號。當寄存器暫時不工作時,門控時鐘使寄存器處于不觸發的狀態,從而阻斷了輸入數據的更新,減少了無效的開關活動。在如圖2.1.4所示的門控時鐘單元中,常用鎖存器來防止使能信號傳播到輸出端時產生的毛刺。

應該指出,時鐘頻率升高時,時鐘偏差(Clock Skew)的影響將不容忽視,由此將增加時鐘樹設計的復雜程度;考慮到門控時鐘邏輯的控制電路所產生的額外功耗,門控時鐘技術適合應用在較高抽象層次;另外,在漏泄電流功耗為主時,門控時鐘的作用不大。
3邏輯/門級
這兩個層次的重要特點是可以在較寬的范圍內應用先進的低功耗技術。在邏輯優化過程中,一些技術參數如電源電壓是固定的,當要實現一個給定的邏輯時,設計的自由度可以在選擇功能和確定門單元的尺寸上。有較多的文獻研究了兩個層次的低功耗技術。
1)局部轉換技術:局部轉換(local Transformation)
包括工藝映射(Technology Mapping)、管腳變換(Pin Permutation)、狀態分配(phase assignment)等方法,通常是施加在門網表上,并且是針對具有大開關電容的節點。其基本思想為:在目標節點附近,置換一個或幾個門單元,以減小電容和開關活動因子。但是,這種方法必須注意在短路電流和輸出功耗之間取得均衡。
在邏輯綜合階段,常用的轉換技術有工藝映射,其目的在于,將一個經與工藝無關的優化程序優化后的邏輯網絡,映射到一個預定義門單元的目標庫。映射策略如下:一是將具有高開關活動因子的節點映射到單元的內部節點,以降低電容值;二是門單元尺寸的選擇要在單元的驅動能力和功耗之間取得折衷;三是與功耗相關的工藝映射方案中,還需要考慮小的延遲和面積映射。為了進一步降低功耗,在工藝映射前,通常要將具有復雜節點的原始電路分解成一系列具有基本功能的門單元,即所謂的工藝分解(Technology Decomposition);當一個電路完成映射后,還可以通過門重定義尺寸(Gate Resizing)和管腳變換,減小不必要的大尺寸的門單元和邏輯等效的管腳排列,來實現優化功耗。
狀態分配是通過在節點間添加反相器,使操作的輸入信號反相,同時也使輸出反相。這種門級轉換技術減小功耗的途徑如下:一是加入的反相器增加了其它轉換的機會,可以和原有相鄰的反相器作相當多的變換,如合并、撤消等;二是這種方法能將高開關活動因子節點通路上的反相器移走,從而具有更低的功耗。
2)預決算方法指在原有電路中,加入一個預決算(Pre-computation)邏輯電路的方法。其基本思想為:在提前一個時鐘周期內,有選擇地預估算電路的邏輯輸出值,并在接下來的一個周期內,關掉電路內部的某些單元,降低節點的開關活動因子和電容來降低功耗。
3)新的邏輯電路結構邏輯結構的類型和電路的功耗、面積、速度密切相關。為了獲得更低的功耗,有較多文獻研究了邏輯結構的優化。
CPL(Pass Transistor Logic)是一種研究得較多的低功耗邏輯電路。它用兩組NMOS傳輸門實現互補的兩個邏輯信號,兩個PMOS管用作反饋管,將NMOS傳輸門傳輸的高電平上拉到電源電壓。CPL電路的優點是輸入負載小,輸出驅動能力強,缺點是固有節點多、連線多、布線難度大。
動態邏輯電路有較低的功耗,尤其是動態差分邏輯因為具有更高的噪聲抑制特性而受到重視,文獻[49]提出了研究了有限擺幅邏輯(Swing Limited Logic,SLL),能夠在給定的電源電壓下實現高性能,能量延遲積比傳統的電路低一個數量級。
4版圖級
1)布局布線在低功耗版圖設計中,合理的布局布線是關鍵。傳統的布局和布線是以面積和延時為考慮重點,因此常常追求布線最短、電容最小;而面向低功耗的布局布線方法,不僅考慮傳統的設計目標,還要和設計中的信號活動性結合,以信號活動性和電容乘積最小為優化目標,實現低功耗[50]。
2)時鐘樹設計版圖設計中,時序電路是降低功耗的一個重點。在同步系統中,時鐘通常消耗總能量中很大的一部分;不同的設計目標中,時鐘產生和時鐘分布的功耗所占系統功耗的比例可以達到30%甚至40%.在這個階段,時鐘網絡分布即時鐘樹結構的優化,以及驅動方式的選擇,利用緩沖器插入優化和變線寬優化,可以在節點延時和功耗之間取得折衷。另外,鑒于時鐘偏差對電路性能的重要影響,在保證電路時序的前提下,可以采用特定的非零偏差時鐘樹,來獲得有益的功耗降低以及時鐘頻率和電路穩定性的改善。
評論