新聞中心

        EEPW首頁 > 電源與新能源 > 設計應用 > Linux2.6內核中最新電源管理技術分析及未來發展

        Linux2.6內核中最新電源管理技術分析及未來發展

        作者: 時間:2016-12-07 來源:網絡 收藏

        們時 CPU 的運行頻率不會根據系統運行時負載的變化動態作出調整。這兩種 governors 對應的是兩種極端的應用場景,使用 performance governor 體現的是對系統高性能的最大追求,而使用 powersave governor 則是對系統低功耗的最大追求。雖然這兩種應用需求確實存在,但大多數用戶在大部分時間里需要的是更加靈活的變頻策略。最早的 cpufreq 子系統通過 userspace governor 為用戶提供了這種靈活性。正如它的名字一樣,使用 userspace governor 時,系統將變頻策略的決策權交給了用戶態應用程序,并提供了相應的接口供用戶態應用程序調節 CPU 運行頻率使用。通過使用 cpufrequtils 工具包中的 cpufreq-set 將 userspace 設置為 cpufreq 子系統所使用的 governor 后,我們可以看到與之前相比在 /sys/devices/system/cpu/cpuX/cpufreq/ 目錄下多出了一個名為 scaling_setspeed 的文件,這正是 userspace governor 所提供的特殊用戶接口。用戶可以通過向該文件寫入任何一個 scaling_available_frequencies 中所支持的運行頻率,從而將 CPU 設置在該頻率下運行。

        本文引用地址:http://www.104case.com/article/201612/327367.htm

          # cpufreq-set -g userspace

          # cat cpuinfo_cur_freq

          1000000

          # cat scaling_available_frequencies

          1667000 1333000 1000000

          # echo 1333000 》scaling_setspeed

          # cat cpuinfo_cur_freq

          1333000

          剛剛提到在使用 userspace governor 時,系統將變頻策略的決策權交給了用戶態應用程序。該用戶態應用程序一般是一個 daemon 程序,每隔一定的時間間隔收集一次系統信息并根據系統的負載情況使用 userspace governor 提供的 scaling_setspeed 接口動態調整 CPU 的運行頻率。作為這個daemon 程序,當時在幾個主要的 Linux 發行版中使用的一般是 powersaved 或者 cpuspeed。這兩個 daemon 程序一般每隔幾秒鐘統計一次 CPU 在這個采樣周期內的負載情況,并根據統計結果調整 CPU 的運行頻率。這種 userspace governor 加用戶態 daemon 程序的變頻方法雖然為用戶提供了一定的靈活性,但通過開源社區的廣泛使用所得到的意見反饋逐漸暴露了這種方法的兩個嚴重缺陷。第一個是性能方面的問題。例如powersaved 每隔五秒鐘進行一次系統負載情況的采樣分析的話,我們可以分析一下在下面給出的應用場景中的用戶體驗。假設 powersaved 的采樣分析剛剛結束,而且由于在剛剛結束的采樣周期內系統負載很低,CPU 被設置在最低頻率上運行。這時用戶如果打開 Firefox? 等對 CPU 運算能力要求相當高的程序的話,powersaved 要在下一個采樣點——大約五秒鐘之后才有機會觀察到這種提高 CPU 運行頻率的需求。也就是說,在Firefox 啟動之初的五秒鐘內 CPU 的計算能力并沒有被充分發揮出來,這無疑會使用戶體驗大打折扣。第二個是系統負載情況的采樣分析的準確性問題。將監控系統負載情況并對未來 CPU 的性能需求做出判斷的任務交給一個用戶態程序完成實際上并不合理,一方面是由于一個用戶態程序很難完整的收集到所有需要的信息,因為這些信息大部分都保存在內核空間;另一方面一個用戶態程序如果想要收集這些系統信息,必然需要進行用戶態與內核態之間的數據交互,而頻繁的用戶態與內核態之間的數據交互又會給系統性能帶來負面影響。

          那么這兩個問題有沒有解決的方法呢?應該講社區中的開發人員就第二個問題比較容易達成一致,既然在用戶態對系統的負載情況進行采集和分析存在這樣那樣的問題,那么更加合理的做法就是應該將這部分工作交由內核負責。但是第一個問題呢?第一個問題最直觀的解決方案就是降低對系統負載進行采樣分析的時間間隔,這樣 powersaved 就能盡早的對系統負載的變化做出及時的響應。然而這種簡單的降低采樣分析的時間間隔的方案同樣存在著兩方面的問題,一方面這意味著更加頻繁的用戶態與內核態之間的數據交互,因此必然也就意味著對系統性能帶來更大的負面影響;另一方面的主要原因在于當時各個 CPU 生產廠家的變頻技術在硬件上仍不完善,具體體現就是在對 CPU 進行變頻設置時所需的操作時間過長,例如 Intel 早期的 Speedstep 技術在對 CPU 進行變頻設置時需要耗時 250 微秒,在此過程中 CPU 無法正常執行指令。讀者如果簡單的計算一下不難發現,即使對于一個主頻為 1GHz 的 CPU 而言, 250 微秒也意味著 250,000 個時鐘周期,在這期間 CPU 完全可以執行完上萬條指令。因此從這個角度而言,簡單的降低采樣分析的時間間隔對系統性能帶來的負面影響更加嚴重。幸運的是隨著硬件技術的不斷完善和改進,對 CPU 進行變頻設置所需的操作時間已經顯著降低,例如 Intel 最新的 Enhanced Speedstep 技術在對 CPU 進行變頻設置時耗時已降至 10 微秒,下降了不止一個數量級。正是這種 CPU 硬件技術的發展為內核開發人員解決這些早期的遺留問題提供了契機,Venkatesh 等人提出并設計實現了一個新的名為 ondemand 的 governor ,它正是人們長期以來希望看到的一個完全在內核態下工作并且能夠以更加細粒度的時間間隔對系統負載情況進行采樣分析的 governor。在介紹 ondemand governor 的具體實現之前,我們先來看一下如何使用 ondemand governor 及其向用戶提供了哪些操作接口。通過 cpufreq-set 將 ondemand 設置為當前所使用的 governor 之后,在 /sys/devices/system/cpu/cpuX/cpufreq 目錄下會出現一個名為 ondemand 的子目錄

          $ sudo cpufreq-set -g ondemand

          $ ls /sys/devices/system/cpu/cpu0/cpufreq/ondemand/

          ignore_nice_load

          powersave_bias

          sampling_rate

          sampling_rate_max

          sampling_rate_min

          up_threshold

          $ sudo cat sampling_rate_min sampling_rate

          sampling_rate_max

          40000

          80000

          40000000

          $ sudo cat up_threshold

          30

          在這個子目錄下名字以 sampling 打頭的三個文件分別給出了ondemand governor 允許使用的最短采樣間隔,當前使用的采樣間隔以及允許使用的最長采樣間隔,三者均以微秒為單位。

          以筆者的電腦為例, ondemand governor 每隔 80 毫秒進行一次采樣。另外比較重要的一個文件是 up_threshold ,它表明了系統負載超過什么百分比時ondemand governor 會自動提高CPU 的運行頻率。以筆者的電腦為例,這個數值為 30% 。那么這個表明系統負載的百分比數值是如何得到的呢?在支持Intel 最新的 Enhanced Speedstep 技術的 CPU 中,在處理器硬件中直接提供了兩個 MSR 寄存器(Model Specific Register)供 ondemand governor 采樣分析系統負載情況使用。這兩個 MSR 寄存器的 名字分別為 IA32_MPERF 和 IA32_APERF[5] ,其中 IA32_MPERF MSR 中的 MPERF 代表Maximum Performance , IA32_APERF MSR 中的 APERF 代表Actual Performance 。就像這兩個 MSR 的名字一樣, IA32_MPERF MSR 寄存器是一個當 CPU 處在 ACPI C0 狀態下時按照 CPU 硬件支持的最高運行頻率每隔一個時鐘周期加一的計數器;IA32_APERF MSR 寄存器是一個當 CPU 處在 ACPI C0 狀態下時按照 CPU 硬件當前的實際運行頻率每隔一個時鐘周期加一的計數器。有了這兩個寄存器的存在,再考慮上 CPU 處于ACPI C0 和處于 ACPI C1、C2、C3 三種狀態下的時間比例,也就是 CPU 處于工作狀態和休眠狀態的時間比例, ondemand governor 就可以準確的計算出 CPU 的負載情況了。

          得到了 CPU 的負載情況,接下來的問題就是如何選擇 CPU 合適的運行頻率了。剛剛在前面提到,當系統負載超過up_threshold 所設定的百分比時, ondemand governor 將會自動提高 CPU 的運行頻率,但是具體提高到哪個頻率上運行呢?在 ondemand governor 監測到系統負載超過 up_threshold所設定的百分比時,說明用戶當前需要 CPU 提供更強大的處理能力,因此 ondemand governor 會將CPU設置在最高頻率上運行,這一點社區中的開發人員和廣大用戶都沒有任何異議。但是當 ondemand governor 監測到系統負載下降,可以降低 CPU 的運行頻率時,到底應該降低到哪個頻率呢? ondemand governor 的最初實現是在可選的頻率范圍內調低至下一個可用頻率,例如筆者使用的 CPU 支持三個可選頻率,分別為 1.67GHz、 1.33GHz 和 1GHz ,如果 CPU 運行在 1.67GHz 時ondemand governor 發現可以降低運行頻率,那么 1.33GHz 將被選作降頻的目標頻率。這種降頻策略的主導思想是盡量減小對系統性能的負面影響,從而不會使得系統性能在短時間內迅速降低以影響用戶體驗。但是在 ondemand governor 的這種最初實現版本在社區發布后,大量用戶的使用結果表明這種擔心實際上是多余的, ondemand governor 在降頻時對于目標頻率的選擇完全可以更加激進。因此最新的 ondemand governor 在降頻時會在所有可選頻率中一次性選擇出可以保證 CPU 工作在 80% 以上負荷的頻率,當然如果沒有任何一個可選頻率滿足要求的話則會選擇 CPU 支持的最低運行頻率。大量用戶的測試結果表明這種新的算法可以在不影響系統性能的前提下做到更高效的節能。在算法改進后, ondemand governor 的名字并沒有改變,而 ondemand governor 最初的實現也保存了下來,并且由于其算法的保守性而得名conservative 。

        支持 Intel Enhanced Speedstep 技術的 CPU 驅動程序的實現前文在討論cpufreq 的軟件結構時已經指出, cpufreq 從設計上將 CPU 變頻的 policy 與mechanism 分離開來



        評論


        技術專區

        關閉
        主站蜘蛛池模板: 武隆县| 安顺市| 乐清市| 松溪县| 大洼县| 麻江县| 渭源县| 阿荣旗| 瓦房店市| 宜昌市| 上林县| 郎溪县| 东明县| 峡江县| 贵溪市| 饶河县| 巩义市| 芮城县| 读书| 华坪县| 建始县| 饶河县| 清河县| 汉源县| 永泰县| 洛南县| 永安市| 策勒县| 安阳市| 吴桥县| 襄樊市| 莎车县| 宜丰县| 伊川县| 江城| 乌兰浩特市| 佛教| 崇仁县| 横峰县| 六安市| 南昌市|