uCOS-II優先級任務調度在PowerPC上的移植和優化
3 利用PowerPC“數出前導零數目”指令實現任務調度
PowerPC是Motorola 、IBM和Apple三家公司于20世紀90年代初期聯合設計的32位CPU。Freescale(其前身是Motorola半導體部)發展了針對汽車電子的MPC5xx系列單片機及后續基于e200內核的MPC5xxx系列單片機;更高端的e500、e600內核是用于通信領域的MPC6xxx、7xxx和8xxx系列。
下面對μC/OS任務優先級調度算法的改進和優化是在MPC5554單片機上實現的。
PowerPC處理器具有一條“數出前導零數目” 的指令cntlzw(count leADIng zero word),可以以硬件指令方式實現優先級的多任務調度算法。這條指令也可用于圖像處理和算法加密的場合。該指令數出一個32位寄存器中前置零的數目,例如,返回0表示b0不為零,即沒有前導零;返回3表示b3不為零,b3位的前面從b0到b2共有3個零;返回32表示RS寄存器中所有的位都為零。(在PowerPC架構中,最高位MSB表示為b0,低位MSB根據位寬表示為b7、b15或b31。)
利用這條指令,用匯編語言改寫尋找最高優先級的就緒任務的函數,則不需要進行循環移位判斷,可以直接從64個任務中找出優先級最高的那個任務。代碼如下:

在這段代碼中,首先判斷前32個任務是否有處于就緒態的,如果沒有的話,再對后32個任務進行判斷。由于優先級最低的空閑任務總是處于就緒態,所以后32個任務總能返回一個有效值。該代碼在前32個任務有就緒態時運行7條指令,在前32個任務均沒有就緒時需要執行10條指令;而μC/OS原有的代碼編譯出來的匯編程序,則需要運行15條指令。
使用這個方法的另一個好處是不再需要使用256字節的OSUnMapTbl表,任務控制塊TCB也不需要使用OSTCBX、OSTCBY和OSTCBBitY、OSTCBBitX變量,每個ECB中也不再需要OSRdyGrp,這也減少了對ROM和RAM的占用。
4 改進擴展任務數的優先級調度性能
當對μC/OSII支持的任務數進行擴展時,按照μC/OSII原有的做法,需要按照高低字節分別查找OSUnMapTbl對照表。任務數為256時,尋找最高優先級就緒任務的函數將需要運行約35條指令。數出前導零數目的指令在這種情況下的作用將更加顯著,對于32位PowerPC處理器,精心設計的代碼可以做到僅需10條指令就將任務數擴展到1024個。
此時OSRdyGrp擴展為32位,OSrdyTbl擴展成32個32位的數組。從OSRdyGrp得到的前導零數目,就是任務優先級高5位的值,乘以4可以得到該字的相對偏移地址;在OSRdyTbl中,定義高位對應高優先級任務,低位對應低優先級任務,則其前導零數目就是任務優先級低5位的值,和高5位的值移位相加就得到完整的任務優先級。通過將OSRdyGrp和OSRdyTbl定義成結構體,利用結構體首地址的相對尋址來分別讀取其數值,可以減少一次取地址的操作。
尋找最高優先級就緒態的最終代碼如下:

在64位的PowerPC 更有cntlzd(Count Leading Zero Double word)指令,一次就可以找出64個任務中優先級最高的那個,就更沒有必要使用μC/OSII中的算法了。
5 總結
RTOS實時內核μC/OS和μC/OSII中,任務調度算法巧妙,性能優異,在嵌入式應用領域很有影響力,被移植到各種CPU上。然而由于是為8位CPU設計的,對于那些具有優先級硬件算法指令的16/32/64位CPU,μC/OSII的軟件算法就完全失去了優勢。應該利用這類CPU的特有指令,優化任務調度算法,使RTOS的實時性達到最佳。對于這類處理器,僅移植μC/OSII軟件算法是很不夠的,應該利用相關硬件算法指令。 電機保護器相關文章:電機保護器原理
評論