新聞中心

        EEPW首頁 > 測試測量 > 學習方法與實踐 > 基于GCC的嵌入式程序插裝技術

        基于GCC的嵌入式程序插裝技術

        作者:同濟大學 沈永清 徐中偉 時間:2008-01-25 來源:單片機及嵌入式系統應用 收藏

               軟件測試中,覆蓋、故障注入、性能分析等廣泛使用的動態測試方法均基于程序插裝技術。

        本文引用地址:http://www.104case.com/article/78079.htm

               本文介紹一種通過分析和修改GCC編譯工具,實現程序插裝的新方法。該方法具有批量自動插裝,插裝與編譯連接緊密結合,適用語言廣泛等優點。最后具體討論了如何在ARM嵌入式程序中實現程序插裝,并給出修改GCC的源代碼。

               引 言
           

                程序插裝(Program Instrumentation)概念最先是由J.G.Huang教授提出,是借助往被測程序中插入操作(稱為“探針”),以便獲取程序的控制流和數據流信息,從而實現測試目的的方法。在軟件動態測試中,程序插裝是一種基本的測試手段,應用廣泛,是覆蓋率測試、軟件故障注入和動態性能分析的基礎技術。
           

               GCC(GNU Compiler Collection)是一個高度優化,高度可移植,廣泛使用的編譯系統。它能處理多種語言,包括C/C++、Fortran、Java和Pascal等多種語言前端,而且后端支持幾乎所有的處理器結構。GCC作為源碼開放的軟件,人們可以自由修改和使用;加入插裝模塊后,在GCC所支持的語言中都可插入相應的測試代碼(這里只介紹C語言的插裝模塊)。本文將詳細敘述如何修改GCC,使其在編譯每個C函數時,分別將各個形式參數連同該函數名傳遞給一個指定函數。該指定函數的返回值賦予原來的形式參數,從而可以人為控制被插裝函數的每個參數實際值,進而完成各種規則下的測試。

               1 GCC編譯流程分析
           

               編譯器的工作是將源代碼(通常使用高級語言編寫)翻譯成目標代碼(通常是低級的目標代碼或者機器語言)。在現代編譯器的實現中,這個工作一般是分為兩個階段來實現的:
           

               第一階段,編譯器的前端接收輸入的源代碼,經過詞法、語法和語義分析等得到源程序的某種中間表示方式。
           

               第二階段,編譯器的后端將前端處理生成的中間表示方式進行一些優化,并最終生成在目標機器上可運行的代碼。
           

               GCC編譯器以一個函數為單位對經過預處理的輸入源文件進行編譯處理。根據GNU Bison(一個類似YACC但功能更強大的文法分析工具)生成的語法分析程序,前端完成語法、語義分析,建立語法樹,并轉換成中間代碼。GCC內部使用了一種能對實際的體系結構做一種抽象的,與硬件平臺無關的語言,這個中間語言就是RTL(Register Ttansfer Language)。通過修改源程序的RTL,可以改變、刪除源程序,包括插入所需要的代碼,由GCC后端處理并最終輸出對應硬件平臺的匯編碼,源程序無需手工修改便可實現插裝功能。
           

               GCC的入口點main函數在文件main.c中。此函數非常簡單,只有一條直接調用toplev_main函數的語句。toplev_main函數是在toplev.c文件中定義的,以下我們只關心與編譯有關的源碼,其他的暫時忽略。toplev_main中最重要的是調用了do_complile函數,這個函數從名字看就是做編譯工作的;而在此之后,toplev_main函數就返回了。dD_compile函數也是在tokv.c中定義的,其中真正進行編譯工作的是調用compilte_file函數。compik_file函數最終調用了一個鉤子函數來分析(parse)整個輸入文件:
          

                 (*lang_hooks.parse_file)(set_yydebug);
           

                這里的lang_hooks是一個全局變量,不同語言的前端對此賦以不同的值。對C語言來說,這條語句相當于調用了c-opts.c中的c_common_parse_file函數。c_com-mon_parse_file中調用了c-parse.c中的c_parse_file函數;在此函數中又調用了同文件中的yyparse函數,該函數負責解析C語言源文件,并轉化為特殊的語法樹結構。該函數是GNU bison將YACC轉變為C語言而自動生成的,所以這段代碼閱讀起來比較困難,但我們并不關心語法分析的細節。在完成函數體的分析后,利用已經建立的tree結構生成RTL,優化后最終輸出匯編碼;自此C函數的編譯就算結束了,這些是由yyparse調用finish_function函數完成的。finish_function函數中最重要的函數是tree_rest_of_compilation(定義在tree_optimize.c中),它是真正實現上述功能的函數。為了說明它所做的具體事情,我們將該函數做了刪減,保留了關鍵的地方。


                將函數各個部分展開成RTL形式后,調用函數rest_of_compilation將RTL輸出為匯編碼。至此,得到了一張清晰的GCC編譯時的函數調用路線,如表1所列。

              2 基于GCC的程序插裝技術
           

               根據插裝測試的要求,需要在函數開始時為每個參數調用鉤子函數,并用鉤子函數的返回值更新參數的值;同時,將被插裝函數的名稱壓入函數本地棧內,作為該函數的一個匿名本地變量,只用于傳遞給鉤子函數。從上面列出的tree_rest_of_compilation函數源碼得知,負責建立被編譯函數參數和返回值的函數是expand_function_start,定義是在文件function.c中。expand_function_start中處理函數參數和返回值的函數是assign_parms,這是需要特別關注的函數。以下是該函數簡化的偽碼:

                斜體加粗的部分是增加的代碼。在for循環前,獲得當前編譯的函數名(見源碼中①位置);但暫時不能輸出到函數的RTL鏈中,因為本地棧要在所有參數傳遞完畢才完全建立起來。在for循環體結束前,記錄下函數參數的一份拷貝(見②),最后調用。insert_function_name_local函數,將當前函數名插入本地棧,并且修正棧指針(見③)。經過以上修改,得到了插裝所需的所有信息,包括函數參數和函數名稱的RTX表示。GCC將函數編譯后生成的RTX表示以鏈表形式組織,最后一次性把這個RTX鏈表輸出為后端平臺的匯編碼。完成這項工作的是rest_of_compilation函數,所以在調用rest_of_complilation函數前插入我們的RTX,最終完成插裝,由函數inject_rtl負責完成。下面是inject_rtl的主要代碼:


                3 APCS與程序插裝實現
           

                編譯器必須以一套統一的方法編譯函數的定義和調用過程,才能確保不同語言編寫的函數能相互調用。規定這些細節的便叫作“函數調用規范(Procedure Call Stand-ard)”。ARM體系結構定義了自己的函數調用規范——ARM函數調用標準(ARM Procedure Call Standard,APCS)。雖然APCS不是強制性的,但實現APCS并不困難,而且可獲得統一的二進制兼容的好處,所以大部分的編譯器都實現了APCS,其中包括GCC。
           

                APCS中函數傳遞參數的定義如下:
           

               ◇前4個整數實參(或者更少)被裝載到r0~r3。前4個整數實參(或者更少)被裝載到r0~r3。
               ◇前4個浮點實參(或者更少)被裝載到f0~f3。
               ◇如果參數為雙字(8字節),就必須從偶數寄存器開始放置。
               ◇如果一個參數不能完全放入寄存器中,則超過的那部分拷貝到棧中。
           

               其他任何實參(如果有的話)存儲在內存中,用進入函數時緊接在sp值上面的字來指向。換句話說,其余的參數被壓入棧頂。所以,要想簡單,最好定義接受4個或更少的整數參數的函數。
           

               本文所述的插入函數只有兩個整型形參,所以調用時只需將兩個實參分別傳入ro和rl。GCC提供emit_li-brary_call函數用來生成函數調用的RTL碼,GCC將按照APCS產生正確的函數調用匯編碼。函數定義在calls.c中,原型為:


                 插入所需函數后,需要將返回值賦值給對應的被插裝函數的形參。以下是插入函數insert_parms_test_function的完整代碼:

              4 實 例
           

               為便于檢查插裝效果,用經過修改的GCC編譯一段簡單的C語言程序。該程序為一個獨立函數foo,接受兩個整數類型的參數。具體代碼如下:

           

                從GCC輸出的匯編碼可以看到,foo函數的兩個參數都經過鉤子函數pt_hook_partns的處理更新;在pt_hook_parms函數內,可以根據測試算法返回不同的邊界值,從而達到測試的目的。依照此方法,一個實際程序經過插裝后,在ARM模擬器上順利運行,并取得預期的測試效果。

                結語
           

                 本文詳細地論述了修改GCC增加插裝功能的實現方法。按照這樣的思路,成功地實現了基于ARM7芯片的嵌入式系統的動態參數邊界測試,達到了預期的效果。本文所述的插裝函數比較簡單,沒有區分參數的類型,所有參數均按照一個字大小來處理;下一步的工作是細分參數不同類型,插裝不同的處理函數。作為一種通用的插裝方法,在此摹礎上.通過識別不同的插裝點和插裝不同的函數,可以實現函數調用棧檢查,程序覆蓋率測試,獲取函數實際執行時間等需要插裝技術作為基礎的功能。



        關鍵詞:

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 泗水县| 获嘉县| 全州县| 黎平县| 克山县| 资源县| 乌兰浩特市| 六枝特区| 苏尼特右旗| 霍城县| 方正县| 临清市| 株洲县| 广水市| 江门市| 黎平县| 井研县| 兴国县| 巴林左旗| 宜兴市| 淳化县| 弋阳县| 平定县| 通江县| 衢州市| 八宿县| 绥化市| 吴旗县| 依兰县| 湘潭市| 莫力| 武夷山市| 阿坝| 磐石市| 长葛市| 嵩明县| 祥云县| 红河县| 杂多县| 景泰县| 大荔县|