新聞中心

        EEPW首頁 > 嵌入式系統 > 設計應用 > ARM的字對齊問題總結

        ARM的字對齊問題總結

        作者: 時間:2016-11-27 來源:網絡 收藏
        一、啥是字對齊?為啥要字對齊?

        現代計算機中內存空間都是按照byte劃分的,從理論上講似乎對任何類型的變量的訪問都可以從任何地址開始,但實際情況是在訪問特定類型變量的時候經常在特定的內存地址訪問,這就是對齊。

        本文引用地址:http://www.104case.com/article/201611/322453.htm

        字節對齊的原因大致是如下兩條:

        1、平臺原因(移植原因):不是所有的硬件平臺都能訪問任意地址上的任意數據的;某些硬件平臺只能在某些地址處取某些特定類型的數據,否則拋出硬件異常。

        2、性能原因:數據結構(尤其是棧)應該盡可能地在自然邊界上對齊。原因在于,為了訪問未對齊的內存,處理器需要作兩次內存訪問;而對齊的內存訪問僅需要一次訪問。

        二、對齊規則

        每個特定平臺上的編譯器都有自己的默認“對齊系數”(也叫對齊模數)。程序員可以通過預編譯命令#pragma pack(n),n=1,2,4,8,16來改變這一系數,其中的n就是你要指定的“對齊系數”。
        規則:
        1. 數據成員對齊規則:結構(struct)(或聯合(union))的數據成員,第一個數據成員放在offset為0的地方,以后每個數據成員的對齊按照#pragma pack指定的數值和這個數據成員自身長度中,比較小的那個進行。
        2. 結構(或聯合)的整體對齊規則:在數據成員完成各自對齊之后,結構(或聯合)本身也要進行對齊,對齊將按照#pragma pack指定的數值和結構(或聯合)最大數據成員長度中,比較小的那個進行。
        3. 結合1、2可推斷:第一、如果n大于等于該變量所占用的字節數,那么偏移量必須滿足默認的對齊方式,第二、如果n小于該變量的類型所占用的字節數,那么偏移量為n的倍數,不用滿足默認的對齊方式。

        三、X86對齊實驗
        下面再簡要回顧解釋一下上述的對齊規則,結合實例進行分析:
        1. 數據類型自身的對齊值:對于char型數據,其自身對齊值為1字節,對于short型為2字節,對于int,float,double類型,其自身對齊值為4字節。
        2. 結構體的自身對齊值:其成員中自身對齊值最大的那個值。
        3. 指定對齊值:#pragmapack(n)來設定變量以n字節對齊方式。n字節對齊就是說變量存放的起始地址的偏移量有兩種情況,第一、如果n大于等于該變量所占用的字節數,那么偏移量必須滿足默認的對齊方式,第二、如果n小于該變量的類型所占用的字節數,那么偏移量為n的倍數,不用滿足默認的對齊方式。
        4. 數據成員和結構體的有效對齊值:數據成員(數據類型)和數據結構的自身對齊值和指定對齊值中小的那個值,數據成員對齊了數據結構自然也就對齊了。
        了解上述四個基本概念,我們開始討論具體數據結構的成員和其自身的對齊方式。有效對齊值N是最終用來決定數據存放地址方式的值。有效對齊N,就是表示“對齊在N上”,也就是說該數據的"存放起始地址%N=0"。而數據結構中的數據變量都是按定義的先后順序來排放的。第一個數據變量的起始地址就是數據結構的起始地址。結構體的成員變量要對齊排放,結構體本身也要根據自身的有效對齊值圓整(結構體成員變量占用總長度需要是對結構體有效對齊值的整數倍)。下面結合VS2005中編譯環境的例子進行深入了解:
        例子B分析:
        struct B
        {
        char b;
        int a;
        short c;
        };
        假設B從地址空間0x0000開始排放。該例中沒有顯式指定對齊值N,VS2005默認值為4。
        成員變量b自身對齊值是1,比指定或默認指定對齊值4小,故有效對齊值為1,其存放地址0x0000符合0x0000%1=0,滿足字節對齊原則。
        成員變量a自身對齊值為4,和指定或默認指定對齊值4相等,故有效對齊值也為4,為了保證字節對齊,成員變量a只能存放在起始地址為0x0004到0x0007這四個連續的字節空間中,復核0x0004%4=0。
        成員變量c自身對齊值為2,比指定或默認指定對齊值4小,故有效對齊值為2,可順序存放在0x0008至0x0009兩個字節空間中,符合0x0008%2=0。
        至此滿足了數據成員的字節對齊,接著看數據結構B的對齊。數據結構B的自身對齊值為其變量中最大對齊值(也就是成員變量b)4,故結構體B的有效對齊值也是4。根據結構體圓整的要求, 0x0009到0x0000=10字節,(10+2)%4=0。所以0x0000A到0x000B也為結構體B所占用。故B從0x0000到0x000B 共有12個字節,sizeof(struct B)=12。
        之所以在變量C補充2字節,是因為要實現編譯器快速有效的存取結構數組,試想如果定義B結構數組,第一個結構起始地址是0沒有問題,但是第二個結構呢?按照數組的定義,數組中所有元素都是緊挨著的,如果不把結構的大小補充為對齊值(4)的整數倍,那下一個結構的起始地址將是0x0000A,這顯然不能滿足結構的地址對齊了。
        例子C分析:

        __align(2) struct C
        {
        char b;
        int a;
        short c;
        };
        同理,例子C中成員變量b自身對齊值為1,指定對齊值為2,故效對齊值為1,假設C從0x0000開始,那么b存放在0x0000,符合0x0000%1= 0,滿足字節對齊原則。
        成員變量a自身對齊值為4,指定對齊值為2,故有效對齊值為2,順序存放在0x0002、0x0003、0x0004、0x0005四個連續字節中,符合0x0002%2=0,滿足字節對齊原則。
        成員變量c的自身對齊值為2,與指定對齊值相等,故有效對齊值為2,順序存放在0x0006、0x0007中,符合 0x0006%2=0,滿足字節對齊原則。
        從0x0000到0x00007共八字節存放的是結構體C的變量。結構體C自身對齊值為4,比指定對齊值2大,故C的有效對齊值為2,因8%2=0,C只占用0x0000到0x0007的八個字節。所以sizeof(struct C)=8,完全滿足字節對齊原則。
        除了指定的對齊值不同能導致數據結構的地址存放不同外, 編譯器不同存放結構體方式也可能不同。

        四、ARM平臺的對齊問題

        在ARM中,有ARM和Thumb兩種指令。

        ARM指令:每執行一條指令,PC的值加4個字節(32bits).一次訪問4字節內容,該字節的起始地址必須是4字節對齊的位置上,即地址的低兩位為bits[0b00],也就是說地址必須是4的倍數。

        Thumb指令:每執行一條指令,PC的值加2個字節(16bits).).一次訪問2字節內容,該字節的起始地址必須是2字節對齊的位置上,即地址的低兩位為bits[0b0],也就是說地址必須是2的倍數。

        遵循以上方式叫對齊(aligned)方式,不遵守這樣方式稱為非對齊(unaligned)的存儲訪問操作。

        五、ARM平臺字節對齊關鍵字
        1. __align(num)
        用于修改最高級別對象的字節邊界。
        A、在匯編中使用LDRD或者STRD時,就用到此命令__align(8)進行修飾限制。來保證數據對象是相應對齊。
        B、該修飾對象的命令最大是8個字節限制,可讓2字節的對象進行4字節
        對齊,但是不能讓4字節的對象2字節對齊。
        C、 __align是存儲類修改,他只修飾最高級類型對象不能用于結構或者函數對象。

        2. __packed
        __packed是進行一字節對齊。
        A、不能對packed的對象進行對齊;
        B、所有對象的讀寫訪問都進行非對齊訪問;
        C、float及包含float的結構聯合及未用__packed的對象將不能字節對齊;
        D、__packed對局部整形變量無影響;
        D、強制由unpacked對象向packed對象轉化是未定義,整形指針可以合法定
        義為packed __packed int* p; //__packed int 則沒有意義。

        3. __unaligned
        用于修飾該變量可按照非對齊訪問。


        六、如何查找與字節對齊方面的問題
        如果出現對齊或者賦值問題首先查看:
        1. 編譯器的big little端設置;
        2. 看這種體系本身是否支持非對齊訪問;
        3. 如果支持看設置了對齊與否,如果沒有則看訪問時需要加某些特殊的修飾來標志其特殊訪問操作。
        七、結論
        針對于32位處理器對于本地使用的數據結構,為提高內存訪問效率,采用四字節對齊方式;同時為了減少內存的開銷,合理安排結構成員的位置,減少四字節對齊導致的成員之間的空隙,降低內存開銷。
        對于處理器之間的數據結構,需要保證消息的長度不因為在不同編譯平臺和不同處理器導致消息結構的長度發生變化,使用一字節對齊方式對消息結構進行緊縮;為保證處理器之間的消息的數據結構的內存訪問效率,采用字節填充的方式自己對消息中成員進行四字節對齊。
        數據結構的成員位置要兼顧成員之間的關系、數據訪問效率和空間利用率。順序安排的原則是:四字節的放在最前面,兩字節的緊接最后一個四字節成員,一字節緊接最后一個兩字節成員,填充字節放在最后。舉例如下:
        typedef struct tag_T_MSG{
        long ParaA;
        long ParaB;
        short ParaC;
        char ParaD;
        char Pad;
        } T_MSG;



        關鍵詞: ARM字對齊問題總

        評論


        技術專區

        關閉
        主站蜘蛛池模板: 图木舒克市| 郑州市| 潍坊市| 湄潭县| 尼勒克县| 泰兴市| 普安县| 宁蒗| 车致| 探索| 扬州市| 长丰县| 万源市| 隆德县| 维西| 都安| 尼勒克县| 囊谦县| 榆树市| 阿克陶县| 永靖县| 封开县| 杭锦旗| 宁强县| 文登市| 北京市| 来宾市| 邢台市| 东源县| 南昌市| 聂拉木县| 万安县| 青海省| 天全县| 彰武县| 昌乐县| 儋州市| 丰都县| 阿坝| 湘西| 靖州|