windows和Linux內(nèi)存的對齊方式
來源:程序員人生 發(fā)布時間:2014-11-18 09:06:31 閱讀次數(shù):3191次
1.內(nèi)存對齊的初步講授
內(nèi)存對齊可以用1句話來概括:
“數(shù)據(jù)項只能存儲在地址是數(shù)據(jù)項大小的整數(shù)倍的內(nèi)存位置上”
例如int類型占用4個字節(jié),地址只能在0,4,8等位置上。
例1:
#include <stdio.h>
struct xx{
char b;
int a;
int c;
char d;
};
int main()
{
struct xx bb;
printf("&a = %p
", &bb.a);
printf("&b = %p
", &bb.b);
printf("&c = %p
", &bb.c);
printf("&d = %p
", &bb.d);
printf("sizeof(xx) = %d
", sizeof(struct xx));
return 0;
}
履行結(jié)果以下:
&a = ffbff5ec
&b = ffbff5e8
&c = ffbff5f0
&d = ffbff5f4
sizeof(xx) = 16
會發(fā)現(xiàn)b與a之間空出了3個字節(jié),也就是說在b以后的0xffbff5e9,0xffbff5ea,0xffbff5eb空了出來,a直接存儲在了0xffbff5ec, 由于a的大小是4,只能存儲在4個整數(shù)倍的位置上。打印xx的大小會發(fā)現(xiàn),是16,有些人可能要問,b以后空出了3個字節(jié),那也應(yīng)當(dāng)是13啊?其余的3個 呢?這個往后瀏覽本文會理解的更深入1點,這里簡單說1下就是d后邊的3個字節(jié),也會浪費掉,也就是說,這3個字節(jié)也被這個結(jié)構(gòu)體占用了.
可以簡單的修改結(jié)構(gòu)體的結(jié)構(gòu),來下降內(nèi)存的使用,例如可以將結(jié)構(gòu)體定義為:
struct xx{
char b;
char d;
int a;
int c;
};
這樣打印這個結(jié)構(gòu)體的大小就是12,省了很多空間,可以看出,在定義結(jié)構(gòu)體的時候,1定要斟酌要內(nèi)存對齊的影響,這樣能使我們的程序占用更小的內(nèi)存。
2.操作系統(tǒng)的默許對齊系數(shù)
每 個操作系統(tǒng)都有自己的默許內(nèi)存對齊系數(shù),如果是新版本的操作系統(tǒng),默許對齊系數(shù)1般都是8,由于操作系統(tǒng)定義的最大類型存儲單元就是8個字節(jié),例如 long long(為何1定要這樣,在第3節(jié)會講授),不存在超過8個字節(jié)的類型(例如int是4,char是1,long在32位編譯時是4,64位編譯時是 8)。當(dāng)操作系統(tǒng)的默許對齊系數(shù)與第1節(jié)所講的內(nèi)存對齊的理論產(chǎn)生沖突時,以操作系統(tǒng)的對齊系數(shù)為基準(zhǔn)。
例如:
假定操作系統(tǒng)的默許對齊系數(shù)是4,那末對與long long這個類型的變量就不滿足第1節(jié)所說的,也就是說long long這類結(jié)構(gòu),可以存儲在被4整除的位置上,也能夠存儲在被8整除的位置上。
可以通過#pragma pack()語句修改操作系統(tǒng)的默許對齊系數(shù),編寫程序的時候不建議修改默許對齊系數(shù),在第3節(jié)會講授緣由
例2:
#include <stdio.h>
#pragma pack(4)
struct xx{
char b;
long long a;
int c;
char d;
};
#pragma pack()
int main()
{
struct xx bb;
printf("&a = %p
", &bb.a);
printf("&b = %p
", &bb.b);
printf("&c = %p
", &bb.c);
printf("&d = %p
", &bb.d);
printf("sizeof(xx) = %d
", sizeof(struct xx));
return 0;
}
打印結(jié)果為:
&a = ffbff5e4
&b = ffbff5e0
&c = ffbff5ec
&d = ffbff5f0
sizeof(xx) = 20
發(fā)現(xiàn)占用8個字節(jié)的a,存儲在了不能被8整除的位置上,存儲在了被4整除的位置上,采取了操作系統(tǒng)的默許對齊系數(shù)。
3.內(nèi)存對齊產(chǎn)生的緣由
內(nèi)存對齊是操作系統(tǒng)為了快速訪問內(nèi)存而采取的1種策略,簡單來講,就是為了放置變量的2次訪問。操作系統(tǒng)在訪問內(nèi)存 時,每次讀取1定的長度(這個長度就是操作系統(tǒng)的默許對齊系數(shù),或是默許對齊系數(shù)的整數(shù)倍)。如果沒有內(nèi)存對齊時,為了讀取1個變量是,會產(chǎn)生總線的2 次訪問。
例如假定沒有內(nèi)存對齊,結(jié)構(gòu)體xx的變量位置會出現(xiàn)以下情況:
struct xx{
char b; //0xffbff5e8
int a; //0xffbff5e9
int c; //0xffbff5ed
char d; //0xffbff5f1
};
操作系統(tǒng)先讀取0xffbff5e8-0xffbff5ef的內(nèi)存,然后在讀取0xffbff5f0-0xffbff5f8的內(nèi)存,為了取得值c,就需要將兩組內(nèi)存合并,進(jìn)行整合,這樣嚴(yán)重下降了內(nèi)存的訪問效力。(這就觸及到了陳詞濫調(diào)的問題,空間和效力哪一個更重要?這里不做討論)。
這樣大家就可以理解為何結(jié)構(gòu)體的第1個變量,不管類型如何,都是能被8整除的吧(由于訪問內(nèi)存是從8的整數(shù)倍開始的,為了增加讀取的效力)!
內(nèi)存對齊的問題主要存在于理解struct等復(fù)合結(jié)構(gòu)在內(nèi)存中的散布。
首先要明白內(nèi)存對齊的概念。
許多實際的計算機(jī)系統(tǒng)對基本類型數(shù)據(jù)在內(nèi)存中寄存的位置有限制,它們會要求這些數(shù)據(jù)的首地址的值是某個數(shù)k(通常它為4或8)的倍數(shù),這就是所謂的內(nèi)存對齊。
這個k在不同的cpu平臺下,不同的編譯器下表現(xiàn)也有所不同。比如32位字長的計算機(jī)與16位字長的計算機(jī)。這個離我們有些遠(yuǎn)了。我們的開發(fā)主要觸及兩大平臺,windows和linux(unix),觸及的編譯器也主要是microsoft編譯器(如cl),和gcc。
內(nèi)存對齊的目的是使各個基本數(shù)據(jù)類型的首地址為對應(yīng)k的倍數(shù),這是理解內(nèi)存對齊方式的終極寶貝。另外還要辨別編譯器的分別。明白了這兩點基本上就可以弄定所有內(nèi)存對齊方面的問題。
不同編譯器中的k:
1、對microsoft的編譯器,每種基本類型的大小即為這個k。大體上char類型為8,int為32,long為32,double為64。
2、對linux下的gcc編譯器,規(guī)定大小小于等于2的,k值為其大小,大于等于4的為4。
明白了以上的說明對struct等復(fù)合結(jié)構(gòu)的內(nèi)存散布就應(yīng)當(dāng)很清楚了。
下面看1下最簡單的1個類型:struct中成員都為基本數(shù)據(jù)類型,例如:
struct test1
{
char a;
short b;
int c;
long d;
double e;
};
在windows平臺,microsoft編譯器下:
假定從0地址開始,首先a的k值為1,它的首地址可使任意位置,所以a占用第1個字節(jié),即地址0;然后b的k值為2,他的首地址必須是2的倍數(shù),不能是1,所以地址1那個字節(jié)被填充,b首地址為地址2,占用地址2,3;然后到c,c的k值為4,他的首地址為4的倍數(shù),所以首地址為4,占用地址4,5,6,7;再然后到d,d的k值也為4,所以他的首地址為8,占用地址8,9,10,11。最后到e,他的k值為8,首地址為8的倍數(shù),所以地址12,13,14,15被填充,他的首地址應(yīng)為16,占用地址16⑵3。明顯其大小為24。
這就是 test1在內(nèi)存中的散布情況。我們建立1個test1類型的變量,a、b、c、d、e分別賦值2、4、8、16、32。然后從低地址順次打印出內(nèi)存中每一個字節(jié)對應(yīng)的16進(jìn)制數(shù)為:
2 0 4 0 8 0 0 0 10 0 0 0 0 0 0 0 0 0 0 0 0 0 40 40
驗證:
明顯推斷是正確的。
在linux平臺,gcc編譯器下:
假定從0地址開始,首先a的k值為1,它的首地址可使任意位置,所以a占用第1個字節(jié),即地址0;然后b的k值為2,他的首地址必須是2的倍數(shù),不能是1,所以地址1那個字節(jié)被填充,b首地址為地址2,占用地址2,3;然后到c,c的k值為4,他的首地址為4的倍數(shù),所以首地址為4,占用地址4,5,6,7;再然后到d,d的k值也為4,所以他的首地址為8,占用地址8,9,10,11。最后到e,從這里開始與microsoft的編譯器開始有所差異,他的k值為不是8,依然是4,所以其首地址是12,占用地址12⑴9。明顯其大小為20。
驗證:
我們建立1個test1類型的變量,a、b、c、d、e分別賦值2、4、8、16、32。然后從低地址順次打印出內(nèi)存中每一個字節(jié)對應(yīng)的16進(jìn)制數(shù)為:
2 0 4 0 8 0 0 0 10 0 0 0 0 0 0 0 0 0 40 40
明顯推斷也是正確的。
接下來,看1看幾類特殊的情況,為了不麻煩,不再描寫內(nèi)存散布,只計算結(jié)構(gòu)大小。
第1種:嵌套的結(jié)構(gòu)
struct test2
{
char f;
struct test1 g;
};
在windows平臺,microsoft編譯器下:
這類情況下如果把test2的第2個成員拆開來,研究內(nèi)存散布,那末可以知道,test2的成員f占用地址0,g.a占用地址1,以后的內(nèi)存散布不變,依然滿足所有基本數(shù)據(jù)成員的首地址都為其對應(yīng)k的倍數(shù)這1原則,那末test2的大小就還是24了。但是實際上test2的大小為32,這是由于:不能由于test2的結(jié)構(gòu)而改變test1的內(nèi)存散布情況,所以為了使test1種各個成員依然滿足對齊的要求,f成員后面需要填充1定數(shù)量的字節(jié),不難發(fā)現(xiàn),這個數(shù)量應(yīng)為7個,才能保證test1的對齊。所以test2相對test1來講增加了8個字節(jié),所以test2的大小為32。
在linux平臺,gcc編譯器下:
一樣,這類情況下如果把test2的第2個成員拆開來,研究內(nèi)存散布,那末可以知道,test2的成員f占用地址0,g.a占用地址1,以后的內(nèi)存散布不變,依然滿足所有基本數(shù)據(jù)成員的首地址都為其對應(yīng)k的倍數(shù)這1原則,那末test2的大小就還是20了。但是實際上test2的大小為24,一樣這是由于:不能由于test2的結(jié)構(gòu)而改變test1的內(nèi)存散布情況,所以為了使test1種各個成員依然滿足對齊的要求,f成員后面需要填充1定數(shù)量的字節(jié),不難發(fā)現(xiàn),這個數(shù)量應(yīng)為3個,才能保證test1的對齊。所以test2相對test1來講增加了4個字節(jié),所以test2的大小為24。
第2種:位段對齊
struct test3
{
unsigned int a:4;
unsigned int b:4;
char c;
};
或
struct test3
{
unsigned int a:4;
int b:4;
char c;
};
在windows平臺,microsoft編譯器下:
相鄰的多個同類型的數(shù)(帶符號的與不帶符號的,只要基本類型相同,也為相同的數(shù)),如果他們占用的位數(shù)不超過基本類型的大小,那末他們可作為1個整體來看待。不同類型的數(shù)要遵守各自的對齊方式。
如:test3中,a、b可作為1個整體,他們作為1個int型數(shù)據(jù)來看待,所以test3的大小為8字節(jié)。并且a與b的值在內(nèi)存中從低位開始順次排列,位于4字節(jié)區(qū)域中的前0⑶位和4⑺位
如果test4位以下格式
struct test4
{
unsigned int a:30;
unsigned int b:4;
char c;
};
那末test4的大小就為12個字節(jié),并且a與b的值分別散布在第1個4字節(jié)的前30位,和第2個4字節(jié)的前4位。
如過test5是以下情勢
struct test5
{
unsigned int a:4;
unsigned char b:4;
char c;
};
那末由于int和char不同類型,他們分別以各自的方式對齊,所以test5的大小應(yīng)為8字節(jié),a與b的值分別位于第1個4字節(jié)的前4位和第5個字節(jié)的前4位。
在linux平臺,gcc編譯器下:
struct test3
{
unsigned int a:4;
unsigned int b:4;
char c;
};
gcc下,相鄰各成員,不管類型是不是相同,占的位數(shù)之和超過這些成員中第1個的大小的時候,在結(jié)構(gòu)中以k值為1對齊,在結(jié)構(gòu)外k值為其基本類型的值。不超過的情況下在內(nèi)存中順次排列。
如test3,其大小為4。a,b的值在內(nèi)存中順次排列分別為第1個4字節(jié)中的0⑶和4⑺位。
如果test4位以下格式
struct test4
{
unsigned int a:20;
unsigned char b:4;
char c;
};
test4的大小為4個字節(jié),并且a與b的值分別散布在第1個4字節(jié)的0⑴9位,和20⑵3位,c寄存在第4個字節(jié)中。
如過test5是以下情勢
struct test5
{
unsigned int a:10;
unsigned char b:4;
short c;
};
那末test5的大小應(yīng)為4字節(jié),a,b的值為0⑼位和10⑴3位。c寄存在后兩個字節(jié)中。如果a的大小變成了20
那末test5的大小應(yīng)為8字節(jié)。即
struct test6
{
unsigned int a:20;
unsigned char b:4;
short c;
};
此時,test6的a、b共占用0,1,2共3字節(jié),c的k值為2,其實可以4位首位置,但是在結(jié)構(gòu)外,a要以int的方式對齊。也就是說連續(xù)兩個test6對象在內(nèi)存中寄存的話,a的首位置要保證為4的倍數(shù),那末c后面必須多填充2位。所以test6的大小為8個字節(jié)。
關(guān)于位段結(jié)構(gòu)的部份是比較復(fù)雜的。暫時我就知道這么多。
生活不易,碼農(nóng)辛苦
如果您覺得本網(wǎng)站對您的學(xué)習(xí)有所幫助,可以手機(jī)掃描二維碼進(jìn)行捐贈