
大家好,我是程序喵。

在知乎上看到一個(gè)好問題,精選了三個(gè)優(yōu)質(zhì)回答,分享給大家!
類型名稱不直觀,從size_t這個(gè)名字很難理解它的用處,使用時(shí)候還要特別留意是unsigned類型,而且在數(shù)數(shù)的時(shí)候可以用int或者unsigned 代替。這種類型的優(yōu)勢(shì)在哪里?
1
學(xué)過計(jì)算機(jī)組成原理應(yīng)該不會(huì)對(duì)此有疑問。int小于等于數(shù)據(jù)線寬度,size_t大于等于地址線寬度。
size_t存在的最大原因可能是因?yàn)椋旱刂肪€寬度歷史中經(jīng)常都是大于數(shù)據(jù)線寬度的。
在數(shù)據(jù)只有8位的年代,地址率先進(jìn)入10位,12位,在數(shù)據(jù)16位的年代,地址也已經(jīng)進(jìn)入了20位,24位。
目前的int普遍是32位,而size_t在主流平臺(tái)中都是64位。
size_t為什么存在?因?yàn)闊o論int還是unsigned都很可能小于size_t需要的大小,所以必須有個(gè)size_t。
補(bǔ)充:據(jù)說題主對(duì)_t有疑惑。
這個(gè)問題很簡(jiǎn)單,僅僅是因?yàn)樽髡哌x擇這樣的命名作為編碼規(guī)范而已。類型名與變量名共享相同的命名空間,所以通常需要在命名方面刻意區(qū)分出來。
在遙遠(yuǎn)的 C 時(shí)代,發(fā)明者很可能是想建議所有的類型名后面加_t,只不過這并沒有成為更普遍的編碼規(guī)范罷了。而現(xiàn)今Java的規(guī)范倒比較容易讓人接受:大寫開頭的是類型名,小寫開頭的是變量名跟函數(shù)名,雖然具體細(xì)則有不同,但原意都是一樣的:變量與類型共享同一個(gè)命名空間,因而需要在命名規(guī)則上刻意區(qū)分開來。
作者:pansz
https://www.zhihu.com/question/24773728/answer/210659978
2
之前在《內(nèi)存拷貝的注意事項(xiàng)》一文中提到過size_t,可能許多人對(duì)這個(gè)類型不太熟悉沒有用過或者根本不敢去用,最近看到一篇文章對(duì)這個(gè)類型講的比較詳細(xì),便翻譯過來讓不熟悉的同學(xué)可以知道它產(chǎn)生的原因以及如何使用。
原文地址:Why size_t matters(https://link.zhihu.com/?target=http%3A//web.archive.org/web/20101209143037/http%3A//www.eetimes.com/discussion/programming-pointers/4026076/Why-size-t-matters%3F)
前言:使用size_t可能會(huì)提高代碼的可移植性、有效性或者可讀性,或許同時(shí)提高這三者。
在標(biāo)準(zhǔn)C庫(kù)中的許多函數(shù)使用的參數(shù)或者返回值都是表示的用字節(jié)表示的對(duì)象大小,比如說malloc(n)
函數(shù)的參數(shù)n指明了需要申請(qǐng)的空間大小,還有memcpy(s1, s2,n)的最后一個(gè)參數(shù),表明需要復(fù)制的內(nèi)存大小,strlen(s)函數(shù)的返回值表明了以’\0’結(jié)尾的字符串的長(zhǎng)度(不包括’\0’),其返回值并不是該字符串的實(shí)際長(zhǎng)度,因?yàn)橐サ簟痋0’。
或許你會(huì)認(rèn)為這些參數(shù)或者返回值應(yīng)該被申明為int類型(或者long或者unsigned),但是事實(shí)上并不是。C標(biāo)準(zhǔn)中將他們定義為size_t。標(biāo)準(zhǔn)中記載malloc的申明應(yīng)該出現(xiàn)在,定義為:
void *malloc(size_t n);void *memcpy(void *s1, void const *s2, size_t n);size_t strlen(char const *s)
size_t還經(jīng)常出現(xiàn)在C++標(biāo)準(zhǔn)庫(kù)中,此外,C++庫(kù)中經(jīng)常會(huì)使用一個(gè)相似的類型size_type,用的可能比size_t還要多。
據(jù)我所知,大部分的C和C++程序員害怕這些庫(kù)使用size_t,因?yàn)樗麄儾恢纒ize_t代表什么或者為什么這些庫(kù)需要使用它,歸根結(jié)底,原因在于他們什么時(shí)候什么地方需要用到它。
可移植性問題
早期的C語言(由Brian Kernighan 和 Dennis Ritchie 在The C Programming Language書中所寫,Prentice-Hall, 1978)并沒有提供size_t類型,C標(biāo)準(zhǔn)委員會(huì)為了解決移植性問題將size_t引入,舉例如下:
讓我們來寫一個(gè)可移植的標(biāo)準(zhǔn)memcpy函數(shù),我們將會(huì)看到一些不同的申明和它們?cè)诓煌脚_(tái)不同大小的地址空間上編譯下的情況。
回憶memcpy(s1,s2,n)函數(shù),它將s2指向地址開始的n個(gè)字節(jié)拷貝到s2指向的地址,返回s1,這個(gè)函數(shù)可以拷貝任何數(shù)據(jù)類型,所以參數(shù)和返回值的類型應(yīng)該為可以指向任何類型的void*,同時(shí),源地址不應(yīng)該被改變,所以第二個(gè)參數(shù)s2類型應(yīng)該為const void*,這些都不是問題。
真正的問題在于我們?nèi)绾紊昝鞯谌齻€(gè)參數(shù),它代表了源對(duì)象的大小,我相信大部分程序員都會(huì)選擇int:
void *memcpy(void *s1, void const *s2, int n);使用int類型在大部分情況下都是可以的,但是并不是所有情況下都可以。int是有符號(hào)的,它可以表示負(fù)數(shù),但是,大小不可能是復(fù)數(shù)。所以我們可以使用unsigned int代替它讓第三個(gè)參數(shù)表示的范圍更大。
在大部分機(jī)器上,unsigned int的最大值要比int的最大值大兩倍,比如說再也給16位的機(jī)器上,unsigned int的最大值為65535,int的最大值為32767。
盡管int類型的大小依賴于C編譯器的實(shí)現(xiàn),但是在給定的平臺(tái)上int對(duì)象的大小和unsigned int對(duì)象的大小是一樣的。因此,使用unsigned int修飾第三個(gè)參數(shù)的代價(jià)與int是相同的:
void *memcpy(void *s1, void const *s2, unsigned int n);這樣似乎沒有問題了,unsigned int可以表示最大類型的對(duì)象大小了,這種情況只有在整形和指針類型具有相同大小的情況下,比如說在IP16中,整形和指針都占2個(gè)字節(jié)(16位),而在IP32上面,整形和指針都占4個(gè)字節(jié)(32位)。(參見下面C數(shù)據(jù)模型表示法)
C數(shù)據(jù)模型表示法
最近,我偶然發(fā)現(xiàn)幾篇文章,他們使用簡(jiǎn)明的標(biāo)記來表述不同目標(biāo)平臺(tái)下c語言數(shù)據(jù)的實(shí)現(xiàn)。我還沒有找到這個(gè)標(biāo)記的來源,正式的語法,甚至連名字都沒有,但他似乎很簡(jiǎn)單,即使沒有正規(guī)的定義也可以很容易使用起來。這些標(biāo)記的一邊形式形如:
I nI L nL LL nLL P nP。
其中每個(gè)大寫字母(或成對(duì)出現(xiàn))代表一個(gè)C的數(shù)據(jù)類型,每一個(gè)對(duì)應(yīng)的n是這個(gè)類型包含的位數(shù)。I代表int,L代表long,LL代表long long,以及P代表指針(指向數(shù)據(jù),而不是函數(shù))。每個(gè)字母和數(shù)字都是可選的。
例如,I16P32架構(gòu)支持16位int和32位指針類型,沒有指明是否支持long或者long long。如果兩個(gè)連續(xù)的類型具有相同的大小,通常省略第一個(gè)數(shù)字。例如,你可以將I16L32P32寫為I16LP32,這是一個(gè)支持16位int,32位long,和32位指針的架構(gòu)。
標(biāo)記通常把字母分類在一起,所以可以按照其對(duì)應(yīng)的數(shù)字升序排列。例如,IL32LL64P32表示支持32位int,32位long,64位long long和32位指針的架構(gòu);然而,通常寫作ILP32LL64。
不幸的是,這種memcpy的申明在I16LP32架構(gòu)上(整形是16-bit
長(zhǎng)整形和指針類型時(shí)32-bits)顯得不夠用了,比如說摩托羅拉第一代處理器68000,在這種情況下,處理器可能拷貝的數(shù)據(jù)大于65535個(gè)字節(jié),但是這個(gè)函數(shù)第三個(gè)參數(shù)n不能處理這么大的數(shù)據(jù)。
什么?你說很容易就可以改正?只需要把memcpy的第三個(gè)參數(shù)的類型修改一下:
void *memcpy(void *s1, void const *s2, unsigned long n);你可以在I16LP32目標(biāo)架構(gòu)上使用這個(gè)函數(shù)了,它可以處理更大的數(shù)據(jù)。而且在IP16和IP32平臺(tái)上效果也還行,說明它確實(shí)給出了memcpy的一種移植性較好的申明。但是,在IP16平臺(tái)上相比于使用unsigned int,你使用unsigned long可能會(huì)使你的代碼運(yùn)行效率大打折扣(代碼量變大而且運(yùn)行變慢)。
在標(biāo)準(zhǔn)C中規(guī)定,長(zhǎng)整形(無論無符號(hào)或者有符號(hào))至少占用32位,因此在IP16平臺(tái)上支持標(biāo)準(zhǔn)C的話,那么它一定是IP16L32平臺(tái)。這些平臺(tái)通常使用一對(duì)16位的字來實(shí)現(xiàn)32位的長(zhǎng)整形。在這種情況下,移動(dòng)一個(gè)長(zhǎng)整形需要兩條機(jī)器指令,每條移動(dòng)一個(gè)16位的塊。事實(shí)上,這個(gè)平臺(tái)上的大部分的32位操作都需要至上兩條指令。
因此,以可移植性為名將memcpy的第三個(gè)參數(shù)申明為unsigned long而降低某些平臺(tái)的性能是我們所不希望看到的。使用size_t可以有效避免這種情況。
size_t類型是一個(gè)類型定義,通常將一些無符號(hào)的整形定義為size_t,比如說unsigned int或者unsigned long,甚至unsigned long long。每一個(gè)標(biāo)準(zhǔn)C實(shí)現(xiàn)應(yīng)該選擇足夠大的無符號(hào)整形來代表該平臺(tái)上最大可能出現(xiàn)的對(duì)象大小。
使用size_t
size_t的定義在<stddef.h>, <stdio.h>, <stdlib.h>, <string.h>, <time.h>和<wchar.h>這些標(biāo)準(zhǔn)C頭文件中,也出現(xiàn)在相應(yīng)的C++頭文件, 等等中,你應(yīng)該在你的頭文件中至少包含一個(gè)這樣的頭文件在使用size_t之前。
包含以上任何C頭文件(由C或C++編譯的程序)表明將size_t作為全局關(guān)鍵字。包含以上任何C++頭文件(當(dāng)你只能在C++中做某種操作時(shí))表明將size_t作為std命名空間的成員。
根據(jù)定義,size_t是sizeof關(guān)鍵字(注:sizeof是關(guān)鍵字,并非運(yùn)算符)運(yùn)算結(jié)果的類型。所以,應(yīng)當(dāng)通過適當(dāng)?shù)姆绞铰暶鱪來完成賦值:
n = sizeof(thing);
考慮到可移植性和程序效率,n應(yīng)該被申明為size_t類型。類似的,下面的foo函數(shù)的參數(shù)也應(yīng)當(dāng)被申明為sizeof:
foo(sizeof(thing));
參數(shù)中帶有size_t的函數(shù)通常會(huì)含有局部變量用來對(duì)數(shù)組的大小或者索引進(jìn)行計(jì)算,在這種情況下,size_t是個(gè)不錯(cuò)的選擇。
適當(dāng)?shù)厥褂胹ize_t還會(huì)使你的代碼變得如同自帶文檔。當(dāng)你看到一個(gè)對(duì)象聲明為size_t類型,你馬上就知道它代表字節(jié)大小或數(shù)組索引,而不是錯(cuò)誤代碼或者是一個(gè)普通的算術(shù)值。
作者:盛夏光年https://www.zhihu.com/question/24773728/answer/66535663
3
ize_t和unsigned int有所不同,size_t的取值range是目標(biāo)平臺(tái)下最大可能的數(shù)組尺寸,一些平臺(tái)下size_t的范圍小于int的正數(shù)范圍,又或者大于unsigned int.
最典型的,在x64下,int還是4,但size_t是8.這意味著你在x64下最大可能開辟的數(shù)組尺寸是2^64.如果你使用int或者unsigned int,那么在x64下如果你的代碼中全部使用uint作為數(shù)組的尺寸標(biāo)記,那么你就會(huì)失去控制2^32尺寸以上的數(shù)組的機(jī)會(huì).雖然現(xiàn)在在x64上開辟一個(gè)大于2^32大小的連續(xù)數(shù)組依然是個(gè)不大可能的事情,但是..........
“640K內(nèi)存對(duì)于任何人來說都足夠了”----比爾蓋茨
作者:KE meng
https://www.zhihu.com/question/24773728/answer/28920149
C++學(xué)習(xí)資料免費(fèi)獲取方法:關(guān)注程序喵大人,后臺(tái)回復(fù)“程序喵”即可免費(fèi)獲取40萬字C++進(jìn)階獨(dú)家學(xué)習(xí)資料。

往期推薦