大家好,我是飛哥!
經(jīng)常在后臺(tái)收到讀者的交流,Linux 源碼那么龐大,飛哥你是如何讀的呢?由于問這個(gè)問題的太多,我想有必要專門寫一篇文章聊一聊。
首先,我先說一點(diǎn),其實(shí)我本人不是搞內(nèi)核相關(guān)工作的。我和大多數(shù)同學(xué)都一樣,從事的也是應(yīng)用層上的開發(fā),負(fù)責(zé)的是后端模塊。
那我為什么要研究源碼這個(gè)之前我說過,是因?yàn)槲以诙嗄甑墓ぷ髦杏龅降暮芏鄦栴}都是底層相關(guān)的。不深入底層看一看,感覺永遠(yuǎn)是在隔靴撓癢,永遠(yuǎn)理解不到問題的本質(zhì)。(這里說的底層其實(shí)也不只是包括 Linux 內(nèi)核,還包括一些硬件的組成原理啥的)。
飛哥走過的彎路
雖然咱們今天的主題是源碼,不過我并不建議你一開始就陷入到源碼里,這也是我走過的彎路。
在我剛開始想深入挖掘網(wǎng)絡(luò)性能的時(shí)候,我買來了《深入理解 LINUX 內(nèi)核》《深入理解 Linux 網(wǎng)絡(luò)技術(shù)內(nèi)幕》等幾本書。這本書里介紹了內(nèi)核中各個(gè)組件,如網(wǎng)卡設(shè)備、鄰居子系統(tǒng)、路由等,把相關(guān)源碼都講了一遍。
我啃了好長時(shí)間,但結(jié)果是看完以后感覺還是一團(tuán)漿糊。尤其是到了工作中具體的一個(gè)實(shí)際問題的時(shí)候,發(fā)現(xiàn)根本還是理解不了網(wǎng)絡(luò)模塊到底是怎么運(yùn)作的。比如一個(gè)包到底是如何從網(wǎng)卡到應(yīng)用程序中的,這些書看半天還是弄不明白這個(gè)問題。就更別提后續(xù)搞一些網(wǎng)絡(luò)優(yōu)化的事情了。
到了后來,我改變了戰(zhàn)術(shù),才算是柳暗花明又一村,找到了真正正確、高效的方法。
產(chǎn)生問題
我所找到的正確方法就是,以工作中的實(shí)際問題為核心。
回頭想想我們看源碼的目的是啥呢,是要把 Linux 搞明白?我想不是,把 Linux 搞明白只是途徑,而我們的真正目的是為了提高我們手頭的工作。
比如,我想觀察我的服務(wù)中 Linux 的收包的過程是否出現(xiàn)了問題,以及想嘗試在這個(gè)接收過程中都有哪些優(yōu)化方法。基于這個(gè)工作中的需求出發(fā),然后我就四處開始翻資料,打算要把 Linux 是如何接收和處理一個(gè)網(wǎng)絡(luò)包徹底搞搞清楚。包括我之前看過的源碼的書,也查了好多網(wǎng)絡(luò)上的文章。最后終于摸出了個(gè)十之八九,總結(jié)出了圖解Linux網(wǎng)絡(luò)包接收過程。
再比如我手頭的項(xiàng)目中很多地方需要維持長連接,那么我就想搞明白一臺(tái) Linux 服務(wù)器最多能支撐多少個(gè) TCP 連接?這種問題更是,幾乎沒有任何書,任何資料,任何文章能給一個(gè)讓我滿意的答案。這個(gè)時(shí)候光翻源碼,看網(wǎng)絡(luò)上的技術(shù)文也是遠(yuǎn)遠(yuǎn)不夠的,我動(dòng)手寫了不少測試代碼,親手進(jìn)行實(shí)踐。寫出了
漫畫|一臺(tái)Linux服務(wù)器最多能支撐多少個(gè)TCP連接? 漫畫 | 理解了TCP連接的實(shí)現(xiàn)以后,客戶端的并發(fā)也爆發(fā)了! 百看不如一練,動(dòng)手測試單機(jī)百萬連接的保姆級(jí)教程!
再比如有同學(xué)問了我,127.0.0.1 是如何進(jìn)行網(wǎng)絡(luò)包收發(fā)的,和跨機(jī) IO 相比,能節(jié)約哪些開銷?為了解開這個(gè)疑問,我翻了源碼又寫出了127.0.0.1 之本機(jī)網(wǎng)絡(luò)通信過程知多少 ?!
但其實(shí)我所關(guān)注的點(diǎn)并不都在內(nèi)核源碼上。比如在我前期的一些文章里,我想弄明白訪問內(nèi)存的速度。我研究了 L1、L2、L3。還調(diào)研了內(nèi)存的工作原理。隨后發(fā)現(xiàn)了內(nèi)存在隨機(jī) IO 的時(shí)候也是會(huì)比順序IO要慢幾倍的。后來我想搞明白固態(tài)硬盤和機(jī)械硬盤的速度差異,我又去分析了固態(tài)硬盤的物理構(gòu)成。而且所有的這些我都搭配了實(shí)際的性能測試。
今天的重點(diǎn)并不是給大家介紹這些文章,我想表達(dá)的意思是,產(chǎn)生問題非常重要。
這些問題最好是能和你手工工作相關(guān),因?yàn)檫@樣你后期才能在工作中進(jìn)行應(yīng)用和提升。我覺得只有有用的技術(shù),才是真正有價(jià)值的技術(shù)。至于說硬件組成原理,內(nèi)核源碼,極客時(shí)間上的一些優(yōu)秀的網(wǎng)課,都是解決這些問題是的工具而已。
源碼閱讀方法
在解決問題的時(shí)候,內(nèi)核源碼確實(shí)是很重要的一塊,也是我們今天介紹的主題。看代碼我覺得有兩個(gè)方法,可以用地毯式的轟炸和精確制導(dǎo)來類比。
地毯式轟炸
地毯式轟炸就是不管三七二十一,把內(nèi)核所有的源碼全部硬啃一遍。各個(gè)組件都進(jìn)去看一看,了解了解。
除非你本身就是搞內(nèi)核相關(guān)的工作的,否則我是不推薦大家去把內(nèi)核源碼通讀一遍的。這也是我前面和大家講過的我走的彎路。因?yàn)檫@樣搞有如下的缺點(diǎn):
第一,我們大部分的讀者都是已經(jīng)工作了的同學(xué)。你沒有學(xué)生時(shí)代那么大塊的時(shí)間去整塊整塊的啃。
第二,即使你啃完了,你和手頭的工作還是聯(lián)系不起來。前面我說過,我啃完了《深入理解 Linux 網(wǎng)絡(luò)技術(shù)內(nèi)幕》,仍然連網(wǎng)絡(luò)包是如何從網(wǎng)卡到用戶進(jìn)程里的還是沒搞明白。
這就好比在戰(zhàn)場上,動(dòng)用大量的武器彈藥進(jìn)行狂轟濫炸。這種方法非常浪費(fèi)彈藥,而且很有可能還沒有炸到關(guān)鍵的碉堡。
精確制導(dǎo)
這個(gè)是我所推薦的方法。前面不是說過,我們一定要先產(chǎn)生一個(gè)問題么。那么我們看源碼的目標(biāo)就是要精確制導(dǎo)消滅這個(gè)對(duì)象。
等我們進(jìn)入到內(nèi)核源碼里的時(shí)候,你會(huì)發(fā)現(xiàn)這里面邏輯關(guān)系錯(cuò)綜復(fù)雜。如果每一個(gè)邏輯你都想鉆進(jìn)去弄個(gè)明白,最后可能就是累死在內(nèi)核源碼的迷宮里了。
所以我們在看源碼的時(shí)候,要時(shí)刻牢記我們要消滅的問題是啥。如果某段邏輯和你要解決的問題無關(guān),那就直接繞過去,繞過去,不要戀戰(zhàn)!
你在我的文章里應(yīng)該也能發(fā)現(xiàn),我雖然會(huì)貼內(nèi)核源碼,但是絕大部分的源碼都包含省略號(hào)。這些就是我覺得和當(dāng)前主題無關(guān)的源碼,所以我都躲著它們走。
比如在介紹內(nèi)核發(fā)送數(shù)據(jù)過程的時(shí)候,我介紹到 inet_sendmsg,我是這樣展示的的。
//file: net/ipv4/af_inet.c
int inet_sendmsg(......)
{
......
return sk->sk_prot->sendmsg(iocb, sk, msg, size);
}
而實(shí)際上,內(nèi)核的源碼長的是這樣的。
int inet_sendmsg(struct kiocb *iocb, struct socket *sock, struct msghdr *msg,
size_t size)
{
struct sock *sk = sock->sk;
sock_rps_record_flow(sk);
/* We may need to bind the socket. */
if (!inet_sk(sk)->inet_num && !sk->sk_prot->no_autobind &&
inet_autobind(sk))
return -EAGAIN;
return sk->sk_prot->sendmsg(iocb, sk, msg, size);
}
省略掉的這段邏輯我認(rèn)為和我要解決的問題關(guān)系很小,所以都被我繞開了。
每次通過這種方法解決掉你的一個(gè)問題的時(shí)候,你就以點(diǎn)狀的形式在洞穿理解了內(nèi)核某一片的邏輯。等當(dāng)你解決掉很多問題的時(shí)候,點(diǎn)會(huì)逐漸的連成面。這時(shí)候反而能得到更全面的,更深刻的理解。
小結(jié)一下,要時(shí)刻記住要消滅的問題是啥,無關(guān)的代碼能繞開就都繞開。
吾生有涯,而知無涯,我們只挑對(duì)我們有用的進(jìn)行學(xué)習(xí)。
一些工具
這里再介紹幾個(gè)我看源碼時(shí)用到的工具。
Linux 源碼
可能有些同學(xué)還不知道到哪兒去下,這里我把地址列出來。
下載地址:https://mirrors.edge.kernel.org/pub/linux/kernel/
不過有同學(xué)表示上述地址有的時(shí)候訪問不了,所以我也把我文章中用到的 3.10 的源碼放到網(wǎng)盤里了。
鏈接:https://pan.baidu.com/s/144BlNXwrY3iAxKRbX7oHeg
提取碼:iqrr
在線源碼
如果你只是臨時(shí)想看某一個(gè)函數(shù),這個(gè)時(shí)候可能沒有必要去下載完整的源碼。那用它就再合適不過了。bootlin 網(wǎng)站:http://elixir.bootlin.com/
假如我想搜 __alloc_skb 這個(gè)函數(shù)是在哪兒定義的,在哪兒被使用的。那就在這個(gè)網(wǎng)站的右上角搜索這個(gè)函數(shù)名。結(jié)果如下:
VSCode
我看源碼習(xí)慣用它,跳轉(zhuǎn)啥的都比較方便。安裝啥的我就不介紹了,大家自己去搜。我這里介紹幾個(gè)我常用的用法
查找函數(shù)聲明、定義、引用
這個(gè)是最常用的,只需要在函數(shù)名上點(diǎn)右鍵,在菜單里就選擇相應(yīng)的功能點(diǎn)就可以了。
返回上一次瀏覽位置
在跳轉(zhuǎn)了幾次以后,你很有可能想回到原來函數(shù)的位置繼續(xù)查看下面的代碼。這個(gè)時(shí)候只需要用快捷鍵即可,Mac 下使用 ctrl + -,Windows 下使用 Alt + ← 。按幾次,就返回幾次。
打開指定文件
Linux 的目錄多,而且目錄下的文件也太多。有的時(shí)候即使你知道源碼在哪個(gè)目錄下,可能還是得翻半天才能找到。如果你明確知道源碼文件的位置,那么可以直接打開它就行。
比如 tcp 的關(guān)鍵接收入口函數(shù) tcp_v4_rcv,它在 net/ipv4/tcp_ipv4.c 這個(gè)文件下(我的文章里我盡量會(huì)把每一個(gè)函數(shù)所處的位置都標(biāo)清楚)。
那么如果你想快速打開這個(gè)函數(shù),那么你按下快捷鍵 cmd + p(Windows 下 ctrl + p)。直接輸入 tcp_ipv4.c 這個(gè)文件名就可以了。
我常用的就這么幾個(gè),如果想看所有的快捷鍵,那就 cmd + k,接著再 cmd + s (Windows 下是 ctrl + k, ctrl +s)可以查看到所有的快捷鍵。
總結(jié)一下
不知道大家有沒有聽說過“勢 道 術(shù)”。
勢是未來發(fā)展的大勢 道是事物背后的規(guī)律 術(shù)是技術(shù)層面的操作方法
很明顯這三個(gè)層次里越靠前是越牛的。我這里套用一個(gè)這個(gè)概念,今天其實(shí)給大家分享了兩個(gè)層次的東西。
在術(shù)的層面,我分享了我是怎么看 Linux 源碼的,在哪兒下載源碼,用的什么工具,按的什么快捷鍵。不過我覺得這個(gè)不是最重要的。
在道的層面,學(xué)習(xí)技術(shù)最主要的目的是要能解決我們手頭工作中的問題,明確你要解決的問題之后,精確制導(dǎo),把所有的精力都圍繞著這個(gè)問題進(jìn)行。至于說底層的硬件組成原理也好,內(nèi)核源碼也罷,極客時(shí)間上的優(yōu)秀網(wǎng)課,都只不過是我在解決這些問題是的工具而已。不要本末倒置了,學(xué)以致用,學(xué)的目的就是用。
有的讀者和我反饋說,很多知識(shí)自己也不是沒看過,但是看過就忘。其實(shí)我覺得這里面可能主要的原因就是沒有和手頭的工作結(jié)合起來,沒有用起來。如果你用這些知識(shí)解決過自己的工作中的實(shí)際問題,甚至是有過性能優(yōu)化之類的經(jīng)驗(yàn),我想這樣你學(xué)過的東西是忘不了的。
最后,歡迎大家加我個(gè)人微信, zhangyanfei748527 , 我們多多交流,共同成長!