?? linux操作系統網絡驅動程序編寫.txt
字號:
Linux操作系統網絡驅動程序編寫
--------------------------------------------------------------------------------
第八軍團 時間:2004-1-17 22:10:20
工作需要寫了我們公司一塊網卡的Linux驅動程序。經歷一個從無到有的過程,
深感技術交流的重要。Linux作為挑戰微軟壟斷的強有力武器,日益受到大家的喜
愛。真希望她能在中國迅速成長。把程序文檔貼出來,希望和大家探討Linux技術
和應用,促進Linux在中國的普及。
本文可隨意轉載,但請不要在盈利性出版物上刊登。
Linux操作系統網絡驅動程序編寫
一.Linux系統設備驅動程序概述
1.1 Linux設備驅動程序分類
1.2 編寫驅動程序的一些基本概念
二.Linux系統網絡設備驅動程序
2.1 網絡驅動程序的結構
2.2 網絡驅動程序的基本方法
2.3 網絡驅動程序中用到的數據結構
2.4 常用的系統支持
三.編寫Linux網絡驅動程序中可能遇到的問題
3.1 中斷共享
3.2 硬件發送忙時的處理
3.3 流量控制(flow control)
3.4 調試
四.進一步的閱讀
五.雜項
一.Linux系統設備驅動程序概述
1.1 Linux設備驅動程序分類
Linux設備驅動程序在Linux的內核源代碼中占有很大的比例,源代碼的長度日
益增加,主要是驅動程序的增加。在Linux內核的不斷升級過程中,驅動程序的結構
還是相對穩定。在2.0.xx到2.2.xx的變動里,驅動程序的編寫做了一些改變,但是
從2.0.xx的驅動到2.2.xx的移植只需做少量的工作。
Linux系統的設備分為字符設備(char device),塊設備(block device)和網絡
設備(network device)三種。字符設備是指存取時沒有緩存的設備。塊設備的讀寫
都有緩存來支持,并且塊設備必須能夠隨機存取(random access),字符設備則沒有
這個要求。典型的字符設備包括鼠標,鍵盤,串行口等。塊設備主要包括硬盤軟盤
設備,CD-ROM等。一個文件系統要安裝進入操作系統必須在塊設備上。
網絡設備在Linux里做專門的處理。Linux的網絡系統主要是基于BSD unix的socket
機制。在系統和驅動程序之間定義有專門的數據結構(sk_buff)進行數據的傳遞。系
統里支持對發送數據和接收數據的緩存,提供流量控制機制,提供對多協議的支持。
1.2 編寫驅動程序的一些基本概念
無論是什么操作系統的驅動程序,都有一些通用的概念。操作系統提供給驅動
程序的支持也大致相同。下面簡單介紹一下網絡設備驅動程序的一些基本要求。
1.2.1 發送和接收
這是一個網絡設備最基本的功能。一塊網卡所做的無非就是收發工作。所以驅
動程序里要告訴系統你的發送函數在哪里,系統在有數據要發送時就會調用你的發
送程序。還有驅動程序由于是直接操縱硬件的,所以網絡硬件有數據收到最先能得
到這個數據的也就是驅動程序,它負責把這些原始數據進行必要的處理然后送給系
統。這里,操作系統必須要提供兩個機制,一個是找到驅動程序的發送函數,一個
是驅動程序把收到的數據送給系統。
1.2.2 中斷
中斷在現代計算機結構中有重要的地位。操作系統必須提供驅動程序響應中斷
的能力。一般是把一個中斷處理程序注冊到系統中去。操作系統在硬件中斷發生后
調用驅動程序的處理程序。Linux支持中斷的共享,即多個設備共享一個中斷。
1.2.3 時鐘
在實現驅動程序時,很多地方會用到時鐘。如某些協議里的超時處理,沒有中
斷機制的硬件的輪詢等。操作系統應為驅動程序提供定時機制。一般是在預定的時
間過了以后回調注冊的時鐘函數。在網絡驅動程序中,如果硬件沒有中斷功能,定
時器可以提供輪詢(poll)方式對硬件進行存取。或者是實現某些協議時需要的超時
重傳等。
二.Linux系統網絡設備驅動程序
2.1 網絡驅動程序的結構
所有的Linux網絡驅動程序遵循通用的接口。設計時采用的是面向對象的方法。
一個設備就是一個對象(device 結構),它內部有自己的數據和方法。每一個設備的
方法被調用時的第一個參數都是這個設備對象本身。這樣這個方法就可以存取自身
的數據(類似面向對象程序設計時的this引用)。
一個網絡設備最基本的方法有初始化、發送和接收。
------------------- ---------------------
|deliver packets | |receive packets queue|
|(dev_queue_xmit())| |them(netif_rx()) |
------------------- ---------------------
| | / \
\ / | |
-------------------------------------------------------
| methods and variables(initialize,open,close,hard_xmit,|
| interrupt handler,config,resources,status...) |
-------------------------------------------------------
| | / \
\ / | |
----------------- ----------------------
|send to hardware | |receivce from hardware|
----------------- ----------------------
| | / \
\ / | |
-----------------------------------------------------
| hardware media |
-----------------------------------------------------
初始化程序完成硬件的初始化、device中變量的初始化和系統資源的申請。發送
程序是在驅動程序的上層協議層有數據要發送時自動調用的。一般驅動程序中不對發
送數據進行緩存,而是直接使用硬件的發送功能把數據發送出去。接收數據一般是通
過硬件中斷來通知的。在中斷處理程序里,把硬件幀信息填入一個skbuff結構中,然
后調用netif_rx()傳遞給上層處理。
2.2 網絡驅動程序的基本方法
網絡設備做為一個對象,提供一些方法供系統訪問。正是這些有統一接口的方法,
掩蔽了硬件的具體細節,讓系統對各種網絡設備的訪問都采用統一的形式,做到硬件
無關性。
下面解釋最基本的方法。
2.2.1 初始化(initialize)
驅動程序必須有一個初始化方法。在把驅動程序載入系統的時候會調用這個初
始化程序。它做以下幾方面的工作。檢測設備。在初始化程序里你可以根據硬件的
特征檢查硬件是否存在,然后決定是否啟動這個驅動程序。配置和初始化硬件。在
初始化程序里你可以完成對硬件資源的配置,比如即插即用的硬件就可以在這個時
候進行配置(Linux內核對PnP功能沒有很好的支持,可以在驅動程序里完成這個功
能)。配置或協商好硬件占用的資源以后,就可以向系統申請這些資源。有些資源是
可以和別的設備共享的,如中斷。有些是不能共享的,如IO、DMA。接下來你要初始
化device結構中的變量。最后,你可以讓硬件正式開始工作。
2.2.2 打開(open)
open這個方法在網絡設備驅動程序里是網絡設備被激活的時候被調用(即設備狀
態由down-->up)。所以實際上很多在initialize中的工作可以放到這里來做。比如資
源的申請,硬件的激活。如果dev->open返回非0(error),則硬件的狀態還是down。
Open方法另一個作用是如果驅動程序做為一個模塊被裝入,則要防止模塊卸載時
設備處于打開狀態。在open方法里要調用MOD_INC_USE_COUNT宏。
2.2.3 關閉(stop)
close方法做和open相反的工作。可以釋放某些資源以減少系統負擔。Close是在
設備狀態由up轉為down時被調用的。另外如果是做為模塊裝入的驅動程序,close里
應該調用MOD_DEC_USE_COUNT,減少設備被引用的次數,以使驅動程序可以被卸載。
另外close方法必須返回成功(0==success)。
2.2.4 發送(hard_start_xmit)
所有的網絡設備驅動程序都必須有這個發送方法。在系統調用驅動程序的xmit
時,發送的數據放在一個sk_buff結構中。一般的驅動程序把數據傳給硬件發出去。
也有一些特殊的設備比如loopback把數據組成一個接收數據再回送給系統,或者
dummy設備直接丟棄數據。
如果發送成功,hard_start_xmit方法里釋放sk_buff,返回0(發送成功)。如果
設備暫時無法處理,比如硬件忙,則返回1。這時如果dev->tbusy置為非0,則系統
認為硬件忙,要等到dev->tbusy置0以后才會再次發送。Tbusy的置0任務一般由中斷
完成。硬件在發送結束后產生中斷,這時可以把tbusy置0,然后用mark_bh()調用通
知系統可以再次發送。在發送不成功的情況下,也可以不置dev->tbusy為非0,這樣
系統會不斷嘗試重發。如果hard_start_xmit發送不成功,則不要釋放sk_buff。
傳送下來的sk_buff中的數據已經包含硬件需要的幀頭。所以在發送方法里不需
要再填充硬件幀頭,數據可以直接提交給硬件發送。Sk_buff是被鎖住的(locked),
確保其他程序不會存取它。
2.2.5 接收(reception)
驅動程序并不存在一個接收方法。有數據收到應該是驅動程序來通知系統的。
一般設備收到數據后都會產生一個中斷,在中斷處理程序中驅動程序申請一塊
sk_buff(skb),從硬件讀出數據放置到申請好的緩沖區里。接下來填充sk_buff中
的一些信息。Skb->dev = dev,判斷收到幀的協議類型,填入skb->protocol(多協
議的支持)。把指針skb->mac.raw指向硬件數據然后丟棄硬件幀頭(skb_pull)。還要
設置skb->pkt_type,標明第二層(鏈路層)數據類型。可以是以下類型:
PACKET_BROADCAST : 鏈路層廣播
PACKET_MULTICAST : 鏈路層組播
PACKET_SELF : 發給自己的幀
PACKET_OTHERHOST : 發給別人的幀(監聽模式時會有這種幀)
最后調用netif_rx()把數據傳送給協議層。Netif_rx()里數據放入處理隊列然后返
回,真正的處理是在中斷返回以后,這樣可以減少中斷時間。調用netif_rx()以后,
驅動程序就不能再存取數據緩沖區skb。
2.2.6 硬件幀頭(hard_header)
硬件一般都會在上層數據發送之前加上自己的硬件幀頭,比如以太網(Ethernet)
就有14字節的幀頭。這個幀頭是加在上層ip、ipx等數據包的前面的。驅動程序提供
一個hard_header方法,協議層(ip、ipx、arp等)在發送數據之前會調用這段程序。
硬件幀頭的長度必須填在dev->hard_header_len,這樣協議層回在數據之前保留好
硬件幀頭的空間。這樣hard_header程序只要調用skb_push然后正確填入硬件幀頭就
可以了。
在協議層調用hard_header時,傳送的參數包括(2.0.xx):數據的sk_buff,
device指針,protocol,目的地址(daddr),源地址(saddr),數據長度(len)。數據
長度不要使用sk_buff中的參數,因為調用hard_header時數據可能還沒完全組織好。
Saddr是NULL的話是使用缺省地址(default)。Daddr是NULL表明協議層不知道硬件目
的地址。如果hard_header完全填好了硬件幀頭,則返回添加的字節數。如果硬件幀
頭中的信息還不完全(比如daddr為NULL,但是幀頭中需要目的硬件地址。典型的情
況是以太網需要地址解析(arp)),則返回負字節數。Hard_header返回負數的情況
下,協議層會做進一步的build header的工作。目前Linux系統里就是做arp
(如果hard_header返回正,dev->arp=1,表明不需要做arp,返回負,dev->arp=0,
做arp)。
對hard_header的調用在每個協議層的處理程序里。如ip_output。
2.2.7 地址解析(xarp)
有些網絡有硬件地址(比如Ethernet),并且在發送硬件幀時需要知道目的硬件
地址。這樣就需要上層協議地址(ip、ipx)和硬件地址的對應。這個對應是通過地址
解析完成的。需要做arp的的設備在發送之前會調用驅動程序的rebuild_header方
法。調用的主要參數包括指向硬件幀頭的指針,協議層地址。如果驅動程序能夠解
析硬件地址,就返回1,如果不能,返回0。
對rebuild_header的調用在net/core/dev.c的do_dev_queue_xmit()里。
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -