?? awk最新教程.txt
字號:
執行后每一次回車都將顯示一個字符串string,該字符串是由awk中的print語句顯示的,其中變量bb的值通過后面的bb=$aa引入。對于漢字字符串的賦值在SCO Unix3.0上運行時還需注意,多個賦值語句,使用漢字字符串的語句應放在后面(在5.0上沒有這種情況): aa=“計算機使用指南” bb=“computer guide” awk '{ print cc dd }' cc=$bb dd=$aa filename數據的處理是以“記錄”(recoder)為單位的,也就是awk在做處理時,是一個記錄一個記錄地處理。每個記錄的缺省值是一行(line),一個記錄又被分為多個字段(fields)。 記錄與記錄之間是以記錄分隔符(record separator)隔開的,其缺省值是文件中的換行符(newline character),因此在缺省狀態下輸入數據的每一行是一個記錄。記錄分隔符隨著內部變量RS的改變而改變。RS 是一個字串,如“|”。它的缺省值是“\n“。僅有 RS的第一個字符是有效的,而其它字符會被忽略。內部變量FNR會儲存目前的輸入文件已經被讀取的記錄的個數。內部變量NR會儲存目前為止所有的輸入文件已經被讀取記錄的個數。 awk會自動將每個記錄按缺省值分解成多個字段 (field)。awk的缺省動作會認為字段之間是以whitespace為分隔的。這里,whitespace的意思是一個或多個空格或 tabs。 在 awk程序里面,以'$1'表示第一個字段,'$2'表示第二個字段,依此類推。舉個例子,假設輸入的一行如下所示: This seems like a pretty nice example.第一個字段或 $1 是'This',第二個字段或 $2 是 'seems',依此類推。有個地方需要特別注意,第七個字段或 $7 是'example.'而非'example'。不論有多少字段,$NF可用來表示一個記錄的最后一個字段。以上面的例子為例,$NF與 $7 相同,也就是'example.'。 NF是一個內部變量,它的值表示目前這個記錄含有字段的個數。 $0,看起來好像是第零個字段,它是一個特例,它表示整個記錄。 下面是一個較復雜的例子: awk '$1~/foo/ { print $0 }' Earth這個例子是把輸入文件'Earth'的每個記錄的第一個字段作檢查,如果它含有子字串'foo',則這一個記錄會被輸出。 如何將記錄分解成字段 awk 根據 field separator(字段分隔符)將一個記錄分解成若干字段。field separator以內部變量FS表示。舉個例子,假如 field separator 是'oo',則下面的行: moo goo gai pan 會被分成三個字段:'m'、' g'、' gai pan'。 在 awk 程序里,可以使用'='來改變FS的值。 例如: awk 'BEGIN { FS="," }; { print $2 }' 輸入行如下: John Q. Smith, 29 Oak St., Walamazoo, MI 42139 執行awk的結果將輸出字符串 ' 29 Oak St.'(將第二個字段打印出)。BEGIN 后面的 action 會在第一個記錄被讀取之前執行一次。
4.1.2 輸出
在awk程序里,actions最常做的事就是輸出(printing)。簡單的輸出,使用 print描述。復雜格式的輸出,使用 printf描述。 1)int語句print語句用在簡單、標準的輸出格式。格式:print var1,[ var2,……],str1,[str2,……,strn ]說明:在print語句后面,可以跟變量或字符串,變量或字符串可以有多個,語句執行后,跟在print語句后面的變量值或字符串將被顯示到屏幕上。多個變量或字符串之間可以是逗號“,” 或空格,使用逗號時,顯示出的各個字符串之間會有設定的輸出字段分割符。;使用空格時,顯示出的各個字符串將連接起來,形成一個長的字符串。 如:echo “fir sec thir four five”|awk ‘{ print $1,$2,$3,$4 }’ 其執行結果為fir sec thir four 而:echo “fir sec thir four five”|awk ‘{ print $1 $2 $3 $4 }’ 的結果為firsecthirfourprint語句輸出后自動換行,如有第二個顯示語句,將從下一行輸出。如果 'print'描述之后沒有跟著任何東西,它與'print $0'的效果一樣,它會輸出現在的記錄(record)。要輸出空白行可使用'print ""'。輸出一段固定的文字,可用雙引號將文字的兩邊括起來,例如'print "Hello there"'。下面的例子,會把每個輸入記錄的前二個字段輸出: awk '{ print $1,$2 }' shipped2) 輸出分隔符前面我們已提過print語句后面多個輸出字段(變量)之間可以用逗點使輸出分隔開來,事實上,你可以任何設定你所需要的輸出分隔符,OFS 就是用來設定輸出分隔符的內部變量。其缺省值為空格。下面這個例子會輸出每個記錄的第一個字段和第二個字段,此二個字段之間在輸出時是以分號';'分開的,每行輸出之后會加入一個空白行。 awk 'BEGIN { OFS=";" ; ORS="\n\n" } {print $1, $2}' earth3) printf語句printf語句會使得輸出格式較容易精確地控制。printf語句可以指定每個item輸出的寬度,也可以指定數字的各種格式。 printf語句的格式如下: printf format, item1, item2, ...如:printf "%4s%10s%10s\n","str1","str2","str3"或:printf ("%4s%10s%10s\n","str1","str2","str3")print與 printf的差別是在于format,printf的參數比print多了字符串 format。format的格式與 C語言 中的 printf語句格式相同。 printf并不會做自動換行的動作。內部變量 OFS與 ORS對printf語句沒有任何影響。格式的指定以字符'%'開始,后面接著格式控制字母。 格式控制字母如下所示:'c' 將數字以 ASCII 字符輸出。 例如 'printf "%C",65'會輸出字符'A'。'd' 輸出十進位的整數。'e' 將數字以科學記數的形式輸出。 例如 printf "%4.3e",1950 結果會輸出'1.950e+03'。'f' 將數字以浮點的形式輸出。 'g' 將數字以科學記數的形式或浮點的形式輸出。數字的絕對值如果大于 等于0.0001則以浮點的形式輸出,否則以科學符號的形式輸出。 'o' 輸出無符號的八進位整數。 's' 輸出一個字串。'x' 輸出無符號的十六進位整數。10至15以'a'至'f'表示。 'X' 輸出無符號的十六進位整數。10至15以'A'至'F"表示。 '%' 它并不是真正的格式控制字母,”%%"將輸出‘%'。 在 % 與格式控制字母之間可加入 modifier,是用來進一步控制輸出的格式。可能的 modifier如下所示: 'width' 這一個數字指示相對應的字段輸出時的寬度。例如: '-' 使用在 width 之前,指明是向左靠齊。如果'-'沒有出現,則會在被指定的寬度向右靠齊。例如:printf "%-6s", "foo" 會輸出'foo '。 printf "%6s","foo" 會輸出' foo'。 width 的值是一個最小寬度而非最大寬度。如果一個 item 的值需要的寬度比 width 大,則不受 width 的影響。例如 printf "%4s","foobar" 將輸出'foobar'。 '.prec' 此數字指定輸出時的精確度。它指定小數點右邊的位數。如果是要輸出一個字串,它指定此字串最多會被輸出多少個字符。
4.2 控制語句在 awk 程序里面,控制語句諸如 if、while等的使用與 C語言類似。很多的控制語句會包括其它的語句,被包括的語句稱為程序體(body)。假如body里面包括一個以上的語句,必須以大括弧 { } 將這些語句括起來(這與Shell的語法有所區別),而各個語句之間需以換行(newline)或分號隔開。 1) if語句語法:if ( 條件 ) { body1 } [ else { body2 } ]其中,if,else 是關鍵字,如果使用必須保留,程序體中可以有多條語句。如果條件(condition)為真(true),則執行程序體1中的語句,否則執行程序體2。例1: if ( x == 0) #變量x是否為0 print "x equal zero" #為0則打印"x equal zero" else #否則 print "x not equal zero" #則打印"x not equal zero" 當然也可以只要“if部分”而不使用“else部分”如例2: if ( x == 0 ) { print "x equal zero" x=x+1 } 說明:if中的程序體通常要用大括號括起來,但在有些情況下可以省略。如在例1中,不論在if后面還是else后面,過程體中總共只有一句,在這中情況下就不需要使用大括號。而在例2中,if后面過程體中的語句多于一句,就必須使用大括號,否則意義會有所區別。 2)while語句語法:while ( 條件 ) { body }while 語句執行后所做的第一件事就是測試‘條件’是否為真。為真則執行 body 中的語句,執行完后,再進行測試,如‘條件’仍為真,則 body 會被再度執行。這個過程會一直被重復直到‘條件’不再為真。如果‘條件’的第一次測試就是假(false),則body 會被跳過去,程序將執行后面的語句。通常body中的語句都會改變條件中所使用變量的值,或當達到某個條件后跳出循環,否則,while語句將會無限執行下去,出現所謂的死循環。下面的例子會輸出每個輸入記錄(record)的前三個字段。 awk '{ i=1 while (i <= 3) { printf(“%s”,$i) i++ } print “” #換行 }'3)do-while 語句語法:do body while ( 條件 ) do-while 語句執行時,不管條件成立與否,都首先執行程序體(body)一次,然后再判斷是否為真,為真則會重復執行 body,否則退出do-while循環語句。 下面的例子會將每個輸入記錄輸出十次。 awk '{ i= 1 do { print $0 i++ } while (i <= 10) }' 文件名4)for 語句 語法:for (賦初值;條件;動作) { body } 此語句開始時會執行初始賦值(initialization),然后比較條件是否為真,只要條件(condition)為真,就執行‘動作’和body,然后重新判斷條件,重新執行,直到條件為假為止。 下面的例子會輸出每個輸入記錄的前三個字段。 awk '{ for (i=1; i<=3; i++) printf("%s ",$i) print "" #換行 }' 文件名5)break 語句break 語句用于跳出包含它的 for、while、do-while 語句的當前循環。下面的例子能夠對任意輸入的自然數做出以下判斷: a. 求出其最小除數 b. 判斷其是否為質數。 awk '{ num=$1 for (div=2; div*div <=num; div++) { if ( num % div == 0 ) break #當整除時跳出for循環 } if ( num % div == 0 ) printf "%d 最小的除數是 %d\n", num, div else printf "%d 是質數\n", num }'6)continue 語句continue 語句使用于 for、while、do-while 循環內部,它會跳過循環 body 的剩余部分,使得它立刻進行下一次循環的執行。 下面的例子會輸出 0 至 20 的全部數字,但是 5 并不會被輸出。 awk 'BEGIN { for (x=0; x<=20; x++) { if (x==5) continue #當x為5時跳過下面的printf語句,進入下次循環 printf ("%d ",x) } }' 7) next 語句、next file 語句、exit 語句next 語句強迫 awk 立刻停止處理目前的記錄(record)而繼續下一個記錄的處理。 next file類似 next。然而,它強迫 awk 立刻停止處理目前的文件。exit 語句會使得 awk 程序停止執行而跳出。然而,如果END 出現,它會去執行 END 中的 actions(動作)。
第五章 內部函數(Built-in Functions)
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -