?? regular expression and gnu grep

?? linux下的命令
字號:
1.	grep簡介grep （global search regular expression(RE) and print out the line,全面搜索正則表達式并把行打印出來）是一種強大的文本搜索工具，它能使用正則表達式搜索文本，并把匹配的行打印出來。Unix的grep家族包括grep、egrep和fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的擴展，支持更多的re元字符， fgrep就是fixed grep或fast grep，它們把所有的字母都看作單詞，也就是說，正則表達式中的元字符表示回其自身的字面意義，不再特殊。linux使用GNU版本的grep。它功能更強，可以通過-E、-F命令行選項來使用egrep和fgrep的功能。grep的工作方式是這樣的，它在一個或多個文件中搜索字符串模板。如果模板包括空格，則必須被引用，模板后的所有字符串被看作文件名。搜索的結果被送到屏幕，不影響原文件內容。grep可用于shell腳本，因為grep通過返回一個狀態值來說明搜索的狀態：a.如果模板搜索成功，則返回0；b.如果搜索不成功，則返回1；c.如果搜索的文件不存在，則返回2；我們利用這些返回值就可進行一些自動化的文本處理工作。a.在grep命令中輸入字符串參數時，最好將其用雙引號括起來。例如: “mystring”。這樣做有兩個原因,一是以防被誤解為 shell命令;二是可以用來查找多個單詞組成的字符串,例如:“jet plane",如果不用雙引號將其括起來,那么單詞 plane將被誤認為是一個文件,查詢結果將返回“文件不存在”的錯誤信息。b.在調用變量時,也應該使用雙引號,諸如: grep “$MYVAR”文件名,如果不這樣,將沒有返回結果。c.在調用模式匹配時,應使用單引號。以下是可用字符類的相當完整的列表：字符類			描述[:alnum:]	字母數字 [a-z A-Z 0-9][:alpha:]	字母 [a-z A-Z][:blank:]	空格或制表鍵[:cntrl:]	任何控制字符[:digit:]	數字 [0-9][:graph:]	任何可視字符（無空格）[:lower:]	小寫 [a-z][:print:]	非控制字符[:punct:]	標點字符[:space:]	空格[:upper:]	大寫 [A-Z][:xdigit:]	十六進制數字 [0-9 a-f A-F]盡可能使用字符類是很有利的，因為它們可以更好地適應非英語 locale（包括某些必需的重音字符等等)*			匹配前面的子表達式零次或多次。例如，zo* 能匹配 "z" 以及 "zoo"。 * 等價于{0,}。+			匹配前面的子表達式一次或多次。例如，'zo+' 能匹配 "zo" 以及 "zoo"，但不能匹配 "z"。+等價于 {1,}。?			匹配前面的子表達式零次或一次。例如，"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等價于 {0,1}。{n}		n 是一個非負整數。匹配確定的 n 次。例如，'o{2}' 不能匹配 "Bob" 中的 'o'，但是能匹配 "food" 中的兩個 o。{n,}		n 是一個非負整數。至少匹配n 次。例如，'o{2,}' 不能匹配 "Bob" 中的 'o'，但能匹配 "foooood" 中的所有 o。'o{1,}' 等價于 'o+'。'o{0,}' 則等價于 'o*'。{n,m}		m 和 n 均為非負整數，其中n <= m。最少匹配 n 次且最多匹配 m 次。 "o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價于 'o?'。請注意在逗號和兩個數之間不能有空格。?			當該字符緊跟在任何一個其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面時，匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜索的字符串，而默認的貪婪模式則盡可能多的匹配所搜索的字符串。例如，對于字符串 "oooo"，'o+?' 將匹配單個 "o"，而 'o+' 將匹配所有 'o'。.			匹配除 "\n" 之外的任何單個字符。要匹配包括 '\n' 在內的任何字符，請使用象 '[.\n]' 的模式。x|y		匹配 x或y。例如，'z|food' 能匹配 "z" 或 "food"。'(z|f)ood' 則匹配 "zood" 或 "food"。[xyz]		字符集合，匹配所包含的任意一個字符。例如， '[abc]' 可以匹配 "plain" 中的 'a'。[^xyz]	負值字符集合。匹配未包含的任意字符。例如， '[^abc]' 可以匹配 "plain" 中的'p'。[a-z]		字符范圍。匹配指定范圍內的任意字符。例如，'[a-z]' 可以匹配 'a到 'z'范圍內的任意小寫字母字符。[^a-z]	負值字符范圍。匹配任何不在指定范圍內的任意字符。例如，'[^a-z]' 可以匹配任何不在 'a'到 'z'范圍內的任意字符。\b			匹配一個單詞邊界，也就是指單詞和空格間的位置。例如， 'er\b' 可以匹配"never" 中的 'er'，但不能匹配 "verb" 中的 'er'。\B			匹配非單詞邊界。'er\B' 能匹配 "verb" 中的 'er'，但不能匹配 "never" 中的 'er'。\cx		匹配由x指明的控制字符。例如， \cM 匹配一個 Control-M 或回車符。 x 的值必須為 A-Z 或 a-z 之一。否則，將 c 視為一個原義的 'c' 字符。\d			匹配一個數字字符。等價于 [0-9]。\D			匹配一個非數字字符。等價于 [^0-9]。\f			匹配一個換頁符。等價于 \x0c 和 \cL。\n			匹配一個換行符。等價于 \x0a 和 \cJ。\r			匹配一個回車符。等價于 \x0d 和 \cM。\s			匹配任何空白字符，包括空格、制表符、換頁符等等。等價于 [ \f\n\r\t\v]。\S			匹配任何非空白字符。等價于 [^ \f\n\r\t\v]。\t			匹配一個制表符。等價于 \x09 和 \cI。\v			匹配一個垂直制表符。等價于 \x0b 和 \cK。\w			匹配包括下劃線的任何單詞字符。等價于'[A-Za-z0-9_]'。\W			匹配任何非單詞字符。等價于 '[^A-Za-z0-9_]'。\xn		匹配 n，其中 n為十六進制轉義值。十六進制轉義值必須為確定的兩個數字長。例如， '\x41' 匹配 "A"。'\x041' 則等價于 '\x04' & "1"。正則表達式中可以使用 ASCII編碼。.\num		匹配 num，其中 num 是一個正整數。對所獲取的匹配的引用。例如，'(.)\1' 匹配兩個連續的相同字符。\n			標識一個八進制轉義值或一個后向引用。如果 \n 之前至少 n 個獲取的子表達式，則 n 為后向引用。否則，如果 n 為八進制數字 (0-7)，則 n 為一個八進制轉義值。\nm		標識一個八進制轉義值或一個后向引用。如果 \nm 之前至少有is preceded by at least nm個獲取得子表達式，則 nm 為后向引用。如果 \nm 之前至少有 n 個獲取，則 n 為一個后跟文字 m 的后向引用。如果前面的條件都不滿足，若 n 和 m 均為八進制數字 (0-7)，則 \nm 將匹配八進制轉義值 nm。\nml		如果 n 為八進制數字 (0-3)，且 m 和 l 均為八進制數字 (0-7)，則匹配八進制轉義值 nml。\un		匹配 n，其中 n 是一個用四個十六進制數字表示的 Unicode 字符。例如， \u00A9 匹配版權符號 (?)。2.	grep正則表達式元字符集（基本集：共15個）^    錨定行的開始 如：'^grep'匹配所有以grep開頭的行。 $   錨定行的結束 如：'grep$'匹配所有以grep結尾的行。 .    匹配任何單個字符（非換行符） 如：'gr.p'匹配gr后接一個任意字符，然后是p。 *    匹配零個或多個先前字符 如：'*grep'匹配所有一個或多個空格后緊跟grep的行。 .*一起用代表任意字符。[]   匹配一個指定范圍內的字符，如'[Gg]rep'匹配Grep和grep。 [^]    匹配一個不在指定范圍內的字符，如：'[^A-FH-Z]rep'匹配不包含A-R和T-Z的一個字母開頭，緊跟rep的行。 \(..\)    標記匹配字符，如'\(love\)'，love被標記為1。 \<    錨定單詞的開始，如:'\<grep'匹配包含以grep開頭的單詞的行。 \>    錨定單詞的結束，如'grep\>'匹配包含以grep結尾的單詞的行。 x\{m\}    		重復字符x，m次，如：'0\{5\}'匹配包含5個o的行。 x\{m,\}    		重復字符x,至少m次，如：'o\{5,\}'匹配至少有5個o的行。 x\{m,n\}    	重復字符x，至少m次，不多于n次，如：'o\{5,10\}'匹配5--10個o的行。\w    			匹配文字和數字字符，也就是[A-Za-z0-9]，如：'G\w*p'匹配以G后跟零個或多個文字或數字字符，然后是p。\W    			\w的反置形式，匹配一個或多個非單詞字符，如點號句號等。\b    			單詞鎖定符，如: '\bgrep\b'只匹配grep。3. 	用于egrep和 grep -E的元字符擴展集+    匹配一個或多個先前的字符。如：'[a-z]+able'，匹配一個或多個小寫字母后跟able的串，如enable,disable等。?    匹配零個或多個先前的字符。如：'gr?p'匹配gr后跟一個或沒有字符，然后是p的行。a|b|c    匹配a或b或c。如：grep|sed匹配grep或sed()    			分組符號，如：love(able|rs)ov+匹配loveable或lovers，匹配一個或多個ov。x{m},x{m,},x{m,n}    作用同x\{m\},x\{m,\},x\{m,n\}4.	POSIX字符類為了在不同國家的字符編碼中保持一至，POSIX(The Portable Operating System Interface)增加了特殊的字符類，如[:alnum:]是A-Za-z0-9的另一個寫法。要把它們放到[]號內才能成為正則表達式，如[A- Za-z0-9]或[[:alnum:]]。在linux下的grep除fgrep外，都支持POSIX的字符類。[:alnum:]    文字數字字符[:alpha:]    文字字符[:digit:]    數字字符[:graph:]    非空字符（非空格、控制字符）[:lower:]    小寫字符[:cntrl:]    控制字符[:print:]    非空字符（包括空格）[:punct:]    標點符號[:space:]    所有空白字符（新行，空格，制表符）[:upper:]    大寫字符[:xdigit:]    十六進制數字（0-9，a-f，A-F）5.	Grep命令選項-?    同時顯示匹配行上下的？行，如：grep -2 pattern filename同時顯示匹配行的上下2行。-b，--byte-offset    		在匹配行前面打印該行所在的塊號碼。-c,--count    				只打印匹配的行數，不顯示匹配的內容。-f File，--file=File    從文件中提取模板。空文件中包含0個模板，所以什么都不匹配。-h，--no-filename    		當搜索多個文件時，不顯示匹配文件名前綴。-i，--ignore-case    		忽略大小寫差別。-q，--quiet    				取消顯示，只返回退出狀態。0則表示找到了匹配的行。-l，--files-with-matches    	打印匹配模板的文件清單。-L，--files-without-match    	打印不匹配模板的文件清單。-n，--line-number    				在匹配的行前面打印行號。-s，--silent    					不顯示關于不存在或者無法讀取文件的錯誤信息。-v，--revert-match    			反檢索，只顯示不匹配的行。-w，--word-regexp    				如果被\<和\>引用，就把表達式做為一個單詞搜索。-V，--version    					顯示軟件版本信息。-C NUM, --context=NUM			Print  NUM lines of output context.  Places a line containing --between contiguous groups of matches.6. 	實例要用好grep這個工具，其實就是要寫好正則表達式，所以這里不對grep的所有功能進行實例講解，只列幾個例子，講解一個正則表達式的寫法。$ ls -l | grep '^a'通過管道過濾ls -l輸出的內容，只顯示以a開頭的行。$ grep 'test' d*顯示所有以d開頭的文件中包含test的行。$ grep 'test' aa bb cc顯示在aa，bb，cc文件中匹配test的行。$ grep '[a-z]\{5\}' aa顯示所有包含每個字符串至少有5個連續小寫字符的字符串的行。$ grep 'w\(es\)t.*\1' aa如果west被匹配，則es就被存儲到內存中，并標記為1，然后搜索任意個字符（.*），這些字符后面緊跟著另外一個es（\1），找到就顯示該行。如果用egrep或grep -E，就不用"\"號進行轉義，直接寫成'w(es)t.*\1'就可以了。
?? 文件大小 169 K
?? 上傳用戶 xingxian
?? 所屬分類 Linux/Unix編程
??? 相關標簽

#linux #命令
?? 快捷鍵說明

復制代碼 Ctrl + C
搜索代碼 Ctrl + F
全屏模式 F11
切換主題 Ctrl + Shift + D
顯示快捷鍵 ?
增大字號 Ctrl + =
減小字號 Ctrl + -
亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

?? regular expression and gnu grep

?? 快捷鍵說明