?? 第九章 關聯數組(哈希表).htm
字號:
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb_2312-80">
<title>Perl之關聯數組</title>
<LINK rel="stylesheet" href="article.css" type="text/css">
</head>
<body>
<br>
<p align="center">第九章 關聯數組/哈希表</p>
<p align="center"><a target="_blank" href="http://flamephoenix.126.com">by flamephoenix</a></p>
<a href="#1"> 一、數組變量的限制</a><br>
<a href="#2"> 二、定義</a><br>
<a href="#3"> 三、訪問關聯數組的元素</a><br>
<a href="#4"> 四、增加元素</a><br>
<a href="#5"> 五、創建關聯數組</a><br>
<a href="#6"> 六、從數組變量復制到關聯數組</a><br>
<a href="#7"> 七、元素的增刪</a><br>
<a href="#8"> 八、列出數組的索引和值</a><br>
<a href="#9"> 九、用關聯數組循環</a><br>
<a href="#10"> 十、用關聯數組創建數據結構</a><br>
<a href="#10.1"> 1、(單)鏈表</a><br>
<a href="#10.2"> 2、結構</a><br>
<a href="#10.3"> 3、樹</a><br>
<br>
<a name="1">一、數組變量的限制</a><br>
在前面講的數組變量中,可以通過下標訪問其中的元素。例如,下列語句訪問數組@array的第三個元素:<br>
$scalar = $array[2];<br>
雖然數組很有用,但它們有一個顯著缺陷,即很難記住哪個元素存貯的什么內容。假如我們來寫一個程序計算某文件中首字母大寫的單詞出現的次數,用數組來實現就比較困難,程序代碼如下:<blockquote>
1 : #!/usr/local/bin/perl<br>
2 :<br>
3 : while ($inputline = <STDIN>) {<br>
4 : while ($inputline =~ /\b[A-Z]\S+/g) {<br>
5 : $word = $&;<br>
6 : $word =~ s/[;.,:-]$//; # remove punctuation<br>
7 : for ($count = 1; $count <= @wordlist;<br>
8 : $count++) {<br>
9 : $found = 0;<br>
10: if ($wordlist[$count-1] eq $word) {<br>
11: $found = 1;<br>
12: $wordcount[$count-1] += 1;<br>
13: last;<br>
14: }<br>
15: }<br>
16: if ($found == 0) {<br>
17: $oldlength = @wordlist;<br>
18: $wordlist[$oldlength] = $word;<br>
19: $wordcount[$oldlength] = 1;<br>
20: }<br>
21: }<br>
22: }<br>
23: print ("Capitalized words and number of occurrences:\n");<br>
24: for ($count = 1; $count <= @wordlist; $count++) {<br>
25: print ("$wordlist[$count-1]: $wordcount[$count-1]\n");<br>
26: }</blockquote>
運行結果如下:<br>
<blockquote>
Here is a line of Input.<br>
This Input contains some Capitalized words.<br>
^D<br>
Capitalized words and number of occurrences:<br>
Here: 1<br>
Input: 2<br>
This: 1<br>
Capitalized: 1
</blockquote>
這個程序每次從標準輸入文件讀一行文字,第四行起的循環匹配每行中首字母大寫的單詞,每找到一個循環一次,賦給簡單變量$word。在第六行中去掉標點后,查看該單詞是否曾出現過,7~15行中在@wordlist中挨個元素做此檢查,如果某個元素與$word相等,@wordcount中相應的元素就增加一個數。如果沒有出現過,即@wordlist中沒有元素與$word相等,16~20行給@wordlist和@wordcount增加一個新元素。<br>
<a name="2">二、定義</a><br>
正如你所看到的,使用數組元素產生了一些問題。首先,@wordlist中哪個元素對應著哪個單詞并不明顯;更糟的是,每讀進一個新單詞,程序必須檢查整個列表才能知道該單詞是否曾經出現過,當列表變得較大時,這是很耗費時間的。<br>
這些問題產生的原因是數組元素通過數字下標訪問,為了解決這類問題,Perl定義了另一種數組,可以用任意簡單變量值來訪問其元素,這種數組叫做關聯數組,也叫哈希表。<br>
為了區分關聯數組變量與普通的數組變量,Perl使用%作為其首字符,而數組變量以@打頭。與其它變量名一樣,%后的第一個字符必須為字母,后續字符可以為字母、數字或下劃線。<br>
<a name="3">三、訪問關聯數組的元素</a><br>
關聯數組的下標可以為任何簡單/標量值,訪問單個元素時以$符號打頭,下標用大括號圍起來。例如:<blockquote>
$fruit{"bananas"}<br>
$number{3.14159}<br>
$integer{-7}
</blockquote>
簡單變量也可作為下標,如:<br>
$fruit{$my_fruit}<br>
<a name="4">四、增加元素</a><br>
創建一個關聯數組元素最簡單的方法是賦值,如語句$fruit{"bananas"} = 1; 把1賦給關聯數組%fruit下標為bananas的元素,如果該元素不存在,則被創建,如果數組%fruit從未使用過,也被創建。<br>
這一特性使得關聯數組很容易用于計數。下面我們用關聯數組改寫上面的程序,注意實現同樣的功能此程序簡化了許多。<br>
<blockquote>
1 : #!/usr/local/bin/perl<br>
2 :<br>
3 : while ($inputline = <STDIN>) {<br>
4 : while ($inputline =~ /\b[A-Z]\S+/g) {<br>
5 : $word = $&;<br>
6 : $word =~ s/[;.,:-]$//; # remove punctuation<br>
7 : $wordlist{$word} += 1;<br>
8 : }<br>
9 : }<br>
10: print ("Capitalized words and number of occurrences:\n");<br>
11: foreach $capword (keys(%wordlist)) {<br>
12: print ("$capword: $wordlist{$capword}\n");<br>
13: }
</blockquote>
運行結果如下:<br>
<blockquote>
Here is a line of Input.<br>
This Input contains some Capitalized words.<br>
^D<br>
Capitalized words and number of occurrences:<br>
This: 1<br>
Input: 2<br>
Here: 1<br>
Capitalized: 1
</blockquote>
你可以看到,這次程序簡單多了,讀取輸入并存貯各單詞數目從20行減少到了7行。<br>
本程序用關聯數組%wordlist跟蹤首字母大寫的單詞,下標就用單詞本身,元素值為該單詞出現的次數。第11行使用了內嵌函數keys()。這個函數返回關聯數組的下標列表,foreach語句就用此列表循環。<br>
注:關聯數組總是隨機存貯的,因此當你用keys()訪問其所有元素時,不保證元素以任何順序出現,特別值得一提的是,它們不會以被創建的順序出現。<br>
要想控制關聯數組元素出現的次序,可以用sort()函數對keys()返回值進行排列,如:
<blockquote>
foreach $capword (sort keys(%wordlist)) {<br>
print ("$capword: $wordlist{$capword}\n");<br>
}
</blockquote>
<a name="5">五、創建關聯數組</a><br>
可以用單個賦值語句創建關聯數組,如:<br>
%fruit = ("apples",17,"bananas",9,"oranges","none");<br>
此語句創建的關聯數組含有下面三個元素:
<blockquote>
<li>下標為apples的元素,值為17</li>
<li>下標為bananas的元素,值為9</li>
<li>下標為oranges的元素,值為none</li>
</blockquote>
注:用列表給關聯數組賦值時,Perl5允許使用"=>"或","來分隔下標與值,用"=>"可讀性更好些,上面語句等效于:<br>
%fruit = ("apples"=>17,"bananas"=>9,"oranges"=>"none");<br>
<a name="6">六、從數組變量復制到關聯數組</a><br>
與列表一樣,也可以通過數組變量創建關聯數組,當然,其元素數目應該為偶數,如:<br>
@fruit = ("apples",17,"bananas",9,"oranges","none");<br>
%fruit = @fruit;<br>
反之,可以把關聯數組賦給數組變量,如:<br>
%fruit = ("grapes",11,"lemons",27);<br>
@fruit = %fruit;<br>
注意,此語句中元素次序未定義,那么數組變量@fruit可能為("grapes",11,"lemons",27)或("lemons",27,"grapes",11)。<br>
關聯數組變量之間可以直接賦值,如:%fruit2 = %fruit1; 還可以把數組變量同時賦給一些簡單變量和一個關聯數組變量,如:<br>
($var1, $var2, %myarray) = @list;<br>
此語句把@list的第一個元素賦給$var1,第二個賦給$var2,其余的賦給%myarray。<br>
最后,關聯數組可以通過返回值為列表的內嵌函數或用戶定義的子程序來創建,下例中把split()函數的返回值--一個列表--賦給一個關聯數組變量。
<blockquote>
1: #!/usr/local/bin/perl<br>
2:<br>
3: $inputline = <STDIN>;<br>
4: $inputline =~ s/^\s+|\s+\n$//g;<br>
5: %fruit = split(/\s+/, $inputline);<br>
6: print ("Number of bananas: $fruit{\"bananas\"}\n");
</blockquote>
運行結果如下:
<blockquote>
oranges 5 apples 7 bananas 11 cherries 6<br>
Number of bananas: 11
</blockquote>
<a name="7">七、元素的增刪</a><br>
增加元素已經講過,可以通過給一個未出現過的元素賦值來向關聯數組中增加新元素,如$fruit{"lime"} = 1;創建下標為lime、值為1的新元素。<br>
刪除元素的方法是用內嵌函數delete,如欲刪除上述元素,則:<br>
delete ($fruit{"lime"});<br>
注意:<blockquote>
1、一定要使用delete函數來刪除關聯數組的元素,這是唯一的方法。<br>
2、一定不要對關聯數組使用內嵌函數push、pop、shift及splice,因為其元素位置是隨機的。
</blockquote>
<a name="8">八、列出數組的索引和值</a><br>
上面已經提到,keys()函數返回關聯數組下標的列表,如:<br>
<blockquote><pre>
%fruit = ("apples", 9,
"bananas", 23,
"cherries", 11);
@fruitsubs = keys(%fruits);
</pre></blockquote>
這里,@fruitsubs被賦給apples、bananas、cherries構成的列表,再次提請注意,此列表沒有次序,若想按字母順序排列,可使用sort()函數。<br>
@fruitindexes = sort keys(%fruits);<br>
這樣結果為("apples","bananas","cherries")。類似的,內嵌函數values()返回關聯數組值的列表,如:<br>
<blockquote><pre>
%fruit = ("apples", 9,
"bananas", 23,
"cherries", 11);
@fruitvalues = values(%fruits);
</pre></blockquote>
這里,@fruitvalues可能的結果為(9,23.11),次序可能不同。<br>
<a name="9">九、用關聯數組循環</a><br>
前面已經出現過利用keys()函數的foreach循環語句,這種循環效率比較低,因為每返回一個下標,還得再去尋找其值,如:<br>
<blockquote>
foreach $holder (keys(%records)){<br>
$record = $records{$holder};<br>
}
</blockquote>
Perl提供一種更有效的循環方式,使用內嵌函數each(),如:<br>
<blockquote>
%records = ("Maris", 61, "Aaron", 755, "Young", 511);<br>
while (($holder, $record) = each(%records)) {<br>
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -