?? readme.txt
字號:
----------------------Huffman 算法的不同實現----------------------王詠剛,2003年7月。本目錄下的源代碼均屬示例、教學性質。作者不對這些代碼的功能和性能作任何擔保或承諾。--------功能說明--------本目錄下的程序用8種不同的方式實現了Huffman編碼算法,這8種方式分別是* huffman_a 使用鏈表結構生成Huffman樹的算法,這是最基本的實現方法,效率最低。* huffman_b 使用《數據結構》(嚴蔚敏,吳偉民,1997,C語言版)中給出的算法,將二叉樹存放在連續空間里(靜態鏈表),空間的每個結點內仍有左子樹、右子樹、雙親等指針。* huffman_c 使用Canonical Huffman編碼,同時對huffman_b的存儲結構進行改造,將二叉樹存放在連續空間tree里,空間的每個結點類型都和結點權值的數據類型相同,空間大小為2*num,tree[0]未用,tree[1..num]是每個元素的權值,生成Huffman后,tree[1..2*num-1]中是雙親結點索引。* huffman_d 在huffman_c的基礎上,增加預先排序的功能先用QuickSort算法對所有元素的權值從小到大排序,這樣,排序后最前面的兩個元素就是最小的一對元素了。我們可以直接將它們挑出來,組合成一個子樹。然后再子樹的權值用折半插入法插到已排序的元素表中, 保證所有結點有序。為了保證初始元素的順序不變,我們另外使用了一個索引數組,所有排序中的交換操作都是在索引數組中進行的。* huffman_e 在huffman_d的基礎上,將索引數組放在tree的內部。為編碼方便,將元素權值放在tree[num..2*num-1]處。將tree[0..num-1]作為索引數組。排序改為從大到小。對索引數組排序后,每次從最后選出2個最小值,相加后的結點權值放在索引數組最后,結點索引放在索引數組中倒數第2個位置,然后索引數組大小減1,并將最后一個索引值插入到前面的有序表中,保證索引數組仍然有序。* huffman_f 在huffman_e的基礎上,將排序改為利用堆排序原理選擇最小的兩個權值。也即,將所有元素的權值組織成堆后,每次堆內的根結點就是最小值了。每取出一個根結點后,就把堆尾元素調到根結點重建堆。取出兩個最小值合并成一個子樹后,再把子樹作為葉子結點放到堆中,并讓其上升到合適的位置,保持堆性質不變。因為每次不必完成整個排序過程,而只是組織成堆,因此,這種方法要比使用快速排序更快。上述算法參考了mg-1.2.1中Huffman編碼的實現,見http://www.cs.mu.oz.au/mg/* huffman_g 當元素權值已經有序時,可以使用A. Moffat和J. Katajainen設計的在權值數組內部構建Huffman的方法。A. Moffat和J. Katajainen對該算法的描述見http://www.cs.mu.oz.au/~alistair/abstracts/inplace.html* huffman_h 在huffman_f的基礎上,增加限制碼長的功能。限制碼長的算法參考了zlib-1.1.4中構造限制碼長的Huffman編碼的源代碼。zlib的源代碼見http://www.gzip.org/zlib/,其中限制長度的算法在tree.c的gen_bitlen()函數中。上述8種算法分別對應于8個同名C++類,這些類都是由huffman_base類派生的。huffman_base類提供了與Huffman算法相關的大多數通用功能,如編碼轉換、Canonical Huffman編碼生成、Huffman編碼驗證等等。main.cpp中的tester類提供了用隨機數據測試上述8種算法,并顯示算法的運行時間及運行結果的功能。----------編譯和運行----------Windows: 使用Visual Studio .NET(建議使用VS .NET 2003或以上版本)打開Huffman.sln,編譯生成并運行huffman.exe即可。Linux: 系統中應已安裝GNU gcc(建議安裝gcc 3.2.2或以上版本)。本目錄下的Makefile是Linux下的工程文件,直接在本目錄下執行make命令即可生成可執行程序Huffman。
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -