Hadoop是一個用于運行應用程序在大型集群的廉價硬件設備上的框架。Hadoop為應用程序透明的提供了一組穩定/可靠的接口和數據運動。在 Hadoop中實現了Google的MapReduce算法,它能夠把應用程序分割成許多很小的工作單元,每個單元可以在任何集群節點上執行或重復執行。此外,Hadoop還提供一個分布式文件系統用來在各個計算節點上存儲數據,并提供了對數據讀寫的高吞吐率。由于應用了map/reduce和分布式文件系統使得Hadoop框架具有高容錯性,它會自動處理失敗節點。已經在具有600個節點的集群測試過Hadoop框架。
標簽:
Hadoop
MapReduce
Google
應用程序
上傳時間:
2017-05-08
上傳用戶:wpwpwlxwlx