1、Hadoop是一個由Apache基金會所開發的分佈式系統基礎架構。用戶可以在不瞭解分佈式底層細節的情況下,開發分佈式程序。充分利用集群的威力進行高速運算和存儲。Hadoop實現瞭一個分佈式文件系統(HadoopDistributedFileSystem),簡稱HDFS。HDFS有高容錯性的特點,並且設計用來部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(highthroughput)來訪問應用程序的數據,適合那些有著超大數據集(largedataset)的應用程序。
2、HDFS放寬瞭(relax)POSIX的要求,可以以流的形式訪問(streamingaccess)文件系統中的數據。Hadoop的框架最核心的設計就是:HDFS和MapReduce。HDFS為海量的數據提供瞭存儲,而MapReduce則為海量的數據提供瞭計算。