HDFS主要用于最初由雅虎提出的分布式文件系统,以下它的主要用途:
<强> 1,保存大数据强>
<强> 2,提供快速读取大数据的能力强>
Heroop帧的主要特征是通过将数据和计算分布在集群中的各节点服务器来实现分布式计算的目的。在计算逻辑和所需数据接近这一点上,并行计算分区后进行汇总。
<>强基本模块强>
-
<李> HDFS:分布式文件系统(雅虎)李>
<李> Mpredues:分布式计算帧(谷歌)李>
<李> HBCD:分布式,非关系型数据库(Poerset ->微软)李>
<李>猪:HDoop的大规模数据分析工具(雅虎)李>
<李> Hial:将数据库工具,结构化的数据文件复制到数据库表(Facebook)中李>
<李> ZooKeoler:分布式协同服务(雅虎)李>
<李>纱:任务调度和集群资源管理框架李>
HDFS分离保存元数据和用户数据.Meta的数据被保存在Namicos中,用户数据被保存在Datan路径中。服务器之间的通信基于TCP协议。
与GFS (Google文件系统)同样,从可靠性的考虑出发,具有将文件的内容复制到多个Datao,之后将数据的复制复制到多个Datannampa的目的和优点。