大数据技术分析:HDFS分布式系统介绍!

  

HDFS主要用于最初由雅虎提出的分布式文件系统,以下它的主要用途:

  

<强> 1,保存大数据

  

<强> 2,提供快速读取大数据的能力

  

Heroop帧的主要特征是通过将数据和计算分布在集群中的各节点服务器来实现分布式计算的目的。在计算逻辑和所需数据接近这一点上,并行计算分区后进行汇总。

  

<>强基本模块

  
      <李> HDFS:分布式文件系统(雅虎)   <李> Mpredues:分布式计算帧(谷歌)   <李> HBCD:分布式,非关系型数据库(Poerset ->微软)   <李>猪:HDoop的大规模数据分析工具(雅虎)   <李> Hial:将数据库工具,结构化的数据文件复制到数据库表(Facebook)中李   <李> ZooKeoler:分布式协同服务(雅虎)   <李>纱:任务调度和集群资源管理框架李   
  

HDFS分离保存元数据和用户数据.Meta的数据被保存在Namicos中,用户数据被保存在Datan路径中。服务器之间的通信基于TCP协议。

  

与GFS (Google文件系统)同样,从可靠性的考虑出发,具有将文件的内容复制到多个Datao,之后将数据的复制复制到多个Datannampa的目的和优点。

  

HDFS架构

  

大数据技术分析:HDFS分布式系统介绍!”> </p>
  <p> <强> 1,Namamos </强> <br/> Namelos是HDFS的重要的点,它保存了HDFS文件系统命名的空间树,文件和路径在Nameos中用inpoes显示。在HDFS系统中,文件的内容被分割为大的块(例如128 mb,根据用户的需求被配置),各块独立复制到多个数据南径中.Namicos将各文件的各个块的复印件存储在Datanpase的物理位置。</p>
  <p> HDFS脸部用的读HDFS的过程。</p>
  <p>读:当读HDFS保存的某些文件时,首先对Nameos,当Nameos返回该文件的块的Datan路径的位置时,可以从最近的Datao读取数据。</p>
  <p>写:脸部用的在写文件时,对Namelos的要求,Namicos将Datao写的位置返回(多个,例如3个Datao),对它要求直接的Datannampas,写入文件块。每个块,例如写三个数据号码路径,多确保文件块。</p>
  <p>如何使用pporela方式写入数据,简单来说,将一个Datao的第一Datao数据复制到第二Datao,将第二Datao的数据复制到第三Datapass。</p>
  <p> <强>这里有几个概念:</强> </p>
  <ul>
  <李>在RAM中,进气阀打开数据和各文件的块列表。</李>
  <李>存储在盘中的形象。这里要注意的是,块的复印件在不断变化,块的复印位置不是checkpot的一部分。</李>
  <李>保存磁盘上图像的更改记录</李>
  </ul>
  <blockquote>
  <p>很多小伙伴,对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习群:775908246,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系。</p>
  </引用>
  <p> <img src=大数据技术分析:HDFS分布式系统介绍!