大数据基础问答

  

<强>什么是大数据?
用于①数据的存储:分布式文件系统(分布式存储)②数据的计算:分布式计算。简单一点就是存储和计算的问题,解决日常海量数据的分析。

  

<强>学习大数据需要什么基础呢?
Java基础(Java se):类,类,继承,I/O,反射,泛型等;
Linux基础(Linux的操作):创建文件,目录,第六编辑器的使用;

  

<强> Java和大数据都有哪些关系呢?
<>强基于Java语言开发→→→Hadoop 强体系结构,原理,编程
第一阶段:HDFS, MapReduce, HBase (NoSQL数据库)
第二阶段:数据分析引擎——→蜂巢,猪
数据采集引擎——→Sqoop,水槽
第三阶段:色调:Web管理工具
管理员:实现Hadoop的HA
Oozie:工作流引擎*
<>强基于Java语言开发→→→Scala语言→→→火花
火花的学习
第一个阶段:Scala编程语言
第二个阶段:火花的核心- - - - -→基于内存,数据的计算
第三个阶段:火花SQL - - - - -→类似甲骨文中的SQL语句
第四个阶段:火花流——→进行实时计算(流式计算):比如:自来水厂

  

Apache风暴:类似火花流——→进行实时计算(流式计算):比如:自来水厂
NoSQL:复述,基于内存的数据库

大数据基础问答