,先生,hadoop输出需要导入hbase的话最好先输出成HFile格式,再导入到hbase,因为HFile是hbase的内部存储格式,所以导入效率很高、下面是一个示例
1. 创建HBase表t1
<李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李>
2。写先生作业
HBaseHFileMapper.java
<李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李>
HBaseHFileReducer.java
<李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李>
HbaseHFileDriver.java
<李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”>“));,李> <李>“));,李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李>
<李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李>
将作业打包,我的到处路径为/home/yinjie/工作/hbasetest。jar
提交作业到hadoop运行:
<李类=癮lt”> 李>
作业运行完毕后查看下输出目录:
<李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李>
好的,已经生成以列族f1命名的文件夹了。
接下去使用批量加载将数据导入到HBbase
<李类=癮lt”> 李>
导入完毕,查询hbase表t1进行验证
<李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李> <李类=癮lt”> 李> <李> 李>
数据已经导入!
,