这篇文章给大家分享的是有关蜂巢数据如何导入导出mysql的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
蜂巢定位:ETL(数据仓库)工具
将数据从来源端经过抽取(提取),转换(变换),加载(负载)至目的端的工具,如像:水壶
<强> DML 强>
<强>批量插入/批量导入强>
<>强负荷强>,强> <>强劲数据,[<强>本地强>]INPATH & # 39; filepath& # 39;,(覆盖)<强>到强>,强>,<强>表的表(强>,<强>分区(partcol1=val1 partcol2=val2…)]
注:filepath可以是hdfs路径或者是S3路径,如hdfs://namenode: 9000/<强>用户强>/蜂巢/项目<强> 强>/data1
1。从本地文件导入到表
<>强负荷强>,<强>数据强>,<强>本地强>,INPATH & # 39;用法# 39;,<强>到强>,<强>表强>,<强>测试强>,
2。从hdfs导入到表
<>强负荷强>,强>,<强>数据INPATH & # 39;/home/测试/add.txt& # 39;, <强>到强>,<强>表强>,<强>测试强>,
3。从表查询中导入到表
<强>插入强>,<强>到强>,<强>表强>,<强>测试强>,<强>选择强>,<强> id 强>,<>强名称>强,电话从强> <强>,<强>测试>强;
4。将查询数据导入到多个表从source_table
<强>插入强>,<强>到强>,<强>表强>,<强>测试强>,<强>选择强>,<强> id 强>,<>强名称>强,电话从强>,<强> dest1_table <强>选择强>,src。* <强>,强>,src。强>,<强> id & lt;100
<强>插入强>,<强>到强>,<强>表强>,<强>测试强>,<强>选择强>,<强> id 强>,<>强名称>强,电话从强>,<强> dest2_table <强>选择强>,src。* <强>,强>,src。强>,<强> id & lt;100
<强>插入强>,<强>到强>,<强>表强>,<强>测试强>,<强>选择强>,<强> id 强>,<>强名称>强,电话从强>,<强> dest3_table <强>选择强>,src。* <强>,强>,src。强>,<强> id & lt;100;
5。建表时导入
<强>创建强>,强>,<强>表test4 <强> 强>,<强>选择强>,<强> id 强>,<>强名称>强,电话从强> <强>,<强>测试>强;
<强>指定分隔符导出数据强>
<强>插入>强,覆盖当地<强> 强>,<强>目录强>,& # 39;/home/hadoop/export_hive& # 39;,
<强>行强>,<强>格式强>,<强>分隔强>,
<强>字段强>,<强> 强>终止,由强>,<强> & # 39;\ t # 39;,
<强> 强>,选择* <强>从强>,<强>测试>强;
<强>删除/清空强>
1。删除表1中不符合条件的数据
<强>插入>强,覆盖表强>,<强> table1
<强> 强>,选择*从强>,<强> table1 <强>,强>,XXXX。
2。清空表
<强>插入>强,覆盖表强>,<强> t_table1
<强> 强>,选择*从强>,<强> t_table1 <强>,>强,1=0;
3。截断表(注:不能截断外部表)
<强>截断强>,强>,<强>表table_name;
4。null