程序员的资源宝库

网站首页 > gitee 正文

利用pig导出hbase文件为txt或者csv格式

sanyeah 2024-03-29 15:23:43 gitee 6 ℃ 0 评论

利用pig导出hbase文件为txt或者csv格式

 

如下例子,将hbase的表test导出文件为txt格式:

[root@datacsu2 lilip]# vi loadData.pig

source = LOAD 'hbase://test' USING org.apache.pig.backend.hadoop.hbase.HBaseStorage(

'info:CPUCpuUtil

 info:MemoryUsage' ,

 '-loadKey true ') AS (

 col1:chararray,col2:chararray,col3:chararray);

STORE source INTO '/hilod/result_file' USING PigStorage(',');

 

//其中info:* 为hbase表test中你想导出的列,'-loadKey true ' 代表保存rowkwy。

//注意后面包含了3个col(列名+rowkey)。

//接下来执行运行该脚本的命令:

[root@datacsu2 lilip]# cat pig.sh

pig -x tez /data1/lilip/loadData.pig

 

// 最后你将在hdfs:// hilod/result_file 下找到该导出文件。若文件太大,会将其分为几个子文件,可以执行hdfs命令将子文件合并,如:

#su hdfs

#hadoop fs –getmerge / hilod/result_file /tmp/result.txt

//注意:合并后的文件是本地文件。

 

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表