`
lc_koven
  • 浏览: 349886 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

hbase的export与import工具

阅读更多
    hbase提供了导出表的方案,将指定的表导出到HDFS或本地,这样方便了备份或数据转移。
    最快的方式是通过mapreduce来完成这件事,需要在hbase的conf中添加mapred-site.xml:
<property>
  <name>mapred.job.tracker</name>
  <value>192.168.0.1:9001</value>
</property>
<property>
  <name>hadoop.tmp.dir</name>
  <value>/tmp/hadoop-${user.name}</value>
</property>

    然后执行:
hbase org.apache.hadoop.hbase.mapreduce.Export backup_table hdfs://192.168.0.1:9000/user/test/backup_table

    数据被写到了相应的目录,一个region一个文件。默认为sequencefile。当然还可以选择对输出进行压缩等。
    要将输出的数据导入某个hbase的表,需执行以下命令:
hbase org.apache.hadoop.hbase.mapreduce.Import backup_table hdfs://192.168.0.1:9000/user/test/backup_table

    此时再看对应的表,己经有数据了。
分享到:
评论
3 楼 中原飘雪 2011-09-15  
lc_koven 写道
中原飘雪 写道
你好,看了你几篇文章,感觉很受益。目前有两个疑问,不知应该在何处提问,就放在此处了。

1 我看到网上的资料,hbase从0.90以后有自带的zk了,但是看很多人的文章,都是使用自己另外安装的zookeeper,请问下这两者有什么区别呢?

2  看到一些性能调优的文章,那些参数应该都是在hbase-default.xml中设置的,可hbase0.9里面废弃这个文件了,那应该在何处设置呢?

本人是hbase的初学者,可能问题中本身就有理解错误的地方,请有空回答我,不甚感激!


1 没有任何区别。自带的zk也能独立使用
2 你搜索一下hbase-default.xml吧:)不过最好还是修改hbase-site.xml吧。


谢谢!

另外,按照你这篇文章里提到的导入和导出数据步骤操作,提示找不到hadoop jar包的错误,不知你是否遇到过此类问题。可否告知你使用的hadoop和hbase版本分别是多少?hbase/conf中添加的mapred-site.xml是否需要各个节点都添加呢?
2 楼 lc_koven 2011-09-10  
中原飘雪 写道
你好,看了你几篇文章,感觉很受益。目前有两个疑问,不知应该在何处提问,就放在此处了。

1 我看到网上的资料,hbase从0.90以后有自带的zk了,但是看很多人的文章,都是使用自己另外安装的zookeeper,请问下这两者有什么区别呢?

2  看到一些性能调优的文章,那些参数应该都是在hbase-default.xml中设置的,可hbase0.9里面废弃这个文件了,那应该在何处设置呢?

本人是hbase的初学者,可能问题中本身就有理解错误的地方,请有空回答我,不甚感激!


1 没有任何区别。自带的zk也能独立使用
2 你搜索一下hbase-default.xml吧:)不过最好还是修改hbase-site.xml吧。
1 楼 中原飘雪 2011-09-08  
你好,看了你几篇文章,感觉很受益。目前有两个疑问,不知应该在何处提问,就放在此处了。

1 我看到网上的资料,hbase从0.90以后有自带的zk了,但是看很多人的文章,都是使用自己另外安装的zookeeper,请问下这两者有什么区别呢?

2  看到一些性能调优的文章,那些参数应该都是在hbase-default.xml中设置的,可hbase0.9里面废弃这个文件了,那应该在何处设置呢?

本人是hbase的初学者,可能问题中本身就有理解错误的地方,请有空回答我,不甚感激!

相关推荐

Global site tag (gtag.js) - Google Analytics