ivaneeo's blog

自由的力量，自由的生活。

:: 管理

669 Posts :: 0 Stories :: 64 Comments :: 0 Trackbacks

HBase的写效率还是很高的，但其随机读取效率并不高

可以采取一些优化措施来提高其性能，如：

1. 启用lzo压缩，见这里

2. 增大hbase.regionserver.handler.count数为100

3. 增大hfile.block.cache.size为0.4，提高cache大小

4. 增大hbase.hstore.blockingStoreFiles为15

5. 启用BloomFilter，在HBase0,89中可以设置

6.Put时可以设置setAutoFlush为false，到一定数目后再flushCommits

在14个Region Server的集群上，新建立一个lzo压缩表

测试的Put和Get的性能如下：

1. Put数据：

单线程灌入1.4亿数据，共花费50分钟，每秒能达到4万个，这个性能确实很好了，不过插入的value比较小，只有不到几十个字节

多线程put，没有测试，因为单线程的效率已经相当高了

2. Get数据：

在没有任何Block Cache，而且是Random Read的情况：

单线程平均每秒只能到250个左右

6个线程平均每秒能达到1100个左右

16个线程平均每秒能达到2500个左右

有BlockCache（曾经get过对应的row，而且还在cache中）的情况：

单线程平均每秒能到3600个左右

6个线程平均每秒能达到1.2万个左右

16个线程平均每秒能达到2.5万个左右

posted on 2011-06-10 23:14 ivaneeo 阅读(1237) 评论(0) 编辑收藏所属分类: 云


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: hadoop生态圈 mesos调度框架 centos6.5 docker install docker run restart mincloud install log mysql cluster install faq centos7 testing yum 解决KVM中鼠标不同步问题 openstack virt vnc port ceilometer alarm例子