apache hbase-获取大行非常慢

gdx19jrr  于 2021-06-09  发布在  Hbase
关注(0)|答案(0)|浏览(314)

我正在aws emr上运行apachehbase集群。我有一个表,它是一个单列族,75000列和50000行。我试图获取一行的所有列值,当该行不是稀疏的,并且有75000个值时,返回时间非常慢—从db获取数据几乎需要2.5秒。我正在从运行happybase的lambda函数查询表。

import happybase

start = time.time()
col = 'mycol'
table = connection.table('mytable')
row = table.row(col)
end = time.time() - start
print("Time taken to fetch column from database:")
print(end)

我能做些什么来加快速度?这看起来非常慢-返回负载是75000个值对,只有~2mb。应该比2秒快得多。我在找毫秒返回时间。
我的块缓存大小为8194kb,bloomfilter类型为row,并且在这个表上启用了snappy压缩。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题