我正在aws emr上运行apachehbase集群。我有一个表,它是一个单列族,75000列和50000行。我试图获取一行的所有列值,当该行不是稀疏的,并且有75000个值时,返回时间非常慢—从db获取数据几乎需要2.5秒。我正在从运行happybase的lambda函数查询表。
import happybase
start = time.time()
col = 'mycol'
table = connection.table('mytable')
row = table.row(col)
end = time.time() - start
print("Time taken to fetch column from database:")
print(end)
我能做些什么来加快速度?这看起来非常慢-返回负载是75000个值对,只有~2mb。应该比2秒快得多。我在找毫秒返回时间。
我的块缓存大小为8194kb,bloomfilter类型为row,并且在这个表上启用了snappy压缩。
暂无答案!
目前还没有任何答案,快来回答吧!