使用spark hbase hortonworks连接器读取hbase需要很长时间

qacovj5a 于 2021-06-10 发布在 Hbase

关注(0)|答案(0)|浏览(179)

使用hortonworks spark hbase连接器读取和写入我的hbase表。
在读取过程中，根据下面的代码片段，230万条记录的读取时间为4分钟。我使用rowkey作为筛选记录的主列。
记录总数约为350万条。
我们正在使用一个3节点群集| 3个区域服务器| 11个区域作为3个区域服务器。

val catalog = getUDMHistoryTableCatalog()
val HistoryHBaseDF = sqlContext.read
  .options(Map(HBaseTableCatalog.tableCatalog -> catalog))
  .format("org.apache.spark.sql.execution.datasources.hbase")
  .load().filter(substring(col("key"),0,4) === "017-")

hbase apache-spark spark-dataframe

来源：https://stackoverflow.com/questions/42553771/hbase-read-using-spark-hbase-hortonworks-connector-takes-a-long-time

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

使用spark hbase hortonworks连接器读取hbase需要很长时间

暂无答案！

相关问题

热门标签

最新问答