java.lang.classnotfoundexception:在pyspark读取hbase表时找不到数据源：org.apache.hadoop.hbase.spark

omqzjyyz 于 2021-06-07 发布在 Hbase

关注(0)|答案(1)|浏览(594)

我使用pyspark将hbase表作为Dataframe来读取，但出现了一些错误：

sc = SparkContext(master="local[*]", appName="test")
spark = SparkSession(sc).builder.getOrCreate()
df = spark.read.format('org.apache.hadoop.hbase.spark') \
    .option('hbase.table', 'h_table') \
    .option('hbase.columns.mapping',
            'life_id STRING :key, score STRING info:total_score') \
    .option('hbase.use.hbase.context', False) \
    .option('hbase.config.resources', 'file:///home/softs/hbase-2.0.5/conf/hbase-site.xml') \
    .option('hbase-push.down.column.filter', False) \
    .load()

df.show()

它显示： java.lang.ClassNotFoundException: Failed to find data source: org.apache.hadoop.hbase.spark. Please find packages at http://spark.apache.org/third-party-projects.html 我看了演示

hbase apache-spark pyspark

来源：https://stackoverflow.com/questions/59607359/java-lang-classnotfoundexception-failed-to-find-data-source-org-apache-hadoop

1条答案

按热度按时间

2uluyalo1#

依赖项没有打包到jar中。如果不希望在项目中打包依赖项，请使用spark submit的-packages标志来指定所使用连接器的uri
将以下行添加到 spark-submit 命令：

--packages com.hortonworks:shc-core:1.1.1-2.1-s_2.11 --repositories http://repo.hortonworks.com/content/groups/public/

它应该有用。

赞(0）回复(0）举报 2021-06-07

我来回答

java.lang.classnotfoundexception:在pyspark读取hbase表时找不到数据源：org.apache.hadoop.hbase.spark

1条答案

相关问题

热门标签

最新问答