如何在通过dataframe查询count查询时获取整数值?

yyyllmsg  于 2021-06-26  发布在  Hive
关注(0)|答案(2)|浏览(375)

我编写此代码是为了获取指定表中count的整数值:

sc = SparkContext("local", "spar")
hive_context = HiveContext(sc)
hive_context.sql("use zs_trainings_trainings_db")
df = hive_context.sql("select count(*) from ldg_sales")
92dk7w1h

92dk7w1h1#

将dataframe转换为rdd,这样就可以对其运行map任务,只提取行值,如-

df = hive_context.sql("select count(*) as cnt from ldg_sales")
count = df.rdd.map(lambda _ : _.cnt).collect()[0]
ss2ws0br

ss2ws0br2#

或者:

hive_context.table("sales").count

或者

hive_context.sql("select count(*) from ldg_sales").first()[0]

相关问题