我正在运行hive0.12,我想运行几个查询并将结果作为python数组返回。
例如:
result=[]
for col in columns:
sql='select {c} as cat,count(*) as cnt from {t} group by {c} having cnt > 100;'.format(t=table,c=col)
result.append(hive.query(sql))
result=dict(result)
我缺少的是 hive
类来运行sql查询。
如何做到这一点?
3条答案
按热度按时间osh3o9ms1#
你也可以使用节俭进入Hive。https://cwiki.apache.org/confluence/display/hive/hiveclient#hiveclient-Python。看起来pyhs2主要是一个直接使用节俭的 Package 器。
2uluyalo2#
一种快速而肮脏的方法是从命令行自动化配置单元
像这样的东西应该管用
uurity8g3#
另一种方法是使用pyhs2库从python进程中打开到配置单元的本地连接。下面是我拼凑的一些示例代码,以测试不同的用例,但希望它能说明这个库的用法。
根据您的设备上已安装或未安装的内容,您可能还需要同时安装这两个设备的开发标头
libpython
以及libsasl2
.