我通过以下教程在Windows10上安装了hadoop和hive,
https://exitcondition.com/install-hadoop-windows/ & https://www.youtube.com/watch?v=npyrxkmhrgk 分别。
hadoop和hive都在我的机器上运行,我已经能够在hdfs中放置文件并在hive中运行查询,但是当我尝试将hive与python连接时,会出现不同的错误。例如
from pyhive import hive
hive.Connection(host='localhost',port=10000,auth='NOSASL')
它给出以下错误:
TTransportException: TSocket read 0 bytes
我也试过 Impala ,但没用。
如何将python与hive连接起来,是可以在windows10上连接,还是应该切换到linux?
1条答案
按热度按时间hgc7kmma1#
pyhive过去与auth=nosal有问题。。不知道是否修好了。
试试hdfs3 python lib
此处提供更多信息。。
https://medium.com/@arush.xtremelife/connecting-hadoop-hdfs-with-python-267234bb68a2