我是python新手&我正在尝试连接hadoop hdfs系统。我得到了下面的参考代码,我试图实现它,但在导入包时显示错误。
from pyarrow import HdfsClient
# Using libhdfs
hdfs = HdfsClient('192.168.0.119', '50070', 'cloudera', driver='libhdfs')
错误:importerror:无法导入名称“hdfsclient”
我甚至试着用“pip”来安装它,但是
找不到满足hdfsclient要求的版本(来自版本:),找不到hdfsclient的匹配分发
然后我试着用“康达”,但又一次
收集包元数据:已完成解决环境:失败
packagesnotfounderror:以下程序包在当前频道中不可用:
HDF客户端
当前频道:
https://repo.anaconda.com/pkgs/main/win-64
https://repo.anaconda.com/pkgs/main/noarch
https://repo.anaconda.com/pkgs/free/win-64
https://repo.anaconda.com/pkgs/free/noarch
https://repo.anaconda.com/pkgs/r/win-64
https://repo.anaconda.com/pkgs/r/noarch
https://repo.anaconda.com/pkgs/msys2/win-64
https://repo.anaconda.com/pkgs/msys2/noarch
要搜索可能提供您要查找的conda软件包的备用频道,请导航到
https://anaconda.org
并使用页面顶部的搜索栏。
实际上,我正试图通过以下方式连接到色调:
ip地址->192.168.0.119
端口名->50070
用户名->cloudera
密码->cloudera
但这是行不通的。有谁能建议用更好的方式连接它,或者如何在python3中导入“hdfsclient”包吗。
1条答案
按热度按时间qvsjd97n1#
HDFSClient
已弃用。你可能想用pyarrow.hdfs.connect
. 也试试看pip freeze
查看python环境中是否安装了相关库。前任。