大家好,
我的问题是关于齐柏林飞艇笔记本的。我对齐柏林飞艇的环境很陌生。我有一个aws帐户。我正在研究emr集群。我想在齐柏林飞艇的环境中使用Pandas和matplotlib。但是,我得到了一个错误:没有名为pandas和matplotlib的模块。我发现这个教程。我到了第8步,但是,我仍然没有得到同样的问题。齐柏林飞艇有翻译。我尝试更改python路径,即使我确定路径正确,我仍然会遇到相同的错误。这个链接提到如果有人遇到这些问题,请帮助我。
%pyspark
import os
import numpy
import pandas
import matplotlib
print("Numpy "+numpy.__version__)
print("Pandas "+pandas.__version__)
print("Matplotlib "+matplotlib.__version__)
Traceback (most recent call last):
File "/tmp/zeppelin_pyspark-444747300595843376.py", line 367, in <module>
raise Exception(traceback.format_exc())
Exception: Traceback (most recent call last):
File "/tmp/zeppelin_pyspark-444747300595843376.py", line 355, in <module>
exec(code, _zcUserQueryNameSpace)
File "<stdin>", line 3, in <module>
ImportError: No module named pandas
1条答案
按热度按时间ktecyv1j1#
我意识到我正在从我的ec2机器中提取路径。我将ssh输入aws上的主节点。我安装Pandas和matplotib。然后在该示例上运行“whichpython”命令。之后,我复制到pyspark.python路径。最后,它成功了。