我刚刚开始管理hadoop集群。我们将使用BrightClusterManager达到o/s级别(Centos7.1),然后将ambari与HortonWorksHDP2.3一起用于hadoop。
我不断收到安装新python模块的请求。我们在安装时使用yum安装了一些模块,随着集群的发展,使用pip安装了一些模块。
“正确”的方法是什么?总是使用yum而不能提供最新最棒的模块?总是使用pip,而不是让一个真相点(yum)显示安装了哪些包?或者同时使用pip和yum可以吗?
我只是担心我的系统充满了垃圾和太多版本的python模块。有什么建议吗?
1条答案
按热度按时间rkue9o1l1#
作为您的发行版的一部分的包应该是首选的,因为它们已经在您的系统上进行了测试,可以正常工作。这些软件包在系统范围内安装。
但是,如果没有提供合适的rpm软件包,请继续从pypi或github安装它
pip
,但尽可能部署虚拟python环境。使用virtualenv,您不必在系统范围内安装第三方软件包。您将有几个较小的包集,这是更好地管理作为一个集。