当我运行下面的代码时,我得到这个错误,例如:找不到hadoop包
FROM ubuntu:20.04
RUN apt-get update -y \
&& apt-get install -y apt-utils \
&& apt-get install python3.8 -y
RUN apt-get install jupyter -y
RUN apt-get install hadoop -y
RUN rm -rf /var/lib/apt/lists/*
ADD sample.py /
LABEL maintainer=Ammar
CMD [ "python", "./sample.py" ]
2条答案
按热度按时间von4xj4u1#
一些“foss”软件和不属于foss的软件没有添加到ubuntu存储库中,因此无法使用
apt
因为apt
使用这些存储库安装软件包。hadoop是其中一个没有添加到ubunturepo的包。有关存储库的更多信息,请查看此处
您可以拉取并使用其他人在dockerhub中创建和推送的hadoop容器映像之一,而不是为scratch创建它。
如果您仍然想创建自己的hadoop容器映像,可以查看这个示例hadoop dockerfile
0wi1tuuw2#
此链接:https://computingforgeeks.com/install-apache-hadoop-hbase-on-ubuntu-linux/ 包含hadoop安装的完整示例。我认为同样的事情也应该一步一步地在docker身上做。
apt-get install hadoop
在没有添加外部存储库的情况下无法在ubuntu中工作。但如果你知道外部回购,那么你必须补充softwaree-properties-common
Package (如:https://stackoverflow.com/a/52091668/1852444)然后通过添加存储库apt-add-repository
命令。