将mr作业提交到具有不同id的hadoop集群

z3yyvxxp  于 2021-06-01  发布在  Hadoop
关注(0)|答案(1)|浏览(281)

向hadoop集群提交mr作业的最佳方式是什么?

场景:

开发人员有自己的id,例如dev-user1、dev-user2等。
hadoop集群为不同的组件提供了不同的id,例如hdfs用户对hdfs,Yarn对Yarn等。
这意味着dev-user1不能读/写hdfs,因为hdfs id可以访问hdfs。
有人能帮我理解开发人员向hadoop集群提交作业的最佳实践是什么吗?我不想把hadoop“特定”id的细节告诉任何人。
它在现实生活中是如何工作的。

k5hmc34c

k5hmc34c1#

开发人员可以向hadoop集群提交作业的最佳实践?
取决于工作。。。 yarn jar 将是用于mapreduce的
这意味着dev-user1不能读/写hdfs,因为hdfs id可以访问hdfs。
不是所有的东西都归hdfs用户所有。你需要做点什么 /user/dev-user1 该用户拥有的hdfs目录,因此用户有一个“私有”空间。您仍然可以在hdfs上的任何其他地方创建一个目录,供多个用户写入。
只有在hdfs上显式启用了权限时,才会检查权限。。。即使您这样做了,您仍然可以将两个用户放在同一个posix组中,或者使所有用户都可以全局写入目录。
https://hadoop.apache.org/docs/r2.7.3/hadoop-project-dist/hadoop-hdfs/hdfspermissionsguide.html
在生产级集群中,hadoop由kerberos凭证保护,acl通过apacheranger或sentry管理,两者都允许细粒度的权限管理

相关问题