在hadoop集群上安装rhadoop

x4shl7ld  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(498)

我正在尝试在hadoop集群上安装rhadoop。在安装某些必需的软件包时,我遇到以下错误:

> install.packages("Megh/rmr2_3.3.1.tar.gz")
Installing package into ‘/usr/lib64/R/library’
(as ‘lib’ is unspecified)
inferring 'repos = NULL' from 'pkgs'
Error in rawToChar(block[seq_len(ns)]) :
  embedded nul in string: 'rmr2/man/fromdfstodfs.Rd\0\0\0\0erties\n i-_". '
Warning message:
In install.packages("Megh/rmr2_3.3.1.tar.gz") :
  installation of package ‘Megh/rmr2_3.3.1.tar.gz’ had non-zero exit status
>

> install.packages("Megh/plyrmr_0.6.0.tar.gz")
Installing package into ‘/usr/lib64/R/library’
(as ‘lib’ is unspecified)
inferring 'repos = NULL' from 'pkgs'
Warning in untar2(tarfile, files, list, exdir, restore_times) :
  checksum error for entry 'plyrmr/man/as.data.framed'
Warning in readBin(con, "raw", n = 512L) :
  invalid or incomplete compressed data
Error in untar2(tarfile, files, list, exdir, restore_times) :
  incomplete block on file
Warning message:
In install.packages("Megh/plyrmr_0.6.0.tar.gz") :
  installation of package ‘Megh/plyrmr_0.6.0.tar.gz’ had non-zero exit status

我还在集群上安装了rhive。我可以通过rhive执行相对较小的查询,但较大的查询失败:

> rhive.query("SELECT COUNT(*) FROM tradehistory")
Error: java.sql.SQLException: Error while processing statement: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.tez.TezTask
> rhive.query("SELECT tradeno FROM tradehistory LIMIT 10")
    tradeno
1  34232193
2  34232198
3  34232199
4  34232200
5  34232201
6  34232202
7  34232203
8  34232204
9  34232205
10 34232206

如果有人有任何想法,请帮我解决这个问题!提前多谢了!

a64a0gku

a64a0gku1#

对于我面临的安装错误,我发现这是tar文件的问题。
我使用windows系统下载了tar文件,并使用winscp将其传输到我的集群。
对于传输zip/archive类型的文件,理想情况下应该使用二进制传输,否则可能会丢失tar文件的某些字节。
这反过来又会导致错误。
在tez的情况下,如果需要执行一个需要调用多个mapreduce任务的查询,那么在没有适当授权的情况下,查询就不能执行。
因此,当我尝试提供用户名和密码的同一个rhive查询时,我能够获得所需的结果。

相关问题