我一直在尝试集群的例子。我已经编写了一个示例程序,在java中将文本文档转换为序列文件,并将序列文件转换为向量。我在运行程序时遇到以下异常:创建了所有必需的目录,并在其中复制了正确的数据。
blockquote 14/06/26 08:45:35错误security.usergroupinformation:priviledgedactionexception as:shshaikhcause:java.io.filenotfoundexception:file:/home/shshaikh/clusterworkdir/sequence/vector/data不存在。java.io.filenotfoundexception:文件file:/home/shshaikh/clusterworkdir/sequence/vector/data不存在。位于org.apache.hadoop.fs.rawlocalfilesystem.getfilestatus(rawlocalfilesystem)。java:402)在org.apache.hadoop.fs.filterfilesystem.getfilestatus(filterfilesystem。java:255)位于org.apache.hadoop.mapreduce.lib.input.sequencefileinputformat.liststatus(sequencefileinputformat)。java:63)在org.apache.hadoop.mapreduce.lib.input.fileinputformat.getsplits(fileinputformat)。java:252)在org.apache.hadoop.mapred.jobclient.writenewsplits(jobclient。java:1054)在org.apache.hadoop.mapred.jobclient.writeslits(jobclient。java:1071)访问org.apache.hadoop.mapred.jobclient.access$700(jobclient。java:179)在org.apache.hadoop.mapred.jobclient$2.run(jobclient。java:983)在org.apache.hadoop.mapred.jobclient$2.run(jobclient。java:936)位于javax.security.auth.subject.doas(subject)的java.security.accesscontroller.doprivileged(本机方法)。java:416)在org.apache.hadoop.security.usergroupinformation.doas(usergroupinformation。java:1190)在org.apache.hadoop.mapred.jobclient.submitjobinternal(jobclient。java:936)在org.apache.hadoop.mapreduce.job.submit(作业。java:550)在org.apache.hadoop.mapreduce.job.waitforcompletion(作业。java:580)在org.apache.mahout.vectorizer.documentprocessor.tokenizedocuments(documentprocessor。java:93)在org.apache.mahout.vectorizer.sparsevectorsfromsequencefiles.run(sparsevectorsfromsequencefiles。java:257)在org.apache.hadoop.util.toolrunner.run(toolrunner。java:65)在com.hello.mahout.myzfuzzykmeans.vectorize(myzfuzzykmeans。java:100)在com.hello.mahout.myzfuzzykmeans.main(myzfuzzykmeans。java:55)在sun.reflect.nativemethodaccessorimpl.invoke0(本机方法)位于sun.reflect.nativemethodaccessorimpl.invoke(nativemethodaccessorimpl)。java:57)在sun.reflect.delegatingmethodaccessorimpl.invoke(delegatingmethodaccessorimpl。java:43)在java.lang.reflect.method.invoke(方法。java:616)在org.codehaus.mojo.exec.execjavamojo$1.run(execjavamojo。java:293) 在java.lang.thread.run(线程。java:679)
块引用
我已经创建了vector dir,程序删除了dir,但是失败了,出现了异常filenotfound。
你能帮我解决这个问题吗。
谢谢:)
1条答案
按热度按时间7dl7o3gd1#
默认情况下,mahout在分布式文件系统上运行,而不是在本地文件系统上运行。因此,当您运行mahout命令时,hadoop将尝试在hdfs上而不是本地上查找文件。因此,您应该做以下工作:
cd到mahout/bin目录
vi管理员
找到行“#mahoutŠu local=true;”并将其改为“mahout\u local=true;”
震源操纵员
那它现在应该可以在本地工作了。