hadoop自定义java程序

ca1c2owp  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(454)

我有一个简单的java程序putmerge,我正在尝试执行它。我已经做了6个小时了,在网上搜索了很多地方,但是找不到解决办法。基本上,我尝试使用以下命令构建包含所有类库的jar:

javac -classpath *:lib/* -d playground/classes playground/src/PutMerge.java

然后我用以下命令构建jar。

jar -cvf playground/putmerge.jar -C playground/classes/ .

然后我尝试用以下命令执行它:

bin/hadoop jar playground/putmerge.jar org.scd.putmerge "..inputPath.." "..outPath"

..

Exception in thread "main" java.lang.ClassNotFoundException: com.scd.putmerge
        at java.net.URLClassLoader$1.run(URLClassLoader.java:366)
        at java.net.URLClassLoader$1.run(URLClassLoader.java:355)
        at java.security.AccessController.doPrivileged(Native Method)
        at java.net.URLClassLoader.findClass(URLClassLoader.java:354)
        at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
        at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
        at java.lang.Class.forName0(Native Method)
        at java.lang.Class.forName(Class.java:270)
        at org.apache.hadoop.util.RunJar.main(RunJar.java:153)

我尝试了每一种排列/组合来运行这个简单的jar,但是我总是得到一些异常,如上图所示。
我的源代码:

package org.scd.putmerge;

import java.io.IOException;
import java.util.Scanner;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

/**
 * 
 * @author Anup V. Saumithri
 *
 */
public class PutMerge
{
    public static void main(String[] args) throws IOException
        {
        Configuration conf = new Configuration();
        FileSystem hdfs = FileSystem.get(conf); 
        FileSystem local = FileSystem.getLocal(conf);

        Path inputDir = new Path(args[0]);
        Path hdfsFile = new Path(args[1]);

        try
        {
            FileStatus[] inputFiles = local.listStatus(inputDir);
            FSDataOutputStream out = hdfs.create(hdfsFile);

            for(int i=0; i<inputFiles.length; i++)
            {
                System.out.println(inputFiles[i].getPath().getName());
                FSDataInputStream in = local.open(inputFiles[i].getPath());

                byte buffer[] = new byte[256];
                int bytesRead = 0;
                while((bytesRead = in.read(buffer)) > 0)
                {
                    out.write(buffer, 0, bytesRead);
                }
                in.close();
            }
            out.close();
        }
        catch(IOException ex)
        {
            ex.printStackTrace();
        }   
    }
}
mfpqipee

mfpqipee1#

将putmerge类放入jar的方式可能有点不正确。
如果你做了一个 jar tf putmerge.jar ,则必须在代码(即org/scd/putmerge)中的包(org.scd.putmerge)中提到的路径中看到putmerge类。
如果没有,试着做下面的事情来达到这个目的。确保已将putmerge.class复制到org/scd/putmerge/目录中。

jar -cvf playground/putmerge.jar org/scd/putmerge/PutMerge.class

接下来,再次验证 jar tf putmerge.jar 检查是否现在看到 org/scd/putmerge/PutMerge.clas 在输出中输入。
如果一切正常,您可以再次尝试运行hadoop jar。但是看看这些错误,我发现您实际上并没有将putmerge类包含在包中。您应该使用org.scd.putmerge.putmerge。所以,正确的方法应该是--

bin/hadoop jar playground/putmerge.jar org.scd.putmerge.PutMerge "..inputPath.." "..outPath"

相关问题