我有这些输入文件
id, feature1, feature2, ... 0, 0, 1, 1, 0, 0, 0, ... 1, 0, 0, 1, 0, 1, 0, ... 2, 1, 0, 0, 0, 0, 0, ... 3, 0, 0, 0, 0, 1, 0, ...
我想得到它的距离矩阵计算hadoop或mahout使用mapreduce作业。但是mahout没有计算距离矩阵的方法。我该怎么办?谢谢你的帮助。
xt0899hw1#
您可以使用mahout自己计算每个记录之间的距离。使用distancemeasure类的distance方法,但必须先将输入文件转换为sequencefile。
1条答案
按热度按时间xt0899hw1#
您可以使用mahout自己计算每个记录之间的距离。使用distancemeasure类的distance方法,但必须先将输入文件转换为sequencefile。