我想通过mahout mapreduce作业获得距离矩阵

wpcxdonn  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(283)

我有这些输入文件

id, feature1, feature2, ...
0, 0, 1, 1, 0, 0, 0, ...
1, 0, 0, 1, 0, 1, 0, ...
2, 1, 0, 0, 0, 0, 0, ...
3, 0, 0, 0, 0, 1, 0, ...

我想得到它的距离矩阵计算hadoop或mahout使用mapreduce作业。但是mahout没有计算距离矩阵的方法。我该怎么办?
谢谢你的帮助。

xt0899hw

xt0899hw1#

您可以使用mahout自己计算每个记录之间的距离。使用distancemeasure类的distance方法,但必须先将输入文件转换为sequencefile。

相关问题