在mahout谱聚类中,亲和矩阵中的对角元素值应该是多少

yeotifhr  于 2021-05-30  发布在  Hadoop
关注(0)|答案(1)|浏览(442)

正如标题所述,这里是指向光谱聚类文档的链接
第一步是提取数据点的相似度矩阵。当它说相似性矩阵时,我假设相同实体(用户、文档等)之间的相似性应该是1(而距离矩阵是0)。
但在他们的例子中,他们为相同的实体分配了0分:
0,0 0
1,1 0
我有点困惑。以前从事光谱聚类的人能帮帮我吗。。
p、 s:我有自己的方法来计算相似度分数,所以我不想使用任何内置的mahout函数。
提前谢谢。。

jogvjijk

jogvjijk1#

我认为我们应该把相似矩阵看作是图论中邻接矩阵的一个扩展:如果两个节点相邻,则为1;如果两个节点不相邻,则为0。在您的例子中,所有的节点都是相邻的,您通过一个相似性矩阵来考虑这个相邻矩阵,以编码关于“有多少两个观测值是相邻的?”。
因为我们不认为一个节点与自身相邻,除非它与自身有连接,所以邻接矩阵的对角线被设置为0。

相关问题