正如标题所述,这里是指向光谱聚类文档的链接第一步是提取数据点的相似度矩阵。当它说相似性矩阵时,我假设相同实体(用户、文档等)之间的相似性应该是1(而距离矩阵是0)。但在他们的例子中,他们为相同的实体分配了0分:0,0 01,1 0我有点困惑。以前从事光谱聚类的人能帮帮我吗。。p、 s:我有自己的方法来计算相似度分数,所以我不想使用任何内置的mahout函数。提前谢谢。。
jogvjijk1#
我认为我们应该把相似矩阵看作是图论中邻接矩阵的一个扩展:如果两个节点相邻,则为1;如果两个节点不相邻,则为0。在您的例子中,所有的节点都是相邻的,您通过一个相似性矩阵来考虑这个相邻矩阵,以编码关于“有多少两个观测值是相邻的?”。因为我们不认为一个节点与自身相邻,除非它与自身有连接,所以邻接矩阵的对角线被设置为0。
1条答案
按热度按时间jogvjijk1#
我认为我们应该把相似矩阵看作是图论中邻接矩阵的一个扩展:如果两个节点相邻,则为1;如果两个节点不相邻,则为0。在您的例子中,所有的节点都是相邻的,您通过一个相似性矩阵来考虑这个相邻矩阵,以编码关于“有多少两个观测值是相邻的?”。
因为我们不认为一个节点与自身相邻,除非它与自身有连接,所以邻接矩阵的对角线被设置为0。