我真的需要帮助与代码创建一个加权邻接矩阵从一个数据集;有些行包含1或2种成分,但其他行包含更多成分(最多8种)。基于数据集中独特成分的数量,所得到的矩阵可能会超过16 x16。
我的数据目前看起来像下面的例子(但有不同的信息)。对于该网络分析的目的而言,成分出现在哪一列并不重要,但同现和权重很重要。
| name1| name2| name3|名称4|名称5|名称6|名称7|名称8|
| --|--|--|--|--|--|--|--|
| 菠萝|糖|芒果|水|盐|蓝莓|||
| 菠萝|ASCA|||||||
| 糖|菠萝|水|石灰|||||
| 石灰|ASCA|胡椒|盐|水||||
| 蓝莓|菠萝|水|盐|草莓|香蕉|ASCA|糖|
| 芒果||||||||
我如何编写代码,以便它可以找到所有列中的所有同现/边,而不仅仅是前两列?这是我在尝试用R直接从这些数据中得到邻接矩阵时遇到的一个问题。我还需要保留节点(成分)的名称,这样当我创建网络图时,名称将显示出来,而不是数字,这是我遇到的另一个问题。
我有坚实的代码,从邻接矩阵为这个新项目创建网络图,但以前我手动计算样本集的加权邻接矩阵,因为我的截止日期很紧。
2条答案
按热度按时间qojgxg4l1#
我猜你可以创建一个关联矩阵
或邻接矩阵
jucafojl2#
如果需要逐行事件,您可以通过@ThomsIsCoding修改答案:
如果需要,将主对角线设置为
0
。数据类型: