我有一个rdd的元组和值列表,看起来像这样。有成千上万种不同的配对。
(A, B), 1
(B, C), 2
(C, D), 1
(A, D), 1
(D, A), 5
我想把元组值对转换成一个对应于元组值对的矩阵。我在spark里没看到什么简单的方法。
+---+------+------+------+------+
| | A | B | C | D |
+---+------+------+------+------+
| A | - | 1 | NULL | 1 |
| B | NULL | - | 2 | NULL |
| C | NULL | | - | 1 |
| D | 5 | NULL | NULL | - |
+---+------+------+------+------+
1条答案
按热度按时间2ledvvac1#
尽最大努力,但无法使用sparksql(您声明的)除去列名。只是以自然的顺序旋转。试试看,添加了额外的元组。
退货: