我是SparkScala的新手,尝试解决简单的字数计算(使用多个属性作为键)。我能得到一些信息吗?我有一个rdd(string,string,long),比如(a,b,1)(a,c,1)(a,c,1)(b,b,1)(b,b,1)期望的结果是rdd(a,b,1)(a,c,2)(b,b,2)
vsikbqxv1#
尝试:
rdd.map { case (x, y, c) => ((x, y), c) }.reduceByKey(_ + _)
1条答案
按热度按时间vsikbqxv1#
尝试: