我希望在scala应用程序中读取并MapHDFS中的txt文件中的数据。我目前可以使用以下代码将其读取为'Array[(String,Int)]'格式:
val text = sc.textFile(path)
val count = text.flatMap(line => line.split(" ")).map(word => (word,1)).reduceByKey(_+_)
val mapped = count.collect
然而,我的代码的其余部分需要一个“Map[String,Int]”类型的值。
大多数网上的建议似乎假设数组还没有被Map,但是我只是想把它转换成预期的类型。对于任何遗漏的细节或糟糕的格式表示歉意,这是我第一次在这里发帖。
1条答案
按热度按时间omqzjyyz1#
下面是操场对已经在评论中的方案:
https://scastie.scala-lang.org/ecfUdzRLTsaUJ2v9Fy2WYg