rhadoop键

jjjwad0x  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(374)

当钥匙有多个部件时,我在尝试获取keyval对时卡住了。
假设所有键都包含3个字符串组件,例如:{“i”“like”“lucy”},或{“you”“hate”“jimmy”}。
这三个字符串的组合将是唯一键。对于mapreduce结果,我想要的是{“i”“like”“lucy”}或{“you”“hate”“jimmy”}的记录数。
问题是我应该用什么样的结构作为3个字符串的键?
如果我使用列表作为键:

LST1<-list(who="I", how="like", whom="Lucy")
LST2<-list(who="I", how="like", whom="Lucy")

lst1和lst2应该具有相同的键值,但问题是它们是不同的对象,因此列表结构不能用作键。
如果我使用向量作为键:

v1<-c("I","like","lucy")
v2<-c("I","like","Jimmy")

r将要做的是比较相同位置的每个条目,并返回一个布尔值向量,在本例中为{true,true,false}。
有什么建议吗?我可以使用什么样的结构?或者有什么棘手的方法来处理这个问题吗?
我知道我可以用java处理这个问题,但我需要一个用r的解决方案。而3个字符串的情况只是一个例子,组件可以是数字,字符串,字符等任何东西。

mfpqipee

mfpqipee1#

将字符串向量连接到一个新字符串并将其用作键如何?
例如,

v1<-c("I","like","lucy")
v2<-c("I","like","Jimmy")
s1 <- paste(v1, sep = " ")
s2 <- paste(v2, sep = " ")

相关问题