mapreduce:如何连接2个表:r(a,b)x s(c,d),其中b< c

dsekswqp  于 2021-05-29  发布在  Hadoop
关注(0)|答案(0)|浏览(201)

在每个记录中,你都有

Table_name(R/S) | attribute_1(a/c) | attribute_2(b/d)
.
.
.

例如,这可以是输入文件的内容:

R|$a_1$|$b_1$
R|$a_2$|$b_2$
S|$c_1$|$d_1$
R|$a_3$|$b_3$
S|$c_2$|$d_2$

输出为以下行:

$a_i$|$b_i$|$c_j$|$d_j$

,其中$b\u i<c\u j$
(这是《海量数据集的挖掘》一书中的一个练习。在这个链接的第22页:http://infolab.stanford.edu/~ullman/mmds/ch2.pdf (练习2.3.5)。这本书免费提供)
我花了半天时间在网上看了看,还是不知道怎么解决。。。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题