我的两张table:
帖子.csv-
id
post_type
creationdate
score
viewcount
owneruserid
title
answercount
commentcount
用户.csv-
id
reputation
displayname
loc
age
我知道一些逻辑,我需要分组owneruserid,然后在posts.csv下计算id。
然后将其与user.csv链接,即通过post.csv中的owneruserid和users.csv中的id加入。
请提供一些帮助。
1条答案
按热度按时间rmbxnbpk1#
您已经列出了基于这些步骤的逻辑。请参阅下面的script.load data,join on owneruserid,id然后按owneruserid分组。foreach group生成posts的计数。按降序对最终结果排序并获得最顶层的行。