我使用R。我有两个数据库db1和db2。db1有两个字段:person和Date_A,其中person是一个字符变量,而Date_A是一个日期变量。每个人被分配给一个日期。db2也有两个变量,person和Date_B。有些人同时出现在两个数据库中,而另一些人只出现在Db1中。我需要找到一个在两个数据库中都能找到的人的列表,使得date_A比date_B老。在R中,最好的方法是什么?
vltsax251#
您可以使用以下逻辑,dplyr函数:
dplyr
df1 <- data.frame(person = c(letters[1:10]), date = sample(1:50,10)) df2 <- data.frame(person = c(letters[6:15]), date = sample(1:50,10)) df3 <- inner_join(df1, df2, by = "person") %>% mutate(date = ifelse(date.x < date.y, date.x, NA)) %>% filter(!is.na(date) == TRUE) %>% select(person, date)
1条答案
按热度按时间vltsax251#
您可以使用以下逻辑,
dplyr
函数: