此问题来自交叉验证的migrated,因为它可以在3天前的Stack Overflow.Migrated上回答。
我想减少我的 Dataframe ,以便我可以确定检查表是否有存在值(即X)而不是数字。当前 Dataframe 中的每一行对应于一个观察结果以及与该观察结果相关的鸟类数量,每个检查表都有多个观察结果。
我创建了一个示例来说明当前 Dataframe 的外观(original_df
)以及我希望 Dataframe 的外观(goal_df
)。
checklist_id <- c(1,1,2,2,2,3,3,3,3)
obs_id <- c("obs1", "obs2", "obs3", "obs4", "obs5", "obs6", "obs7", "obs8", "obs9")
how_many_birds <- c('7','8','X','2','3','1','6','8','X')
original_df <- data.frame(checklist_id, obs_id, how_many_birds)
# checklist_id obs_id how_many_birds
# 1 1 obs1 7
# 2 1 obs2 8
# 3 2 obs3 X
# 4 2 obs4 2
# 5 2 obs5 3
# 6 3 obs6 1
# 7 3 obs7 6
# 8 3 obs8 8
# 9 3 obs9 X
checklist_id_goal <- c(1,2,3)
at_least_one_x <- c(0,1,1)
goal_df <- data.frame(checklist_id_goal, at_least_one_x)
# checklist_id_goal at_least_one_x
#1 1 0
#2 2 1
#3 3 1
1条答案
按热度按时间xkrw2x1b1#
您要查找的是filtering join