我有5个不同的数据集,我想摆脱重复的每个数据集。
其中一种方法是在数据集上逐个运行唯一函数,但这是非常低效和耗时的,我尝试了下面的代码,但它没有去除重复。
加载数据集
daily_activites <- read_csv("dailyActivity_merged.csv")
daily_steps <- read_csv("dailySteps_merged.csv")
daily_intensities <- read_csv("dailyIntensities_merged.csv")
daily_calories <- read_csv("dailyCalories_merged.csv")
sleep_day <- read_csv("sleepDay_merged.csv")
包含所有数据集名称的变量
dataset_names <- c("daily_activities", "daily_steps", "daily_intensities", "daily_calories", "sleep_day")
删除重复项
for (i in 1:length(dataset_names)) {
dataset_names[i] <- unique(dataset_names[i])
}
1条答案
按热度按时间l7wslrjt1#
您可以使用
mget(dataset_names)
将所需的所有 Dataframe 放入一个列表中,通过lapply()
将unique()
应用于每个 Dataframe ,并通过list2env()
将数据覆盖到工作区中。