我正在使用两个Excel工作表。这是我的代码:
# Read the first dataset
df1 <- read.csv("ATLweather.csv")
# Read the second dataset
df2 <- read.csv("electricityprices.csv")
# Merge the datasets
library("dplyr")
merged_df <- left_join(df1, df2, by = "Timestamp")
head(merged_df)
library(writexl)
# Save the merged data frame as an Excel file
write_xlsx(merged_df, path = "C:/Users/Nathaniel/Documents/newfile.xlsx")
这成功地合并了数据集,但是将“cost”列中的所有数据替换为“NA”(如下图所示,在我的环境中)。
这是我第一次做任何编码,所以我不知道如何解决这个问题。我做错了什么?
1条答案
按热度按时间dced5bon1#
正如@Claudio所指出的,
Timestamp
向量是格式不同的字符向量(你可以通过截图中的“chr”来判断它们是字符). R不知道字符应该被解释为日期.你可以将它们都改为日期对象,并以这种方式合并它们,但一种简单的方法是将一种格式转换为另一种格式,并将它们保留为字符(有时在R中玩日期是比它的价值更多的工作,但是如果你想把它们作为日期来玩,请参见包lubridate
)。下面是一个快速解决方案:
然后只需将此处的
Timestamp
更改为df2$Timestamp
即可。