我对R和编码一般来说是非常陌生的,但希望有人能帮助我,即使这是超级基本的。我有一个很大的数据集,其中包括一个年份列,我想在直方图中使用。问题是,年份是作为日历年提交的(2010/11,2011/12,2012/13等),因此被提取为col_character()/离散数据。是否有简单的方法来修复此列,以避免它是离散数据?我查了一下我不能去工作的fy包,还有一些关于财政年度的其他问题。我还试着把专栏分成“开始年份”和“结束年份”。当时的问题是把它变回一个专栏。
t9aqgxwy1#
一种方法是使用read.delim和适当的参数:
# example df df <- data.frame(year=c("2010/11", "2011/12", "2012/13"), id = 1:3) df$year <- read.delim(text=df$year, sep="/",header=F, col.names = c("from", "to")) df <- as.data.frame(df) # to unnest "year" columns df #> year.from year.to id #> 1 2010 11 1 #> 2 2011 12 2 #> 3 2012 13 3
如果你想转换year.to在整整几年,只需做一些类似的:df$year.to <- df$year.to + ifelse(df$year.to > 70, 1900, 2000)
df$year.to <- df$year.to + ifelse(df$year.to > 70, 1900, 2000)
1条答案
按热度按时间t9aqgxwy1#
一种方法是使用read.delim和适当的参数:
如果你想转换year.to在整整几年,只需做一些类似的:
df$year.to <- df$year.to + ifelse(df$year.to > 70, 1900, 2000)