R语言 在ggplot2中的堆叠条形图上显示数据值

fzsnzjdm  于 2023-04-09  发布在  其他
关注(0)|答案(4)|浏览(233)

我想在ggplot 2中的堆叠条形图上显示数据值。

library(ggplot2)

Data <- data.frame(
  Year = c(rep(c("2006-07", "2007-08", "2008-09", "2009-10"), each = 4)),
  Category = c(rep(c("A", "B", "C", "D"), times = 4)),
  Frequency = c(168, 259, 226, 340, 216, 431, 319, 368, 423, 645, 234, 685, 166, 467, 274, 251)
)

ggplot(Data, aes(Year, Frequency, fill = Category)) +
  geom_col() +
  geom_text(aes(label = Frequency), size = 3, hjust = 0.5, vjust = 3, position = "stack")

创建于2023-04-07带有reprex v2.0.2
我想在每个部分的中间显示这些数据值。在这方面的任何帮助将不胜感激。谢谢

sg2wtvxw

sg2wtvxw1#

ggplot 2.2.0标签可以很容易地堆叠使用position = position_stack(vjust = 0.5)geom_text

ggplot(Data, aes(x = Year, y = Frequency, fill = Category, label = Frequency)) +
  geom_bar(stat = "identity") +
  geom_text(size = 3, position = position_stack(vjust = 0.5))

还要注意“position_stack()position_fill()现在以分组的相反顺序堆叠值,这使得默认堆叠顺序与图例匹配。”
答案适用于旧版本的ggplot
这里有一种方法,它计算条形图的中点。

library(ggplot2)
library(plyr)

# calculate midpoints of bars (simplified using comment by @DWin)
Data <- ddply(Data, .(Year), 
   transform, pos = cumsum(Frequency) - (0.5 * Frequency)
)

# library(dplyr) ## If using dplyr... 
# Data <- group_by(Data,Year) %>%
#    mutate(pos = cumsum(Frequency) - (0.5 * Frequency))

# plot bars and add text
p <- ggplot(Data, aes(x = Year, y = Frequency)) +
     geom_bar(aes(fill = Category), stat="identity") +
     geom_text(aes(label = Frequency, y = pos), size = 3)

disho6za

disho6za2#

正如hadley提到的,有比堆叠条形图中的标签更有效的方式来传达你的信息。事实上,堆叠图表不是很有效,因为条形图(每个类别)不共享一个轴,所以很难比较。
在这些情况下,使用两个图共享一个轴通常更好。在您的示例中,我假设您希望显示总体总额,然后显示给定年份中每个类别的贡献比例。

library(grid)
library(gridExtra)
library(plyr)

# create a new column with proportions
prop <- function(x) x/sum(x)
Data <- ddply(Data,"Year",transform,Share=prop(Frequency))

# create the component graphics
totals <- ggplot(Data,aes(Year,Frequency)) + geom_bar(fill="darkseagreen",stat="identity") + 
  xlab("") + labs(title = "Frequency totals in given Year")
proportion <- ggplot(Data, aes(x=Year,y=Share, group=Category, colour=Category)) 
+ geom_line() + scale_y_continuous(label=percent_format())+ theme(legend.position = "bottom") + 
  labs(title = "Proportion of total Frequency accounted by each Category in given Year")

# bring them together
grid.arrange(totals,proportion)

这将给予你一个像这样的2面板显示:

如果要添加频率值,表格是最佳格式。

zyfwsgd6

zyfwsgd63#

如@Ramnath由@Henrik编辑的答案所示,通过向position_stack()vjust参数传递参数,可以调整标签的相对位置,这对于居中的标签非常有效。在问题本身中,@MYaseen208展示了如何使用垂直对齐来移动标签的位置。在R中,对齐是相对于文本标签的边界框,这可能导致标签的位置略有不同,具体取决于标签中的字符(具有像'g'或没有像'a'这样的下行符),或者当文本的大小或图形设备发生变化时。根据情况,这可能是优点或缺点。
在这里,我提供了一个在某些情况下可能更可取的替代答案,一个以数据为单位定位从原始位置向下移动一个恒定距离的文本标签的例子。这相当于组合position_stack()position_nudge(),并且可以通过包'ggpp'中的position_stacknudge()来实现。

Year <- 
  c(rep(c("2006-07", "2007-08", "2008-09", "2009-10"), each = 4))
Category <- 
  c(rep(c("A", "B", "C", "D"), times = 4))
Frequency <- 
  c(168, 259, 226, 340, 216, 431, 319, 368, 423, 645, 234, 685, 166, 467, 274, 251)
Data <- data.frame(Year, Category, Frequency)

library(ggplot2)
library(ggpp)

ggplot(Data, aes(x = Year, y = Frequency, fill = Category, label = Frequency)) +
  geom_bar(stat = "identity") +
  geom_text(size = 3, position = position_stacknudge(y = -60))

创建于2022-09-03使用reprex v2.0.2

xiozqbni

xiozqbni4#

为了完整起见,这里使用ggalluvial::stat_stratum的解决方案。

library(ggalluvial)

ggplot(Data, aes(x = Year, y = Frequency, fill = Category, label = Frequency)) +
  geom_col() +
  geom_text(stat = "stratum", aes(stratum = Category))

相关问题