我想制作一个箱形图,其中野值离群值标记为唯一图标,如星号#8。“野值离群值”定义为大于数据集Q3 + 3 * IQR或小于Q1 - 3 * IQR的单个点。
我已经看到了一些人的答案,他们想用自己的值来标记他们的离群值(例如Labeling Outliers of Boxplots in R),geom_boxplot()内置了一种方法来修改所有离群值的样式,但我还没有找到任何方法来修改一些离群点。
对于这个MRE,我希望能够有这些野生离群值为8缸标有星号,而其他离群值是用通常的填充点标记。
library(ggplot2)
ggplot(data = mtcars,aes(x=cyl,y=drat,group=cyl))+
geom_boxplot()
以下是获取“外部围栏”的方法,超出该围栏的点将被视为野值异常值:
mtcars%>%group_by(cyl)%>%summarize(lf=quantile(drat,probs=.25)-3*IQR(drat),uf=quantile(drat,probs=.75)+3*IQR(drat))
谢谢大家!
1条答案
按热度按时间d7v8vwbk1#
一种选择是创建两个包含野生值和其他离群值的单独 Dataframe ,并通过两个
geom_point
将其添加到箱线图中。