我使用下面的代码来获取分类变量的不同水平的比例的计数和百分比。
table(df$var1)
table(df$var1)%>%
prop.table()
问题是,我的数据集中有50多个分类变量,手动为每个变量做这件事太耗时了。我还得把它记在我的报告里我想知道是否有可能在代码中包含不同的变量,然后输出是一个包含多个分类变量的表,其中包含计数和百分比。就像这个问题中所附的图片一样。Output table
我使用下面的代码来获取分类变量的不同水平的比例的计数和百分比。
table(df$var1)
table(df$var1)%>%
prop.table()
问题是,我的数据集中有50多个分类变量,手动为每个变量做这件事太耗时了。我还得把它记在我的报告里我想知道是否有可能在代码中包含不同的变量,然后输出是一个包含多个分类变量的表,其中包含计数和百分比。就像这个问题中所附的图片一样。Output table
1条答案
按热度按时间9gm1akwq1#
下面是一个使用
dplyr
的例子。您可以使用select()
来选择分类变量,可以通过名称,列号或其中一个整洁的选择函数(例如,matches()
,starts_with()
,ends_with()
,contains()
)来完成。其余的只是计数并将它们变成比例。在代码中,您需要更改的只是输入 Dataframe 和select()
调用中的变量。创建于2023-05-16带有reprex v2.0.2