从其他两极的答案来看,似乎大多数事情都可以在一个单一的链条中完成。下面的例子有可能吗?有没有可能简化?
import polars as pl
scores = pl.DataFrame({
'zone': ['North', 'North', 'North', 'South', 'East', 'East', 'East', 'East'],
'score': [78, 39, 76, 56, 67, 89, 100, 55]
})
cnt = scores.groupby("zone").count()
cnt.with_column(
(100 * pl.col("count") / pl.col("count").sum())
.round(2)
.cast(str)
.str.replace("$", "%")
.alias("perc")
)
1条答案
按热度按时间eit6fx6z1#
刚问完这个问题就注意到下面的帖子。请根据需要随时关闭。
Best way to get percentage counts in Polars