我创建随机多项式样本(具有相等的概率),并为每个样本计算卡方值和相应的卡值。
重复实验并绘制p值(在我的理解中应该是均匀分布的),我得到了合理的密度图,但一个非常奇怪的直方图。
下面是代码
roulette <- function(n){
rmultinom(1,n,rep(1/37,37)) |>
as.vector() |>
set_names(0:36)
}
roulette_p_wert <- function(n){
chisq.test(roulette(n))$p.value
}
replicate(100000,roulette_p_wert(200)) ->
p_vals
hist(p_vals,breaks=100)
plot(density(p_vals))
1条答案
按热度按时间kq0g1dla1#
如果样本数少至200个,则p值只能采用有限数量的值。它们之间的间隙在中间比在边缘更分散,因此在条形图中缺少条形和驼峰的效果。将中断的数量增加到1000可以更清楚地显示发生了什么,值更有可能,但在中间比在边缘更分散。