r和p值

piah890a  于 2023-06-27  发布在  其他
关注(0)|答案(1)|浏览(127)

我创建随机多项式样本(具有相等的概率),并为每个样本计算卡方值和相应的卡值。
重复实验并绘制p值(在我的理解中应该是均匀分布的),我得到了合理的密度图,但一个非常奇怪的直方图。
下面是代码

roulette <- function(n){
  rmultinom(1,n,rep(1/37,37)) |>
    as.vector() |>
    set_names(0:36)
}

roulette_p_wert <- function(n){
  chisq.test(roulette(n))$p.value
}

replicate(100000,roulette_p_wert(200)) ->
  p_vals

hist(p_vals,breaks=100)
plot(density(p_vals))
kq0g1dla

kq0g1dla1#

如果样本数少至200个,则p值只能采用有限数量的值。它们之间的间隙在中间比在边缘更分散,因此在条形图中缺少条形和驼峰的效果。将中断的数量增加到1000可以更清楚地显示发生了什么,值更有可能,但在中间比在边缘更分散。

相关问题