scipy 样本含多个零点时置信区间的计算

dz6r00yl 于 2022-11-10 发布在其他

关注(0)|答案(1)|浏览(148)

我试图计算样本输出的置信区间，但每个用户的样本输出可能为0 - 50，但当我使用以下公式计算置信区间时，它给出了一个具有低值的CI，是否有方法对此进行归一化，或者这是否是正确的CI？
我无法粘贴列表，因为它有250 K个值

import scipy.stats as st
st.norm.interval(confidence=0.95, loc=np.mean(x), scale=st.sem(x))

**(0.02455443693126938, 0.026450854074021625)**

1条答案

置信区间应基于样本的标准差而不是标准误差。您的结果变化很大。检查差异：

import scipy.stats as st
from scipy.stats import norm
r = norm.rvs(loc=25, scale=12, size=1000)
import numpy as np

使用平均值的标准误差：

st.norm.interval(confidence=0.95, loc=np.mean(r), scale=st.sem(r))

输出量：

(23.894125988443633, 25.37912976058209)

使用标准偏差：

st.norm.interval(confidence=0.95, loc=np.mean(r), scale=np.std(r))

输出量：

(1.1683995271163887, 48.10485622190933)