scipy 样本含多个零点时置信区间的计算

dz6r00yl  于 2022-11-10  发布在  其他
关注(0)|答案(1)|浏览(148)

我试图计算样本输出的置信区间,但每个用户的样本输出可能为0 - 50,但当我使用以下公式计算置信区间时,它给出了一个具有低值的CI,是否有方法对此进行归一化,或者这是否是正确的CI?
我无法粘贴列表,因为它有250 K个值

import scipy.stats as st
st.norm.interval(confidence=0.95, loc=np.mean(x), scale=st.sem(x))

**(0.02455443693126938, 0.026450854074021625)**
h43kikqp

h43kikqp1#

置信区间应基于样本的标准差而不是标准误差。您的结果变化很大。检查差异:

import scipy.stats as st
from scipy.stats import norm
r = norm.rvs(loc=25, scale=12, size=1000)
import numpy as np

使用平均值的标准误差:

st.norm.interval(confidence=0.95, loc=np.mean(r), scale=st.sem(r))

输出量:

(23.894125988443633, 25.37912976058209)

使用标准偏差:

st.norm.interval(confidence=0.95, loc=np.mean(r), scale=np.std(r))

输出量:

(1.1683995271163887, 48.10485622190933)

相关问题