我试图计算样本输出的置信区间,但每个用户的样本输出可能为0 - 50,但当我使用以下公式计算置信区间时,它给出了一个具有低值的CI,是否有方法对此进行归一化,或者这是否是正确的CI?
我无法粘贴列表,因为它有250 K个值
import scipy.stats as st
st.norm.interval(confidence=0.95, loc=np.mean(x), scale=st.sem(x))
**(0.02455443693126938, 0.026450854074021625)**
1条答案
按热度按时间h43kikqp1#
置信区间应基于样本的标准差而不是标准误差。您的结果变化很大。检查差异:
使用平均值的标准误差:
输出量:
使用标准偏差:
输出量: