我根据我找到的一种方法编写了测试。当我在Stack Overflow中查看时,我看到了另一种方法(can be seen here),它稍微复杂一点,这让我怀疑我是否选择了正确的方法。
我正在寻找方法来检查我的计算是否正确。
下面是相关代码:
from scipy.stats import chi2_contingency
import pandas as p
...
# Example data
data[['Eczema', 'Gender']]
Eczema Gender
1 Healthy 0
4 Healthy 1
5 Healthy 0
6 Healthy 1
8 Healthy 1
.. ... ...
601 Healthy 0
603 Healthy 0
604 Healthy 1
606 Diseased 1
607 Healthy 1
# The contingency table:
p.crosstab(data['Eczema'], data['Gender'])
Gender 0 1
Eczema
Diseased 5 11
Healthy 219 233
# The calculation:
chi2, p, dof, ex = chi2_contingency(p.crosstab(data['Eczema'], data['Gender']))
p
0.27176974714995455
欢迎您提出任何建议。谢谢!
1条答案
按热度按时间46qrfjad1#
你链接到的另一个方法实际上并不是一个不同的方法。那个问题中的代码试图做与
chi2_contingency
中相同的计算,但是它有一些错误。你的代码看起来很好。p值为0.27,可以说数据不支持拒绝 * 湿疹 * 和 * 性别 * 之间没有关联的零假设。