我使用的非数值数据看起来像这样:
| 来源|超广谱β-内酰胺酶|
| - ------| - ------|
| 医院|超广谱β-内酰胺酶|
| 医院|非ESBL|
| 医院|超广谱β-内酰胺酶|
| 城市|超广谱β-内酰胺酶|
| 医院|非ESBL|
| 城市|超广谱β-内酰胺酶|
| 国家|超广谱β-内酰胺酶|
| 医院|超广谱β-内酰胺酶|
我想比较一下,在来源和变量ESBL之间是否存在统计学关联。
到目前为止,我已经尝试在R中生成列联表:
cont_tab<-table(data$Origin, data$ESBL)
以及独立性的卡方检验
chi_test<-chisq.test(cont_tab)
在此之后,我得到了确实存在独立性:
X-squared = 17.306, df = 2, p-value = 0.0001746
但现在我想知道哪些组合负责该值(ESBL-医院、非ESBL-医院、ESBL-城市等)。
我尝试运行多个Fisher检验:
Library(RVAideMemoire)
multifish<-fisher.multcomp(cont_tab)
但我没有得到我想要的:
ESBL Non-ESBL
Hospital 46 122
City 27 21
Country 56 69
我做错什么了吗?有没有更好的方法?
谢谢!!!
1条答案
按热度按时间1l5u6lss1#
我认为您所显示的"最终结果"实际上是
cont_tab
。当我运行您的代码时,cont_tab
看起来像您所显示的fisher.multicomp
的输出结果:然而,如果我在
cont_tab
上运行fisher.multcomp
,则会得到:我们可以在其中看到(正如预期的那样),
Hospital
与City
和Country
都有显著差异,但City
和Country
之间没有显著差异。创建于2022年12月13日,使用reprex v2.0.2