R语言 哪种方法是检验非数值数据之间显著性差异的正确方法?哪种方法是正确的事后检验?

idfiyjo8  于 2022-12-20  发布在  其他
关注(0)|答案(1)|浏览(180)

我使用的非数值数据看起来像这样:
| 来源|超广谱β-内酰胺酶|
| - ------| - ------|
| 医院|超广谱β-内酰胺酶|
| 医院|非ESBL|
| 医院|超广谱β-内酰胺酶|
| 城市|超广谱β-内酰胺酶|
| 医院|非ESBL|
| 城市|超广谱β-内酰胺酶|
| 国家|超广谱β-内酰胺酶|
| 医院|超广谱β-内酰胺酶|
我想比较一下,在来源和变量ESBL之间是否存在统计学关联。
到目前为止,我已经尝试在R中生成列联表:

cont_tab<-table(data$Origin, data$ESBL)

以及独立性的卡方检验

chi_test<-chisq.test(cont_tab)

在此之后,我得到了确实存在独立性:

X-squared = 17.306, df = 2, p-value = 0.0001746

但现在我想知道哪些组合负责该值(ESBL-医院、非ESBL-医院、ESBL-城市等)。
我尝试运行多个Fisher检验:

Library(RVAideMemoire)
multifish<-fisher.multcomp(cont_tab)

但我没有得到我想要的:

ESBL Non-ESBL
  Hospital   46      122
  City       27       21
  Country    56       69

我做错什么了吗?有没有更好的方法?
谢谢!!!

1l5u6lss

1l5u6lss1#

我认为您所显示的"最终结果"实际上是cont_tab。当我运行您的代码时,cont_tab看起来像您所显示的fisher.multicomp的输出结果:

cont_tab <- table(data$Origin, data$ESBL)

cont_tab
#>           
#>            ESBL Non-ESBL
#>   Hospital   46      122
#>   City       27       21
#>   Country    56       69

然而,如果我在cont_tab上运行fisher.multcomp,则会得到:

library(RVAideMemoire)

fisher.multcomp(cont_tab)
#> 
#>         Pairwise comparisons using Fisher's exact test for count data
#> 
#> data:  cont_tab
#> 
#>         Hospital  City
#> City    0.001313     -
#> Country 0.004249 0.234
#> 
#> P value adjustment method: fdr

我们可以在其中看到(正如预期的那样),HospitalCityCountry都有显著差异,但CityCountry之间没有显著差异。
创建于2022年12月13日,使用reprex v2.0.2

    • 根据问题推断的数据**
data <- data.frame(
  ESBL = factor(c(rep(c("ESBL", "Non-ESBL"), times = c(46, 122)),
                  rep(c("ESBL", "Non-ESBL"), times = c(27, 21)),
                  rep(c("ESBL", 'Non-ESBL'), times = c(56, 69)))),
  Origin = factor(rep(c('Hospital', 'City', 'Country'), 
                      times =  c(168, 48, 125)), 
                  c('Hospital', 'City', 'Country')))

相关问题