我已经确定,在对我的数据进行单因素方差分析之后,最适用的事后统计分析是Dunnett检验。我过去曾使用R进行过这项工作,但由于我使用的自动化工作流(大数据量的自动分析)包,我现在只能使用python。
我发现有几个软件包(例如sci-kit、tukeyHSD)提供了多种不同的事后检验,但它们都不包括Dunnett检验。例如,我可以在scipy中轻松执行单向ANOVA:
import scipy.stats as stats
# Made up data
a = [10, 12, 10, 14, 18] # Control
b = [15, 14, 18, 10, 38]
c = [20, 22, 23, 34, 20]
d = [50, 48, 42, 51, 51]
stats.f_oneway(a, b, c, d)
> F_onewayResult(statistic=26.92639734366354, pvalue=1.7207487532445122e-06)
然而,我希望在此之后进行多重比较分析,与具有正态分布数据的单个对照组进行比较(n~1000)。我知道Rpy 2,但我希望在不使用Docker的机器上执行此操作。对有能力的软件包有什么建议吗?
(我也是一个生物学家,有相当基本的脚本知识,所以很有可能我在这里错过了一些基本的东西)
2条答案
按热度按时间wqsoz72f1#
看起来它正在朝着好的方向发展,团队@ statmodels(https://github.com/statsmodels/statsmodels/issues/852),同时我们必须使用R或用几年前发布的表格进行数学运算。
tjvv9vkg2#
我们刚刚把它引入到SciPy中,它将在SciPy 1.11中提供:
scipy.stats.dunnett
您可以在这里查看开发文档:https://scipy.github.io/devdocs/reference/generated/scipy.stats.dunnett.html
欢迎任何反馈。(在我写这篇文章的时候,我们正在添加CI和更好的str方法。)