R语言零膨胀负二项分布函数NaN预警

p1tboqfb 于 2023-01-22 发布在其他

关注(0)|答案(2)|浏览(332)

我试图将我的数据拟合到零膨胀负二项模型中，但当在汇总函数中计算SE时，我的3个自变量之一（暴露）似乎导致生成NaN（请参见zeroinfl调用的最后部分）。我还尝试运行负二项障碍模型，但遇到了类似的问题。

str(eggTreat)
'data.frame':   455 obs. of  4 variables:
 $ Exposure : Factor w/ 2 levels "C","E": 2 2 2 2 2 2 2 2 2 2 ...
 $ hi_lo    : Factor w/ 2 levels "hi","lo": 2 2 2 2 2 2 2 2 2 2 ...
 $ Egg_count: int  0 0 0 0 0 0 0 0 0 0 ...
 $ Food     : Factor w/ 2 levels "1.5A5YS","5ASMQ": 2 2 2 2 2 2 2 2 2 2 ...

mod.zeroinfl <- zeroinfl(Egg_count ~ Food+Exposure+hi_lo | Food+Exposure+hi_lo, data=eggTreat,
+                          dist="negbin")
> summary(mod.zeroinfl)

Call:
zeroinfl(formula = Egg_count ~ Food + Exposure + hi_lo | Food + Exposure + hi_lo, data = eggTreat, dist = "negbin")

Pearson residuals:
     Min       1Q   Median       3Q      Max 
-0.65632 -0.47163 -0.28588  0.02976  9.00804 

Count model coefficients (negbin with log link):
            Estimate Std. Error z value Pr(>|z|)    
(Intercept) -0.04435    0.14393  -0.308   0.7580    
Food        -1.12486    0.22267  -5.052 4.38e-07 ***
Exposure    -2.34990    0.38684  -6.075 1.24e-09 ***
hi_lo       -0.44893    0.19524  -2.299   0.0215 *  
Log(theta)  -0.24387    0.22639  -1.077   0.2814    

Zero-inflation model coefficients (binomial with logit link):
              Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.830e+01         NA      NA       NA
Food        -5.768e+00  5.628e+04       0        1
Exposure     4.612e-01         NA      NA       NA
hi_lo       -7.477e+00  9.963e+05       0        1
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Theta = 0.7836 
Number of iterations in BFGS optimization: 21 
Log-likelihood: -350.2 on 9 Df
Warning message:
In sqrt(diag(object$vcov)) : NaNs produced

function (object, ...) 
{
  object$residuals <- residuals(object, type = "pearson")
  kc <- length(object$coefficients$count)
  kz <- length(object$coefficients$zero)
  se <- sqrt(diag(object$vcov))

来源：https://stackoverflow.com/questions/62402458/zero-inflated-negative-binomial-distribution-function-nan-warning

2条答案

按热度按时间

bjp0bcyl1#

该问题通常由 * 完全分离 * 引起;使用这个搜索项，或者搜索 * 哈克-唐纳 * 效应，会发现问题在于预测值的某种线性组合完美地将零和非零分开（由于零通胀中的预测变量都是分类的，这就转化为所有值都是零或非零的分类组合）。
我将看一下with(eggTreat, table(eggcount>0, Food, Exposure, hi_lo))（以任何使表最容易阅读的顺序排列参数）。
典型症状包括：

参数的大值（例如|beta|>10）;在这种情况下，截距为-18.3，这给出了基线类别中1e-8的预测零通胀概率（其他两个值也很大，但没有截距那么极端）
极大的标准误差（Food、hi_lo），导致z值实际为零，p值实际为1
或者你看到的NA值

对于这个问题有多种解决方案：

不同形式的 * 正则化 * 或贝叶斯先验
使用模型比较/似然比检验计算p值

Zero-inflation model coefficients (binomial with logit link):
              Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.830e+01         NA      NA       NA
Food        -5.768e+00  5.628e+04       0        1
Exposure     4.612e-01         NA      NA       NA
hi_lo       -7.477e+00  9.963e+05       0        1

赞(0）回复(0）举报 2023-01-22

hs1ihplo2#

类似问题的答案已经发布在这里CrossValidated-NA-ZINB，但我发现有用的是重新缩放我的变量：例如，我有一个村庄的森林公顷数 num_hec，范围为[0，100000]，并在数百平方公里（除以10，000）num_hec_100sqkm 的范围内构建了一个新变量，范围为[0，10]，当使用后者时，标准误差、z值和Pr（〉|z|）变成了实际数字

赞(0）回复(0）举报 2023-01-22

我来回答

R语言零膨胀负二项分布函数NaN预警

2条答案

相关问题

热门标签

最新问答

R语言 零膨胀负二项分布函数NaN预警

2条答案

相关问题

热门标签

最新问答

R语言零膨胀负二项分布函数NaN预警