R语言 错误/警告“因子中有新水平:NA”

jrcvhitl  于 2023-06-03  发布在  其他
关注(0)|答案(1)|浏览(367)

我正在使用tidymodels方法创建一个随机森林模型。在recipe函数中,我得到了这个错误/警告,我根本无法解释,但它必须与创建的汇总变量相关。错误是

There are new levels in a factor: NA

所以,现在我的食谱参数看起来像这样:

era.af.Al_rec <- recipes::recipe(logRR ~., data = era.af.Al_predict) %>%
  step_mutate_at(logRR, SubPrName, PrName, Product, AEZ16simple, fn = factor) %>%
  update_role(ID, new_role = "ID") %>%
  update_role(RR_group, new_role = "ID") %>%
  step_other(SubPrName, PrName, Product, AEZ16simple, threshold = 0.01) %>%
  step_other(Site.ID, threshold = 0.001) %>%
  step_dummy(all_nominal(), -all_outcomes()) %>%
  step_downsample(logRR)

era.af.Al_prep <- prep(era.af.Al_rec)

juiced <- juice(era.af.Al_prep)

错误在_prep调用中弹出。

ruoxqz4g

ruoxqz4g1#

我有过类似的病例。这是一个warning ejectedstep_dummy(),警告我添加了一个新的因子水平,在本例中,新水平为NA。这来自分类列中的缺失数据。
我可以简单地忽略这个错误,因为这是我想要的;向所述伪编码添加新的NA级别。或者,我可以在step_dummy()之前添加step_unknown()步骤。
step_unknown(all_nominal_predictors(),new_level =“NA”)

相关问题